Review Komprehensif, Studi Kasus Ujian, dan Kisi-Kisi Penilaian
UAS dirancang untuk menguji penguasaan materi secara menyeluruh (Sessi 1 hingga 15) dan kemampuan mahasiswa/i dalam menerapkan seluruh pipeline Data Science secara mandiri dan interpretatif. UAS akan berfokus pada penalaran matematis dan interpretasi ilmiah dari hasil pemodelan.
Format Ujian:
Poin Kunci: UAS akan menguji pemahaman Anda tentang 5V Big Data dan cara mengatasi tantangan Variety dan Veracity di tahap awal. Pastikan Anda mahir dalam Data Wrangling.
Poin Kunci: Kemampuan menginterpretasikan hasil statistik dan visualisasi adalah inti dari sesi ini.
Poin Kunci: Fokus pada interpretasi parameter dan metrik evaluasi model.
Anda diberikan dataset hasil eksperimen yang mengukur Yield (hasil panen kontinu) berdasarkan tiga variabel input: Suhu (T), Intensitas Cahaya (I), dan Kelembaban (H).
Tugas Praktikum (Mandiri):
Pertanyaan Analisis (Teori):
Jika koefisien βT = 0.8 dan koefisien βH = −0.2, jelaskan implikasi ilmiah dari kedua koefisien tersebut terhadap Yield, dengan asumsi variabel lain konstan (ceteris paribus).
Anda menggunakan dataset medis (e.g., Breast Cancer dari UCI) untuk mengklasifikasikan apakah seorang pasien memiliki penyakit (label 1) atau tidak (label 0). Anda menggunakan Regresi Logistik dan mendapatkan hasil Confusion Matrix sebagai berikut: TP=90, TN=180, FP=10, FN=20.
Pertanyaan Analisis (Teori):
Tugas Praktikum (Mandiri):
Lakukan One-Hot Encoding untuk fitur kategorikal pada dataset ini sebelum memodelkannya dengan Decision Tree. Hitung Akurasi dan tampilkan Feature Importance dari model yang dihasilkan.
1. Konsep Dasar & Preprocessing (Sessi 1-4):
Mampu menjelaskan 5V. Mampu mengimplementasikan imputasi data hilang. Mampu membedakan dan menerapkan Normalisasi vs. Standardisasi (Z-Score) pada data numerik.
2. EDA & Statistik (Sessi 5-6):
Mampu menghitung dan menginterpretasikan korelasi (r). Mampu memilih visualisasi yang tepat (Scatter/Box Plot) untuk menyajikan temuan data.
3. Pemodelan Dasar (Sessi 7, 9, 10):
Mampu melakukan Train-Test Split. Mampu membangun Regresi Linear dan Regresi Logistik. Mampu menginterpretasikan koefisien Regresi Linear (βi).
4. Evaluasi Model (Sessi 11):
Wajib memahami dan mampu menghitung Presisi, Recall, Akurasi, dan F1-Score dari Confusion Matrix, serta menentukan prioritas metrik berdasarkan kasus nyata.
5. Pemodelan Lanjut & Teks (Sessi 12, 13):
Mampu menjelaskan logika splitting pada Decision Tree. Mampu mengimplementasikan Tokenization dan Bag-of-Words sederhana.
Mata kuliah ini bukan sekadar tentang coding, melainkan tentang mengembangkan kemampuan penalaran induktif dan analisis kuantitatif Anda. Sebagai mahasiswa/i Matematika dan Fisika, Anda telah dibekali dengan fondasi teoritis yang kuat. Data Sains hanyalah perangkat baru untuk menerapkan fondasi tersebut pada skala data yang besar.
Tantangan masa depan adalah bukan hanya menghasilkan model dengan akurasi tinggi, tetapi juga mampu menginterpretasikan secara kausal mengapa model tersebut bekerja dan apa implikasi ilmiah dari koefisien yang dihasilkan. Keahlian ini akan menjadi aset tak ternilai di bidang akademik maupun industri. Selamat menempuh UAS dan sukses selalu!