Sessi 16: Ujian Akhir Semester (UAS)

Review Komprehensif, Studi Kasus Ujian, dan Kisi-Kisi Penilaian

1. Tujuan dan Format UAS

UAS dirancang untuk menguji penguasaan materi secara menyeluruh (Sessi 1 hingga 15) dan kemampuan mahasiswa/i dalam menerapkan seluruh pipeline Data Science secara mandiri dan interpretatif. UAS akan berfokus pada penalaran matematis dan interpretasi ilmiah dari hasil pemodelan.

Format Ujian:

  • Ujian Praktikum (60%): Menerapkan Data Science pipeline pada studi kasus baru (di Google Colab).
  • Ujian Teori/Analisis (40%): Pertanyaan esai/analisis yang menguji pemahaman konsep, rumus, dan interpretasi metrik.

2. Review Total Materi (Sessi 1 - 15)

2.1. Pondasi & Preprocessing (Sessi 1-4)

Poin Kunci: UAS akan menguji pemahaman Anda tentang 5V Big Data dan cara mengatasi tantangan Variety dan Veracity di tahap awal. Pastikan Anda mahir dalam Data Wrangling.

2.2. Analisis & Visualisasi (Sessi 5-7)

Poin Kunci: Kemampuan menginterpretasikan hasil statistik dan visualisasi adalah inti dari sesi ini.

2.3. Pemodelan & Evaluasi (Sessi 9-13)

Poin Kunci: Fokus pada interpretasi parameter dan metrik evaluasi model.

3. Contoh Studi Kasus Ujian (Praktikum & Teori)

Studi Kasus 1: Prediksi Yield Hasil Panen (Regresi)

Anda diberikan dataset hasil eksperimen yang mengukur Yield (hasil panen kontinu) berdasarkan tiga variabel input: Suhu (T), Intensitas Cahaya (I), dan Kelembaban (H).

Tugas Praktikum (Mandiri):

  1. Preprocessing: Lakukan penanganan missing values dan Standardisasi Z-Score pada ketiga fitur input.
  2. Pemodelan: Bangun model Regresi Linear Multivariat untuk memprediksi Yield berdasarkan T, I, dan H.
  3. Evaluasi: Hitung R-squared dan RMSE pada data test.

Pertanyaan Analisis (Teori):

Jika koefisien βT = 0.8 dan koefisien βH = −0.2, jelaskan implikasi ilmiah dari kedua koefisien tersebut terhadap Yield, dengan asumsi variabel lain konstan (ceteris paribus).

Studi Kasus 2: Diagnosis Penyakit (Klasifikasi)

Anda menggunakan dataset medis (e.g., Breast Cancer dari UCI) untuk mengklasifikasikan apakah seorang pasien memiliki penyakit (label 1) atau tidak (label 0). Anda menggunakan Regresi Logistik dan mendapatkan hasil Confusion Matrix sebagai berikut: TP=90, TN=180, FP=10, FN=20.

Pertanyaan Analisis (Teori):

  1. Hitung nilai Presisi dan Recall untuk model di atas.
  2. Dalam konteks diagnosis medis, metrik mana (Presisi atau Recall) yang seharusnya lebih diprioritaskan? Berikan alasan matematis dan ilmiah.

Tugas Praktikum (Mandiri):

Lakukan One-Hot Encoding untuk fitur kategorikal pada dataset ini sebelum memodelkannya dengan Decision Tree. Hitung Akurasi dan tampilkan Feature Importance dari model yang dihasilkan.

4. Kisi-Kisi Ujian Akhir Semester (Wajib Kuasai)

1. Konsep Dasar & Preprocessing (Sessi 1-4):

Mampu menjelaskan 5V. Mampu mengimplementasikan imputasi data hilang. Mampu membedakan dan menerapkan Normalisasi vs. Standardisasi (Z-Score) pada data numerik.

2. EDA & Statistik (Sessi 5-6):

Mampu menghitung dan menginterpretasikan korelasi (r). Mampu memilih visualisasi yang tepat (Scatter/Box Plot) untuk menyajikan temuan data.

3. Pemodelan Dasar (Sessi 7, 9, 10):

Mampu melakukan Train-Test Split. Mampu membangun Regresi Linear dan Regresi Logistik. Mampu menginterpretasikan koefisien Regresi Linear (βi).

4. Evaluasi Model (Sessi 11):

Wajib memahami dan mampu menghitung Presisi, Recall, Akurasi, dan F1-Score dari Confusion Matrix, serta menentukan prioritas metrik berdasarkan kasus nyata.

5. Pemodelan Lanjut & Teks (Sessi 12, 13):

Mampu menjelaskan logika splitting pada Decision Tree. Mampu mengimplementasikan Tokenization dan Bag-of-Words sederhana.

5. Penutup: Data Sains sebagai Fondasi Ilmu Pengetahuan

Mata kuliah ini bukan sekadar tentang coding, melainkan tentang mengembangkan kemampuan penalaran induktif dan analisis kuantitatif Anda. Sebagai mahasiswa/i Matematika dan Fisika, Anda telah dibekali dengan fondasi teoritis yang kuat. Data Sains hanyalah perangkat baru untuk menerapkan fondasi tersebut pada skala data yang besar.

Tantangan masa depan adalah bukan hanya menghasilkan model dengan akurasi tinggi, tetapi juga mampu menginterpretasikan secara kausal mengapa model tersebut bekerja dan apa implikasi ilmiah dari koefisien yang dihasilkan. Keahlian ini akan menjadi aset tak ternilai di bidang akademik maupun industri. Selamat menempuh UAS dan sukses selalu!