🎓 Pertemuan 16

Ujian Akhir Semester (UAS): Proyek Akhir Data Sains

Tujuan Ujian

Mahasiswa mampu melakukan analisis data lengkap secara mandiri mulai dari pengumpulan, pembersihan, eksplorasi, visualisasi, hingga pemodelan sederhana dan interpretasi hasil.

Kompetensi yang Dinilai:
Programming Skills

Kemampuan coding Python dan library data science

Data Cleaning

Menangani data kotor dan tidak terstruktur

Data Analysis

Analisis statistik dan eksplorasi data

Data Visualization

Membuat visualisasi informatif dan menarik

Critical Thinking

Interpretasi hasil dan penarikan insight

Machine Learning

Pemodelan sederhana (regresi/klasifikasi)

Rencana Pembelajaran

Konsep UAS

UAS dilakukan dalam bentuk proyek individu yang menilai pemahaman mahasiswa terhadap seluruh tahapan proses data sains.

Mahasiswa diharapkan mampu memilih dataset sendiri, menentukan tujuan analisis, dan menulis kesimpulan yang berbasis bukti dari hasil olahan data.

Ketentuan UAS

Persyaratan Umum:
Dataset

Minimal 1000 baris data dari sumber publik yang kredibel (Kaggle, UCI, data.go.id, dll)

Platform

Menggunakan Google Colab atau Jupyter Notebook

Tools

Python dengan library: pandas, numpy, matplotlib, seaborn, scikit-learn

Format Pengumpulan

File .ipynb dengan nama: UAS_PengantarDataSains_NamaMahasiswa_NPM.ipynb

Submission

Link Google Colab (share dengan akses viewer) + file .ipynb via Google Drive

Komponen Analisis yang Harus Ada

Struktur Notebook UAS:

  • Judul proyek yang menarik dan deskriptif
  • Latar belakang masalah atau topik
  • Tujuan analisis yang jelas dan spesifik
  • Pertanyaan riset (research questions)
  • Sumber dan deskripsi dataset

  • Import dan load dataset
  • Eksplorasi awal (info, shape, dtypes)
  • Identifikasi dan handling missing values
  • Deteksi dan treatment outlier
  • Menghapus duplikasi data
  • Format data yang konsisten
  • Feature engineering (jika diperlukan)

  • Statistik deskriptif lengkap (mean, median, std, dll)
  • Analisis distribusi variabel
  • Analisis korelasi antar variabel
  • Grouping dan agregasi data
  • Identifikasi pola dan trend
  • Analisis per kategori atau segmen

  • Minimal 5 visualisasi berbeda (histogram, scatter, bar, line, box, heatmap, dll)
  • Visualisasi harus informatif dan mudah dipahami
  • Gunakan title, label, dan legend yang jelas
  • Pemilihan warna dan style yang baik
  • Interpretasi setiap visualisasi

  • Pembuatan model sederhana (regresi linear atau klasifikasi)
  • Split data training dan testing
  • Training model
  • Evaluasi model (accuracy, MSE, R², dll)
  • Visualisasi hasil prediksi

  • Rangkuman temuan utama
  • Insight bermakna dari analisis
  • Rekomendasi actionable
  • Limitasi analisis
  • Saran untuk analisis lanjutan

  • Kode rapi dan terstruktur dengan baik
  • Komentar yang jelas pada kode penting
  • Markdown cells untuk penjelasan
  • Tidak ada error saat run all cells
  • Referensi dan sumber yang jelas

Rubrik Penilaian

Komponen Bobot Kriteria Penilaian
Pendahuluan 10% Kejelasan latar belakang, tujuan, dan pertanyaan riset
Data Cleaning 20% Kelengkapan dan ketepatan proses pembersihan data
EDA 25% Kedalaman analisis statistik dan eksplorasi data
Visualisasi 20% Kualitas, variasi, dan interpretasi visualisasi
Kesimpulan 15% Insight bermakna dan rekomendasi actionable
Dokumentasi 10% Kualitas kode, komentar, dan struktur notebook
Bonus ML +10% Implementasi model machine learning sederhana
Total Maksimal 100% (+ 10% bonus)
⚠️ Catatan Penting:
  • Plagiasi akan mendapat nilai 0
  • Dataset yang sama dengan mahasiswa lain diperbolehkan, namun analisis harus berbeda
  • Konsultasi dengan dosen diperbolehkan sebelum deadline

Contoh Proyek UAS

E-Commerce Analytics

Judul: Analisis Pola Pembelian Pelanggan dan Segmentasi Pasar pada Platform E-Commerce

Dataset: E-Commerce Transactions (Kaggle)

Pertanyaan Riset:

  • Produk apa yang paling laris?
  • Bagaimana pola pembelian per kategori?
  • Segmentasi pelanggan berdasarkan behavior?

Teknik: EDA, K-Means Clustering, RFM Analysis

Real Estate Prediction

Judul: Prediksi Harga Rumah Berdasarkan Karakteristik Properti

Dataset: House Prices Dataset

Pertanyaan Riset:

  • Faktor apa yang paling mempengaruhi harga?
  • Bagaimana korelasi luas tanah dengan harga?
  • Akurasi prediksi harga?

Teknik: Correlation Analysis, Linear Regression, Feature Importance

Healthcare Analytics

Judul: Analisis Faktor Risiko Penyakit Jantung

Dataset: Heart Disease UCI

Pertanyaan Riset:

  • Faktor apa yang paling berisiko?
  • Distribusi penyakit per usia?
  • Akurasi prediksi risiko penyakit?

Teknik: EDA, Logistic Regression, Decision Tree

Stock Market Analysis

Judul: Analisis Trend dan Volatilitas Saham Sektor Perbankan

Dataset: Yahoo Finance (BBRI, BMRI, BBCA)

Pertanyaan Riset:

  • Bagaimana trend harga saham?
  • Saham mana yang paling volatile?
  • Korelasi antar saham perbankan?

Teknik: Time Series Analysis, Moving Average, Correlation

Motivasi & Tips Sukses

Raih Nilai Terbaik Anda!

Mulai dari Sekarang

Jangan menunda! Mulai eksplorasi dataset dan rencana analisis dari sekarang. Semakin cepat mulai, semakin banyak waktu untuk iterasi dan perbaikan.

Pilih Topik yang Menarik

Pilih dataset sesuai passion Anda. Ketika Anda tertarik dengan topiknya, analisis akan lebih mendalam dan menyenangkan.

Praktek Coding

Latihan coding setiap hari. Review kembali materi-materi sebelumnya dan coba terapkan teknik-teknik yang sudah dipelajari.

Diskusi & Konsultasi

Jangan ragu bertanya ke dosen atau diskusi dengan teman. Berbagi ide bisa membuka perspektif baru (tapi jangan plagiat!).

Checklist UAS
  • ☑️ Dataset sudah dipilih dan diunduh
  • ☑️ Tujuan analisis sudah jelas
  • ☑️ Data cleaning selesai
  • ☑️ EDA lengkap dengan statistik
  • ☑️ Minimal 5 visualisasi berkualitas
  • ☑️ Kesimpulan dan insight sudah ditulis
  • ☑️ Kode rapi dan terdokumentasi
  • ☑️ File sudah disubmit tepat waktu

💪 Semangat Mengerjakan UAS!

Ini adalah kesempatan Anda untuk menunjukkan semua yang telah dipelajari selama satu semester. Give your best effort!

🎓 Selamat Mengerjakan UAS!

UAS ini menjadi puncak penerapan seluruh kemampuan yang telah dipelajari sepanjang semester.

"Data is the new oil. Those who can analyze it will lead the future."

Anonymous