Blitar, 25 Juni 2025 — Sebagai bagian dari rangkaian pelatihan data analytic, sesi bertema “Teknik Peningkatan Kinerja Model” sukses dilaksanakan secara daring bagi pelajar sekolah menengah. Sesi ini mengajarkan cara mengevaluasi dan mengoptimalkan performa model pembelajaran mesin (machine learning) agar lebih akurat dan efisien dalam membuat prediksi.
Tujuan Pembelajaran
Peserta ditargetkan untuk:
-
Mengenali kondisi underfit dan overfit pada model
-
Memahami dan menerapkan learning curve
-
Mengenal teknik cross-validation
-
Mampu menangani data yang tidak seimbang (imbalanced data)
Materi Pelatihan
1. Learning Curve
Peserta dikenalkan dengan grafik learning curve yang menunjukkan bagaimana akurasi atau kesalahan model berubah seiring bertambahnya data pelatihan. Dua komponen utama:
-
Training curve: menunjukkan kinerja model terhadap data pelatihan.
-
Validation curve: menunjukkan kinerja model terhadap data uji.
Peserta belajar membedakan tiga kondisi:
-
Good fit: kurva training dan validasi saling mendekati.
-
Overfit: akurasi training tinggi tapi akurasi validasi rendah.
-
Underfit: kedua akurasi rendah, menandakan model belum mampu menangkap pola data.
2. Imbalanced Data
Masalah umum dalam data sains adalah ketidakseimbangan jumlah label (contoh: data “churn” hanya sedikit dibanding “non-churn”). Pelatihan ini membahas dua teknik penanganan:
-
Undersampling: mengurangi data mayoritas agar seimbang.
-
Oversampling: menambah data minoritas secara acak.
Peserta mempraktikkan langsung penggunaan pustaka imblearn
dengan Python untuk kedua teknik tersebut, kemudian membandingkan hasil pemodelan sebelum dan sesudah perbaikan.
Proyek Praktik: Prediksi Pelanggan Churn
Untuk memperkuat pemahaman, peserta diberi proyek membuat model klasifikasi prediksi churn pelanggan. Proyek ini mencakup seluruh proses:
-
EDA (Exploratory Data Analysis): analisis distribusi, statistik, korelasi, outlier, dan missing value.
-
Modelling: pemilihan fitur, pembagian data, pelatihan, evaluasi, serta perbaikan model menggunakan learning curve dan teknik penyeimbangan data.
Gagasan Proyek Lain
Trainer juga memberi inspirasi proyek sederhana lainnya yang relevan untuk pelajar:
-
Prediksi cuaca: “Apakah besok hujan?”
-
Prediksi pemenang: “Film mana yang akan menang penghargaan?”
-
Prediksi siswa terbaik, pelanggan loyal, hingga potensi lagu populer.
Penutup
Pelatihan ini menekankan bahwa membangun model machine learning bukan sekadar tentang membuat prediksi, tetapi juga bagaimana mengevaluasi dan menyempurnakan model agar hasilnya dapat dipercaya. Melalui pendekatan yang interaktif dan aplikatif, pelatihan ini berhasil memperkenalkan teknik data science lanjutan kepada pelajar secara mudah dan menyenangkan.
0 Komentar