REVIEW: 2 JURNAL DALAM PENERAPAN DATA MINING DALAM KLASIFIKASI DAN CLUSTERING
IDENTITAS JURNAL
Jurnal 1:
Jurnal Media Informatika Budi Darma; Vol 7, Nomor 1, Januari 2023, page 464-472; DOI: 10.30865/mib.v7i15499; ISBN (Online): 2548-8368
"Prediksi Volume Sampah di TPSA Banyuurip Menggunakan Metode Backpropagation Neural Network", Wahyu Santoso, Maimunah, Pristi Sukmasetya.
Pendahuluan
Masalah dalam penelitian ini adalah laju peningkatan volume sampah yang tidak seimbang dengan laju program pengurangan sampah dan kapasitas TPSA. Lokasi pembuangan sampah yang ada di perkotaan semakin menipis dan cukup menyulitkan pemerintah dalam pengelolaan sampah. Jika tidak dikelola dengan baik dikhawatirkan akan berdampak negatif kepada lingkungan dan masyarakat sekitar, terutama ketika datangnya musim hujan, serta dapat mengurangi masa umur pemakaian TPSA dalam beberapa tahun kedepan.
Tujuan
Tujuan dari penelitian ini untuk membantu pemerintah dalam menyusun anggaran, persiapan petugas kebersihan dan estimasi daya tampung TPSA di masa mendatang. Selain itu, untuk mengetahui kinerja dari metode backpropagation Artificial Neural Network (ANN) untuk mengetahui pola dalam prediksi volume sampah.
Metodologi Penelitian
Dataset
Dataset yang digunakan adalah data yang bersifat deret waktu (time-series), berupa data volume sampah yang ada di Bayuurip dalam rentang tahun 2019 - 2022. Berisikan nilai-nilai variabel berdasarkan interval waktu harian dan bersifat numerik.
Metode atau Algoritma
Melakukan prediksi (Forecasting) dengan menggunakan metode algoritma backpropagation Artificial Neural Network terhadap volume sampah yang ada di TPSA Banyuurip.
Metode BPNN ini digunakan karena mampu melihat data volume sampah yang bersifat fluktuatif dan tidak linear. Tahapan metodologinya meliputi tahap: Pengumpulan data, pre-processing data dengan sliding windows (Membagi data training dan testing, serta melakukan normalisasi data), pelatihan jaringan (30 neuron input, 7 neuron tersembunyi, 1 output, learning rate 0.01, epoch 1000), dan melakukan evaluasi dengan Mean Squared Error (MSE) . Hasil prediksi yang telah melalui tahapan BPNN (Feedfoward, backpropagation, dan perubahan nilai bobot) kemudian digunakan untuk membandingkan data aktual dari MSE. Intinya adalah hasil MSE digunakan sebagai model untuk prediksi volume sampah di hari berikutnya, serta dihitung melalui persamaan 13.
Hasil Temuan
Penelitian menemukan bahwa metode BPNN efektif untuk memprediksi volume sampah harian. Model terbaik memiliki arsitektur (30 neuron input, 7 hidden neuron, 1 output neuron), dengan epoch 1000 menghasilkan nilai MSE sebesar 0,018870, nilai ini menunjukkan bahwa nilai tersebut memiliki tingkat kesalahan yang sangat kecil.
Validasi
Penulis melakukan valiidasi model dengan cara:
- Membagi data latih (80%) dan data uji (20%)
- Menghitung nilai MSE anatar hasil prediksi dan data aktual pada data uji
- Membandingkan hasil prediksi dan data aktual melalui grafik (Plot), hanya saja terdapat selisih pada data pencilan (outlier) tertentu
Kesimpulan
Hasil prediksi yang ada pada TPSA Banyuurip dengan BPNN didapatkan nilai terbaik 0.018870, dengan rincian parameter input layer berjumlah 30, 1 hidden layer dengan neuron hidden sejumlah 7, dengan 1 output layer yang memiliki epoch sebesar 1000. Hasilnya menunjukkan bahwa volume sampah pada tanggal 2 Januari 2023 mengalami kenaikan sampah tertinggi di bulan Januari.
Kontribusi Atau Signifikasi pada Data Mining
Kontribusinya dalam penelitian ini sangat penting dan bermanfaat untuk pemerintah dalam mengelola sampah di TPSA, terutama dalam pengelolaan sampah. Jika diliat dari konteks data mining, model pendekatan sliding-window dan validasi MSE pada data aktual menunjukkan praktik data preprocessing dan model evaluasi yang dapat dijadikan acuan untuk penelitian terutama dalam bidang forecasting analitycs.
Jurnal 2:
Jurnal Media Informatika Budi Darma; Vol 7, Nomor 1, Januari 2023, page 30-40; DOI: 10.30865/mib.v7i15499; ISBN (Online): 2548-8368
"Penerapan Algoritma C4.5 Untuk Klasifikasi Tren Pelanggaran Kendaraan Angkutan Barang dengan Metode CRISP-DM", Novie Hari Purnomo, Bayu Pamungkas, Christina Juliane.
Pendahuluan
Pelanggaran ODOL sudah menjadi permasalahan yang sangat serius pada angkutan barang di Indonesia. Kerugian praktik ODOL sangat berdampak pada pemerintah dan masyarakat. Misalnya kerusakan jalan dan kecelakaan lalu lintas yang ditimbulkannya sehingga pemerintah menerapkan kebijakan zero ODOL mulai 1 Januari 2023. Namun sebaliknya, reaksi dari para supir truk menganggap bahwa kebijakan tersebut mengabaikan nasib para supir truk yang tercekik oleh biaya operasional, biaya pengiriman barang dan biaya yang tidak jelas sehingga menyebabkan mereka menggunakan truk ODOL untuk menutupi hal tersebut.
Tujuan
Tujuan dari penelitian ini untuk melakukan klasifikasi pada pola tren pelanggaran kendaraan angkutan barang berdasarkan hasil daripada pengujian algortima pohon keputusan C4.5 dan digunakan untuk mengevaluasi kinerja model. Diharapkan hasil penelitian ini dapat menjadikan acuan dalam pengambilan keputusan dan membuat kebijakan.
Metodologi Penelitian
Dataset
Dataset yang digunakan merupakan data dari Jembatan Timbang Online (JTO) di dua lokasi, yaitu UPPKB Losarang (Indramayu) dan UPPKB Balonggandu (Karawang). Berisikan 19.396 data pelanggaran dari angkutan barang periode Januari - Oktober 2022. Setelah dilakukan data cleansing maka hasilnya menjadi 16.390 record.
Metode atau Algoritma
Penelitian ini menggunakan metode algoritma C4.5, salah satu metode populer dalam klasifikasi di data mining. Algoritma ini bekerja dengan cara membentuk pohon keputusan berdasarkan nilai gain tertinggi dari setiap atribut menggunakan rumus entropy dan information gain. Selain itu, penelitian ini mengadopsi kerangka kerja CRISP-DM.
Hasil Temuan
Dari klasifikasi menggunakan algoritma C4.5, faktor yang berpengaruh terhadap tren pelanggaran tersebut, yaitu tingkat kelebihan muatan, lokasi UPPKB, status buku uji, kategori komiditi, jenis kendaraan, waktu penimbangan, dan kepemilikan kendaraan. Model pohon keputusan yang dibuat menghasilkan akurasi tinggi sekitar 86%, dengan tiga jenis pengujian (linear, shuffled, dan stratified sampling) yang hasilnya itu hampir sama. Hasilnya juga menunjukkan bahwa lebih muatan menjadi akar utama dari pelanggaran dan model ini diharapkan bisa membuat kebijakan zero ODOL lebih tepat sasaran.
Validasi
Penulis memvalidasi model klasifikasi dengan teknik k=10 yaitu data dibagi menjadi 10 bagian. 9 bagian digunakan untuk training dan 1 untuk testing, lalu prosesnya diulang sebanyak 10 kali dan hasil dari uji tiga jenis sampling (linear, shuffled, dan stratisfied) menunjukkan tingkat akurasi hampir sama, yaitu sekitar 85%. Hal ini membuktikan bahwa model pohon keputusan yang dibangun stabil dan memiliki performa konsisten.
Kesimpulan
Penelitian ini berhasil mengklasifikasi tren pelanggaran kendaraan angkutan barang menggunakan algoritma C4.5 dengan metode CRISP-DM. Faktor lebih muatan menjadi paling berpengaruh dalam menentukan jenis pelanggaran. Diikuti oleh lokasi UPPKB, status buku uji, dan kategori komiditi. Model ini juga menghasilkan akurasi sekitar 86%, menunjukkan bahwa pendekatan ini efektif dan bisa dijadikan acuan dalam pengambilan keputusan dan mengambil kebijakan zero ODOL supaya lebih tepat sasaran.
Kontribusi Atau Signifikasi pada Data Mining
Penelitian ini menunjukkan bahwa algoritma C4.5 jika dikombinasikan dengan kerangka kerja CRISP-DM dapat digunakan secara efektif dalam klasifikasi data pelanggaran skala besar. Kontribusinya itu terletak pada modelnya untuk masalah transportasi publik yang sebelumnya memang jarang dilakukan.
Tidak ada komentar:
Posting Komentar