// <![CDATA[PENERAPAN METODE ADASYN UNTUK MENINGKATKAN PREDIKSI PEMBATALAN RESERVASI HOTEL]]> 0415068801 - Yusup Miftahuddin, S.Kom., MT Dosen Pembimbing 1 RULLY ANGEANA BUNTARJO / 152018077 Penulis
Pembatalan reservasi hotel merupakan tantangan yang dihadapi oleh hotel-hotel di seluruh dunia. Pembatalan yang tidak terduga dapat menyebabkan hotel kehilangan pendapatan yang signifikan. Tantangan utama dalam memodelkan prediksi ini adalah ketidakseimbangan data yang dapat mengganggu akurasi evaluasi dan kemampuan model dalam mengenali kelas pembatalan. Penelitian ini menerapkan teknik Adaptive Synthetic Sampling (ADASYN) untuk menangani masalah ketidakseimbangan data. Angka pembatalan memiliki beberapa indikator berdasarkan dataset yang digunakan seperti orang dewasa, bayi, negara, durasi tinggal, jenis deposit, makanan dan agent. Tiga model diujikan yaitu Random Forest, Decision Tree, dan K-Nearest Neighbors diuji dengan beberapa kondisi, model default, tuning parameter, oversampling ADASYN, dan kombinasi ADASYN dengan ENN. Hasil eksperimen menunjukkan bahwa penerapan ADASYN memberikan dampak performa prediksi pembatalan reservasi hotel yang berbeda pada semua metrik evaluasi, seperti akurasi, presisi, recall, dan F1-score, hal ini disebabkan oleh oversampling yang berlebih. Kombinasi ADASYN dan ENN membantu mencapai keseimbangan kelas yang lebih realistis dan meningkatkan kualitas data untuk pelatihan model. Menghasilkan peningkatan performa terbaik dengan F1-score tertinggi sebesar 0.9306 pada Random Forest, 0.9288 pada Decision Tree, dan 0.9280 pada KNN. Hotel reservation cancellations are a significant challenge faced by hotels worldwide, causing considerable revenue loss. The main challenge in modeling this prediction is the class imbalance, which can affect the accuracy and the model’s ability to recognize cancellation cases. This study applies the Adaptive Synthetic Sampling (ADASYN) technique to address the class imbalance issue. Cancellation indicators include features such as adults, infants, country, length of stay, deposit type, meal, and agent. Three machine learning models Random Forest, Decision Tree, and K-Nearest Neighbors are tested under several conditions including default model, parameter tuning, ADASYN oversampling, and a combination of ADASYN with Edited Nearest Neighbors (ENN). Experimental results show that ADASYN impacts the prediction performance across metrics such as accuracy, precision, recall, and F1-score due to potential oversampling. The combination of ADASYN and ENN achieves a more realistic class balance and improves data quality for model training. The best performance improvements yielded F1-scores of 0.9306 for Random Forest, 0.9288 for Decision Tree, and 0.9280 for KNN.