// <![CDATA[PENERAPAN METODE REINFORCEMENT LEARNING UNTUK MENDAPATKAN WAKTU TERCEPAT PADA CAR AI DI GAME BALAP MOBIL]]> 0411038512 - Galih Ashari Rakhmat, S.Si., M.T. Dosen Pembimbing 1 NURDIANTO / 152019068 Penulis
Kemajuan teknologi dan perangkat lunak telah berpengaruh besar pada industri gim yang sekarang sedang berkembang pesat menjadi industri yang besar. Pengembang selalu mencari cara untuk membuat pengalaman bermain lebih baik bagi pemain, seperti menggunakan teknologi terbaru yang diimplementasi di gim. Game genre balap sangat populer di antara penggemar game karena memberikan tantangan untuk memenangkan balapan dan melewati rintangan di lintasan. Satu cara yang digunakan dalam genre ini adalah algoritma machine learning, terutama reinforcement learning. Algoritma ini membuat agen dalam game dapat berinteraksi dengan lingkungan secara dinamis. Mereka belajar dari penghargaan dan hukuman untuk membuat karakter NPC yang lebih interaktif dan realistis. Penelitian ini menciptakan NPC untuk game balap dengan menggunakan algoritma Proximal Policy Optimization (PPO) pada platform Unity ML-Agents. Algoritma PPO dipilih karena kestabilannya dalam menangani pembaruan kebijakan secara bertahap, yang efektif dalam lingkungan kompleks seperti balapan dengan trek beragam. Selain PPO, penelitian ini juga menggunakan dua metode pelatihan lain, yaitu Generative Adversarial Imitation Learning (GAIL) dan Behavioral Cloning (BC), untuk membandingkan seberapa baik performa mobil AI yang lebih cepat dan efisien. Hasil dari penelitian ini didapatkan bahwa mobil AI yang menggunakan algoritma PPO memiliki waktu terbaik di trek 2 dan trek 3. Mobil tersebut lebih cepat daripada yang menggunakan metode GAIL dan BC, dengan waktu tercepat 87,12 detik di lap 2 dan 92,18 detik di trek 3 setelah dilatih selama 10 juta langkah. Kata kunci : Gim; Gim balap; ML-Agents; Reinforcement Learning; Unity