// <![CDATA[IMAGE CAPTIONING MENGGUNAKAN TRANSFORMER DAN AREA ATTENTION]]> Dhiki Romadinur / 152016112 Penulis Jasman Pardede, S.Si., M.T., Dr. Dosen Pembimbing 1
Image captioning adalah menghasilkan deskripsi teks yang akurat dan relevan dari sebuah gambar. Penelitian dilakukan dengan menggunakan dataset dari MS COCO 2014. Metode yang diterapkan pada penelitian ini adalah Transformer dengan Area Attention mobilenetV3Small untuk membangun model. Dalam penelitian ini menggunakan ekstraksi fitur MobilenetV3Small. Pengujian yang dilakukan dengan evaluasi skor BLEU. Pengukuran BLEU menggunakan 4-gram terdiri skor BLEU-1, BLEU-2, BLEU-3, BLEU-4. Dengan proses epoch sebanyak 100 kali, Dengan hasil skor BLEU yang dihasilkan dengan rata-rata skor yang didapatkan adalah {0.557348, 0.354169, 0.183363, 0.098632}.