<![CDATA[EFFICIENTNETB5 DAN TRANSFORMER UNTUK GENERATE IMAGE CAPTION]]>

// <![CDATA[EFFICIENTNETB5 DAN TRANSFORMER UNTUK GENERATE IMAGE CAPTION]]> 0426097801 - Jasman Pardede S.Si., MT. Dosen Pembimbing 1 MOHAMMAD FAISHAL DZAKY/152017116 Penulis Pada saat ini teknologi Artificial Intelligence (kecerdasan buatan) sangat berkembang pesat dan banyak digunakan untuk mempermudah pekerjaan manusia. Salah satunya adalah penggunaan teknologi kecerdasan buatan dalam melakukan Image Captioning. Image captioning merupakan proses pendeskripsian citra secara tekstual yang dilakukan dengan otomatis dimulai dengan computer vision dalam mengidentifikasi objek, atribut, dan hubungannya, kemudian dengan Natural Language Processing dalam memonitor sintaks dan semantik, dan dengan machine learning dalam menghasilkan teks. Penelitian dilakukan untuk membangun model yang dapat melakukan image captioning dengan pengekstrak fitur EfficientNetB5 dan membangkitkan kalimatnya menerapkan arstektur Transformer. Dataset yang digunakan adalah Flickr8k yang memiliki total dataset 8000 citra beserta masing-masing captionnya. Penelitian menguji kemampuan model yang dihasilkan dari proses pelatihan menggunakan kedua metode dalam membangkitkan kalimat. Kemampuan model diukur menggunakan skor BLEU. Pengujian menghasilkan nilai BLEU-1 0.782037, BLEU-2 0.691227, BLEU-3 0.651030, dan BLEU-4 0.567770.