IMAGE CAPTIONING MENGGUNAKAN METODE INCEPTION-V3 DAN TRANSFORMER
Pada bidang Computer Vision terdapat masalah yang muncul, seperti objek yang dideteksi pada gambar tidak dapat memberikan pemahaman secara konteks. Dengan memanfaatkan object detection yang telah digunakan sebelumnya, hal tersebut dapat dimanfaatkan untuk menghasilkan satu atau beberapa kalimat yang mendeskripsikan konteks gambar. Hal ini disebut Image Captioning yang merupakan proses menghasilkan teks deskripsi yang diberikan pada suatu gambar berdasarkan apa yang dilihat oleh seseorang. Tujuan dilakukannya Image Captioning yaitu untuk memberikan pemahaman terhadap konteks dan informasi yang ingin disampaikan oleh gambar. Untuk melakukan image captioning dibutuhkan dua ilmu yaitu Computer Vision untuk mengenali objek dan Natural Language Processing (NLP) untuk menghasilkan kalimat deskripsi. Metode yang digunakan pada penelitian ini yaitu Inception-V3 dan Transformer. Penelitian dilakukan menggunakan dataset Flickr8k yang memiliki 8000 gambar dan 40000 kalimat caption. Model dievaluasi dengan cara menghitung skor BLEU (Bilingual Evaluation Understudy). Nilai yang dihasilkan dari BLEU ini berada diantara 0 sampai 1, yang berarti semakin tinggi nilai BLEU, maka semakin akurat model yang dibuat. Berdasarkan model tersebut, nilai rata-rata skor BLEU-1, BLEU-2, BLEU-3, dan BLEU-4 yang didapatkan adalah (0.306, 0.184, 0.123, 0.084). Kata Kunci : Inception-V3; Transformer; BLEU; Computer Vision; Natural
Detail Information
Citation
APA Style
. (2022).IMAGE CAPTIONING MENGGUNAKAN METODE INCEPTION-V3 DAN TRANSFORMER ().Teknik Kimia:FTI
Chicago Style
.IMAGE CAPTIONING MENGGUNAKAN METODE INCEPTION-V3 DAN TRANSFORMER ().Teknik Kimia:FTI,2022.Text
MLA Style
.IMAGE CAPTIONING MENGGUNAKAN METODE INCEPTION-V3 DAN TRANSFORMER ().Teknik Kimia:FTI,2022.Text
Turabian Style
.IMAGE CAPTIONING MENGGUNAKAN METODE INCEPTION-V3 DAN TRANSFORMER ().Teknik Kimia:FTI,2022.Text