// <![CDATA[HYBRID TRANSFORMER U-Net DENGAN CROSS-SHAPED WINDOWS (HYBRID CSWin-UNet) UNTUK DETEKSI TUMPAHAN MINYAK]]> 0422106801 - Dewi Rosmala , S.Si, M.IT. Dosen Pembimbing 1 AHMAD LUTHFI AMIRULLOH / 15-2021-094 Penulis
Laut yang meliputi 70% permukaan bumi memiliki peran vital bagi iklim, ekosistem, dan ekonomi global. Namun, area pelabuhan berisiko tinggi terhadap tumpahan minyak akibat tabrakan kapal, kebocoran bahan bakar, atau kesalahan operasional. Oleh karena itu, deteksi dini sangat penting untuk mencegah kerusakan lingkungan dan kerugian ekonomi. Model berbasis CNN seperti U-Net sering digunakan dalam segmentasi citra tumpahan minyak karena unggul dalam menangkap konteks lokal, yaitu detail spasial kecil seperti tekstur, batas tipis dan pola halus pada permukaan air. Namun, U-Net masih lemah dalam memahami konteks global, yakni hubungan antar-area yang berjauhan untuk mengenali bentuk menyeluruh dan pola penyebaran minyak. Untuk mengatasi kelemahan tersebut, penelitian ini mengusulkan Hybrid CSWin-UNet, arsitektur yang menggabungkan CNN dengan CSWin Transformer. Model diuji pada citra drone dan dibandingkan dengan U-Net, U-Net++ sebagai pengembangan U-Net dengan dense skip connections, serta model CSWin-UNet. Hasil eksperimen menunjukkan U-Net mencapai Mean IoU 0,8642 yang belum optimal dalam membedakan batas minyak dan air, sementara U-Net++ memberikan hasil lebih baik dengan Mean IoU 0,9027. Sebaliknya, Hybrid CSWin-UNet dengan penyesuaian kedalaman blok Transformer memberikan performa terbaik dengan pixel akurasi 96,91%, Mean IoU 0,9364, dan Mean Dice 0,9668. Evaluasi per kelas memperlihatkan kategori Oil dan Water lebih stabil, sementara Others tetap konsisten (IoU ≈0,99). Secara keseluruhan, Hybrid CSWin-UNet terbukti efektif dan stabil untuk segmentasi tumpahan minyak, sekaligus lebih unggul dibanding U-Net maupun U-Net++, sehingga relevan mendukung sistem pemantauan maritim berbasis drone. The ocean, covering 70% of the Earth’s surface, plays a vital role in climate regulation, ecosystems, and the global economy. However, port areas are highly vulnerable to oil spills caused by ship collisions, fuel leaks, or operational errors. Therefore, early detection is crucial to prevent environmental damage and economic losses. CNN-based models such as U-Net are widely used for oil spill image segmentation because they excel in capturing local context, namely small spatial details such as textures, thin boundaries, and fine patterns on the water surface. However, U-Net is limited in understanding the global context, i.e., long-range relationships needed to recognize overall shapes and oil dispersion patterns.To address this limitation, this study proposes Hybrid CSWin-UNet, an architecture that combines CNN with the CSWin Transformer. The model was tested on drone imagery and compared with U-Net, U-Net++ (an extension of U-Net with dense skip connections), and the CSWin-UNet model. Experimental results show that U-Net achieved an Mean IoU of 0.8642, which was not optimal for distinguishing oil–water boundaries, while U-Net++ performed better with an Mean IoU of 0.9027. In contrast, Hybrid CSWin-UNet with adjusted block depth achieved the best performance with 96.91% pixel akurasi, 0.9364 Mean IoU, and 0.9668 Mean Dice. Class-wise evaluation demonstrated more stable segmentation for Oil and Water categories, while Others remained consistent (IoU ≈0.99). Overall, Hybrid CSWin-UNet proved to be the most effective and stable approach for oil spill segmentation, outperforming both U-Net and U-Net++, making it highly relevant for supporting drone-based maritime monitoring systems.