Berkat AI, Computer Vision di Mobil Otonom 9x Lebih Cepat & Akurat!

Dari laboratorium MIT dan MIT-IBM Watson AI Lab, datanglah inovasi computer vision yang revolusioner. Mampu mempercepat pengenalan objek pada gambar beresolusi tinggi hingga 9x

Oleh: Rendy Andriyanto

September 13, 2023

Sebuah model machine-learning untuk visi komputer beresolusi tinggi bisa memungkinkan aplikasi visual yang membutuhkan komputasi intensif, seperti teknologi mengemudi otomatis atau segmentasi gambar medis, di perangkat edge

Peneliti dari MIT dan MIT-IBM Watson AI Lab mengembangkan model computer vision baru yang lebih efisien, mempercepat proses pengenalan objek di gambar beresolusi tinggi hingga 9x lebih cepat.
Model terbaru, yang diberi nama EfficientViT, menawarkan kompleksitas komputasi yang linear dan operasi yang efisien untuk hardware, memungkinkan segmentasi semantik real-time pada perangkat dengan sumber daya terbatas.
Selain aplikasi di industri otomotif, teknologi EfficientViT juga berpotensi meningkatkan efisiensi tugas visi komputer beresolusi tinggi lainnya, seperti segmentasi gambar medis, memberikan dorongan signifikan dalam inovasi di berbagai bidang.

Apa yang kamu pikirkan ketika melihat mobil otonom di jalanan? “Wah, keren!” atau “Apakah aman?”. Ternyata, ada tim peneliti dari MIT dan MIT-IBM Watson AI Lab yang berpikir, “Bagaimana kita membuat komputer pandangan mereka bekerja lebih cepat dan efisien?”.

Hasilnya, mereka menciptakan teknologi yang revolusioner yang akan mempengaruhi tidak hanya industri otomotif tetapi juga bidang kesehatan dan lainnya.

Saat piksel bicara pada mobil

Sebuah mobil otonom harus mengenali setiap objek dengan cepat dan akurat. Dari truk pengantar yang sedang parkir hingga sepeda yang melaju kencang. Tentunya, kamu tak mau mobil itu salah mengenali, bukan?

Computer Vision dari AI — EfficientViT bisa memungkinkan sebuah kendaraan otomatis untuk melakukan segmentasi semantik dengan efisien, sebuah tugas visi komputer beresolusi tinggi yang melibatkan kategorisasi setiap pixel dalam sebuah adegan agar kendaraan dapat mengidentifikasi objek dengan akurat

Nah, masalahnya adalah saat memproses gambar beresolusi tinggi. Kompleksitas komputasi bisa menjadi masalah besar, apalagi jika harus dilakukan dalam waktu nyata oleh perangkat dengan sumber daya terbatas.

Namun, tim dari MIT memiliki solusi. Mereka menciptakan model computer vision berbasis kecerdasan buatan yang efisien dan dapat mempercepat pengenalan objek pada gambar beresolusi tinggi hingga sembilan kali lipat lebih cepat daripada model sebelumnya! Kinerja yang luar biasa ini tentu bukan tanpa dasar.

Penelitian mereka, yang akan dipresentasikan di International Conference on Computer Vision, menunjukkan bahwa dengan modifikasi tertentu, mereka dapat mengurangi kompleksitas komputasi dari kuadratik menjadi linear.

Transformasi visioner

Basis dari teknologi ini adalah transformasi visioner. Terinspirasi dari pemrosesan bahasa alamiah, model ini memecah gambar menjadi potongan-potongan kecil yang disebut dengan token.

Dari setiap token ini, model menciptakan peta perhatian yang merepresentasikan hubungan setiap token dengan yang lainnya. Konsep yang cerdas, namun juga memerlukan komputasi yang intensif.

Dengan seri model baru yang diberi nama EfficientViT, peneliti MIT berhasil menciptakan peta perhatian dengan fungsi kesamaan linear, bukan non-linear. Hasilnya? Sebuah model yang mampu memproses gambar beresolusi tinggi dengan cepat tanpa mengorbankan akurasi.

Lepas landas menuju masa depan

Teknologi ini bukan hanya untuk dunia otomotif atau bahkan mobil otonom saja. Fungsi utamanya dalam segmentasi gambar beresolusi tinggi dapat diterapkan dalam berbagai bidang, salah satunya adalah medis.

Bagaimana jika dokter bisa mendapatkan hasil pemindaian tubuh dengan lebih cepat dan akurat? Tentunya, kesempatan untuk penyembuhan akan semakin besar.

Profesor Song Han, salah satu penulis utama dari penelitian ini, menekankan pentingnya efisiensi dalam model-model Artificial Intelligence (AI). Mereka ingin mengajak kita semua untuk memperhatikan tidak hanya hasil yang diberikan oleh AI, tetapi juga bagaimana AI mencapai hasil tersebut.

Selain itu, dengan dukungan dari Oracle dan AMD, tampaknya EfficientViT akan segera diterapkan dalam berbagai aplikasi nyata.

Dengan teknologi seperti ini, masa depan tampak cerah, bukan? Mari kita nantikan inovasi selanjutnya dari MIT dan MIT-IBM Watson AI Lab!

MIT News, https://news.mit.edu/2023/ai-model-high-resolution-computer-vision-0912

Menu

Berkat AI, Computer Vision di Mobil Otonom 9x Lebih Cepat & Akurat!

Daftar Isi

Saat piksel bicara pada mobil

Transformasi visioner

Lepas landas menuju masa depan

Kabar Terkait

Pembaruan One UI 6.1 Bawa Fitur AI Galaxy ke Lebih Banyak Perangkat

Google Batasi Pertanyaan Terkait Pemilu pada Chatbot Gemini

Google Gemini AI: Menembus Batas Inovasi Teknologi Kecerdasan Buatan

Microsoft Bersiap Luncurkan Windows 12 di 2024 dengan Inovasi AI

Kominfo Siapkan Panduan Etika AI, Surat Edaran Tanpa Sanksi

Daftar Isi

Rangkuman

Saat piksel bicara pada mobil

Transformasi visioner

Lepas landas menuju masa depan

Referensi

Pembaruan One UI 6.1 Bawa Fitur AI Galaxy ke Lebih Banyak Perangkat

Google Batasi Pertanyaan Terkait Pemilu pada Chatbot Gemini

Google Gemini AI: Menembus Batas Inovasi Teknologi Kecerdasan Buatan

Microsoft Bersiap Luncurkan Windows 12 di 2024 dengan Inovasi AI

Kominfo Siapkan Panduan Etika AI, Surat Edaran Tanpa Sanksi