Diksia.com - Para peneliti di Microsoft baru saja memperkenalkan VASA-1, sebuah kecerdasan buatan (AI) yang mampu menciptakan avatar manusia realistis. Teknologi ini sanggup menghasilkan video animasi seseorang yang berbicara dengan gerakan bibir tersinkronisasi, hanya menggunakan satu gambar dan klip audio suara.
Namun, alih-alih terburu-buru merilis VASA-1, Microsoft justru memilih untuk mengeremnya. Kekhawatiran mereka? Potensi penyalahgunaan teknologi ini untuk membuat konten “deep fake” yang menyesatkan, terlebih di tahun politik yang krusial seperti 2024.
Para peneliti Microsoft sendiri menyatakan penolakan tegas terhadap pembuatan konten yang mendiskreditkan atau merugikan orang lain. Mereka menekankan komitmen terhadap pengembangan AI yang bertanggung jawab, demi kemajuan kesejahteraan manusia.
“Kami tidak memiliki rencana untuk merilis demo online, API, produk, detail implementasi tambahan, atau penawaran terkait lainnya sampai kami yakin teknologi ini akan digunakan secara bertanggung jawab dan sesuai dengan regulasi yang tepat,” tegas mereka.
Meski belum dirilis, VASA-1 diklaim mampu menangkap spektrum nuansa wajah dan gerakan kepala yang natural. Teknologi ini bahkan diproyeksikan bisa membuka jalan untuk interaksi real-time dengan avatar yang mampu meniru perilaku percakapan manusia.
Lebih menarik lagi, VASA-1 dapat bekerja dengan foto artistik, lagu, dan bahkan ucapan non-Inggris. Kegunaannya pun tak terbatas. Para peneliti melihat potensi VASA-1 sebagai pengajar virtual untuk siswa atau penyedia layanan terapi bagi mereka yang membutuhkan.
Kendati demikian, video yang dihasilkan VASA-1 saat ini masih memiliki “artefak” yang menunjukkan buatan AI.
Meski begitu, kehadiran VASA-1 tetap disambut antusias. Ben Werdmuller, pimpinan teknologi ProPublica, mengaku penasaran dengan pengalaman pengguna pertama yang memanfaatkan VASA-1 untuk menghadiri rapat Zoom.
“Bagaimana tanggapan orang lain? Apakah mereka menyadari avatar tersebut buatan AI?” ujarnya penasaran.
Kasus serupa juga terjadi pada OpenAI, pengembang ChatGPT. Mereka baru saja memperkenalkan “Voice Engine”, sebuah alat kloning suara yang mampu meniru ucapan seseorang hanya dengan sampel audio 15 detik. Namun, sama seperti Microsoft, OpenAI pun berhati-hati dalam merilis teknologi ini ke publik.