Tuturpedia.com – OpenAI merilis akses terbatas untuk fitur “Voice Engine” atau kloning suara yang bisa digunakan untuk mengubah teks ke suara.
Fitur ini dapat membuat suara sintetis berdasarkan klip suara seseorang berdurasi 15 detik. Suara yang dihasilkan OpenAI ini nantinya muncul dengan cara membacakan perintah teks dalam bahasa yang sama dengan pembicara atau dalam sejumlah bahasa lainnya.
“Penerapan skala kecil ini membantu menginformasikan pendekatan, perlindungan, dan pemikiran kami tentang bagaimana Voice Engine dapat digunakan untuk kebaikan di berbagai industri,” ungkap OpenAI pada postingan di blognya.
OpenAI mengatakan pihaknya mulai mengembangkan Voice Engine pada akhir tahun 2022 dan teknologi tersebut telah mendukung suara preset untuk API text-to-speech dan fitur Read Aloud ChatGPT.
Namun, untuk melakukan uji coba OpenAI memilih untuk membatasi peluncuran Voice Engine hanya untuk sekelompok penguji awal tertentu. Hal ini dilakukan dengan alasan kekhawatiran atas potensi penyalahgunaan dan risiko terkait.
Perusahaan yang memiliki akses tersebut antara lain perusahaan teknologi pendidikan Age of Learning, platform penyampaian cerita visual HeyGen, pembuat perangkat lunak kesehatan garis depan Dimagi, pembuat aplikasi komunikasi AI Livox, dan sistem kesehatan Lifespan.
OpenAI Khawatirkan Penyalahgunaan Fitur Kloning Suara
Peluncuran fitur “Voice Engine” pada OpenAI merupakan keputusan yang dibuat karena besarnya kekhawatiran OpenAI pada fitur ini. OpenAI berusaha untuk menggunakan pendekatan yang bertanggung jawab yang bertujuan untuk memitigasi potensi risiko.
Cara ini juga dilakukan ketika OpenAI mendesain pembuat video Sora, yang juga diumumkan namun tidak dirilis secara luas.
Meskipun beberapa perusahaan startup lainnya telah menawarkan solusi kloning suara, OpenAI membedakan dirinya dengan mengutamakan pertimbangan etis.
Penguji awal Voice Engine dilakukan dengan menyetujui pedoman yang ketat, termasuk mendapatkan persetujuan sebelum meniru identitas individu dan mengungkapkan penggunaan suara yang dihasilkan AI.
Hal ini dilakukan untuk meminimalisasi adanya kejadian tidak bertanggung jawab yang terjadi pada Robocall terulang. Di mana fitur kloningan suara dari perusahaan lain tersebut menampilkan suara-suara buatan AI yang meniru tokoh politik yang tentunya akan berbahaya.***
Penulis: Anna Novita Rachim.
Editor: Annisaa Rahmah.