Itu adalah tanda kehormatan selebriti baru yang tidak diinginkan oleh siapa pun. Jennifer Aniston, Oprah Winfrey, dan Kylie Jenner semuanya telah memiliki suara mereka disalin oleh penipu. Online blaggers menggunakan kecerdasan buatan untuk menggantikan nada ceria dari Martin Lewis, penasihat keuangan TV. Dan akhir pekan ini, David Attenborough menggambarkan dirinya sebagai “sangat terganggu” karena mengetahui bahwa suaranya yang disalin telah digunakan untuk menyampaikan seruan berita politik Amerika Serikat.
AI yang menghasilkan suara David Attenborough digunakan untuk melaporkan Donald Trump – video
Sekarang para ahli telah memperingatkan bahwa kloning suara melampaui hukum saat teknolog mempertajam generator suara yang sebelumnya canggung menjadi model yang mampu meniru jeda dan napas halus intonasi manusia.
Dr Dominic Lees, seorang ahli dalam kecerdasan buatan di film dan televisi yang memberi saran kepada komite parlementer Inggris, mengatakan kepada Guardian pada Senin: “Hukum privasi dan hak cipta kita tidak sesuai dengan apa yang ditunjukkan oleh teknologi baru ini, jadi ada sedikit yang dapat dilakukan David Attenborough.”
Lees memberi saran kepada komite seleksi kebudayaan, media, dan olahraga DPR Inggris dalam sebuah penyelidikan yang akan mengkaji penggunaan etis kecerdasan buatan dalam pembuatan film. Dia juga mengoordinasikan Jaringan Penelitian Media Sintetis, yang anggotanya termasuk perusahaan yang membuat versi kecerdasan buatan dari penyiar acara wawancara terdahulu Michael Parkinson, yang akan menghasilkan seri tak beraksi delapan bagian, Virtually Parkinson, dengan tamu-tamu baru. Proyek kloning suara itu dilakukan dengan persetujuan keluarga dan warisan Parkinson.
“Pemerintah pasti perlu memperhatikan [kloning suara], karena ini merupakan isu besar untuk penipuan,” kata Lee. “Itu perlu regulasi pemerintah agar mencegah [penyalahgunaan]… kita tidak bisa membiarkannya menjadi bebas acak.”
Penipuan kloning suara AI meningkat 30% di Inggris dalam setahun terakhir, menurut penelitian oleh bank NatWest bulan ini. Lender lain, Starling bank, menemukan bahwa 28% orang telah menjadi target penipuan kloning suara AI setidaknya sekali dalam setahun terakhir.
Kloning suara juga dilaporkan digunakan oleh penipu untuk melakukan versi penipuan teks “hi mom”, di mana penipu berpura-pura sebagai anak-anak yang membutuhkan orangtua mereka untuk segera mengirim dana. Di jalur telepon yang sudah kabur, mendeteksi bahwa seorang anak yang memohon adalah klon penipu bisa sulit. Konsumen disarankan untuk memeriksa dengan menggantikan dan menelepon kembali ke nomor yang terpercaya.
Orang-orang yang suaranya diclon tanpa izin mereka menemukannya lebih dari sekadar gangguan. Attenborough mengatakan kepada BBC pada hari Minggu: “Setelah menghabiskan seumur hidup mencoba mengatakan apa yang saya yakini sebagai kebenaran, saya sangat terganggu menemukan bahwa saat ini identitas saya dicuri oleh orang lain dan sangat menentang mereka menggunakannya untuk mengatakan apa yang mereka inginkan.”
Saat opsi suara baru pada model AI terbaru OpenAI, ChatGPT-4o, menampilkan nada yang sangat mirip dengan aktor Scarlett Johansson, dia mengatakan dia terkejut dan marah karena suara “terdengar sangat mirip dengan milik saya sehingga teman-teman terdekat saya dan media tidak bisa membedakannya”.
lewati promosi newsletter
Penelusuran mingguan tentang bagaimana teknologi membentuk hidup kita
Pemberitahuan Privasi: Newsletter mungkin berisi informasi tentang yayasan amal, iklan online, dan konten yang didanai oleh pihak luar. Untuk informasi lebih lanjut, lihat Kebijakan Privasi kami. Kami menggunakan Google reCaptcha untuk melindungi situs web kami dan Kebijakan Privasi Google dan Syarat Layanan berlaku.
setelah promosi newsletter
Asisten suara OpenAI Sky terdengar seperti Scarlett Johansson – video
Munculnya suara yang diclon meningkatkan pertanyaan tentang apa yang mereka lewatkan dari nada manusia sesungguhnya. Lees mengatakan: “Masalah besar adalah bahwa AI tidak memahami emosi dan bagaimana emosi tersebut mengubah bagaimana kata atau frasa mungkin memiliki dampak emosional, dan bagaimana Anda mengubah suara untuk merepresentasikan hal itu.”
Industri pengisi suara, yang menyediakan suara untuk iklan, animasi, dan pelatihan instruktif, harus merespons dengan cepat kemajuan teknologi. Joe Lewis, kepala audio di Voiceover Gallery di London, yang telah menyediakan suara manusia asli untuk iklan Specsavers dan National Express, mengatakan mereka sudah mengkloning suara beberapa seniman mereka.
Dia mengatakan AI tampaknya bekerja paling baik dengan suara laki-laki Inggris, mungkin karena itu mencerminkan bias dalam jenis rekaman yang telah digunakan untuk melatih algoritma, tetapi dia memperingatkan bahwa secara umum “ada sesuatu tentang cara penghasilan suara yang membuat Anda kurang perhatian”.
“Ketika AI [suara] bernafas, itu adalah nafas yang sangat repetitif,” katanya. “Nafasnya ada di tempat yang tepat, tetapi mereka tidak terasa alami… [Tapi] bisakah mencapai titik di mana benar-benar sempurna? Saya tidak melihat mengapa tidak, tetapi untuk mencapai spektrum emosi penuh jauh lagi.”