Pengisi Suara Gugat Perusahaan yang AI-nya Mirip dengan Mereka

Musim panas lalu, saat mereka mengemudi ke janji dokter di dekat rumah mereka di Manhattan, Paul Skye Lehrman dan Linnea Sage mendengarkan sebuah podcast tentang naiknya kecerdasan buatan dan ancaman yang ditimbulkan bagi mata pencaharian penulis, aktor, dan profesional hiburan lainnya. Topik ini sangat penting bagi pasangan muda itu. Mereka mencari nafkah sebagai pengisi suara, dan teknologi A.I. mulai menghasilkan suara yang terdengar seperti aslinya. Namun, podcast itu memiliki putaran tak terduga. Untuk menggarisbawahi ancaman dari A.I., pembawa acara melakukan wawancara panjang dengan chatbot yang bisa bicara bernama Poe. Suaranya persis seperti Mr. Lehrman. “Dia sedang mewawancarai suaraku tentang bahaya A.I. dan bahaya yang mungkin dimiliki pada industri hiburan,” kata Mr. Lehrman. “Kami menepi dan duduk di sana dalam keheranan absolut, mencoba memahami apa yang baru saja terjadi dan apa yang harus kami lakukan.”
Saudara Lehrman dan Ibu Sage sekarang menggugat perusahaan yang menciptakan suara bot itu. Mereka mengklaim bahwa Lovo, sebuah perusahaan rintisan di Berkeley, Calif., secara ilegal menggunakan rekaman suara mereka untuk menciptakan teknologi yang dapat bersaing dengan pekerjaan suara mereka. Setelah mendengar klon suara Mr. Lehrman di podcast, pasangan itu menemukan bahwa Lovo juga telah menciptakan klon suara Ms. Sage.
Pasangan itu bergabung dengan sejumlah seniman, penerbit, programer komputer, dan pencipta lain yang telah menggugat pembuat teknologi A.I., dengan alasan bahwa perusahaan ini menggunakan karya mereka tanpa izin dalam membuat alat yang pada akhirnya bisa menggantikan mereka di pasar kerja. “Kami tidak tahu berapa banyak orang lain yang terpengaruh,” kata pengacara mereka, Steve Cohen.
Lovo membantah klaim dalam gugatan tersebut, kata David Case, seorang pengacara yang mewakili perusahaan tersebut. Dia menambahkan bahwa jika semua individu yang memberikan rekaman suara kepada Lovo memberikan izin mereka, “maka tidak ada masalah.”
Tom Lee, chief executive perusahaan, mengatakan dalam sebuah episode podcast tahun lalu bahwa Lovo kini menawarkan program pembagian pendapatan yang memungkinkan pengisi suara membantu perusahaan menciptakan klon suara dari diri mereka sendiri dan menerima bagian dari uang yang diperoleh oleh klon tersebut.
Gugatan ini tampaknya menjadi yang pertama dari jenisnya, kata Jeffrey Bennett, penasihat umum untuk SAG-AFTRA, serikat buruh yang mewakili 160.000 profesional media di seluruh dunia. “Gugatan ini akan menunjukkan kepada orang – terutama perusahaan teknologi – bahwa ada hak yang ada pada suara Anda, bahwa ada seluruh kelompok orang di luar sana yang mencari nafkah dengan menggunakan suara mereka,” katanya.
Pada tahun 2019, Mr. Lehrman dan Ms. Sage mempromosikan diri mereka sebagai pengisi suara di Fiverr, sebuah situs web di mana profesional lepas dapat memasarkan pekerjaan mereka. Melalui pasar online ini, mereka sering diminta untuk memberikan pekerjaan suara untuk iklan, iklan radio, video online, permainan video, dan media lainnya.
Pada tahun itu, Ibu Sage dihubungi oleh seseorang yang tidak diketahui yang membayar $400 kepadanya untuk merekam beberapa skrip radio dan menjelaskan bahwa rekaman tersebut tidak akan digunakan untuk tujuan publik, menurut korespondensi yang dikutip dalam gugatan. “Ini adalah naskah tes untuk iklan radio,” kata orang yang tidak dikenal itu, menurut gugatan. “Mereka tidak akan diungkapkan ke publik, dan hanya akan dikonsumsi secara internal, sehingga tidak memerlukan hak apa pun.”
Tujuh bulan kemudian, seseorang yang tidak diidentifikasi menghubungi Mr. Lehrman tentang pekerjaan serupa. Mr. Lehrman, yang juga bekerja sebagai aktor televisi dan film, bertanya bagaimana klip itu akan digunakan. Orang tersebut mengatakan beberapa kali bahwa mereka hanya akan digunakan untuk tujuan penelitian dan akademis, menurut korespondensi yang dikutip dalam gugatan. Mr. Lehrman dibayar $1.200. (Dia memberikan rekaman lebih panjang dibandingkan Ms. Sage.)
Pada tahun 2022, Mr. Lehrman menemukan video YouTube tentang perang di Ukraina yang dinarasikan oleh suara yang terdengar seperti miliknya. “Ini adalah suaraku berbicara tentang persenjataan dalam konflik Ukraina-Rusia,” katanya. “Saya menjadi pucat — ada rasa dingin di lengan saya. Saya tahu saya tidak pernah mengucapkan kata-kata itu dalam urutan tersebut.”
Selama berbulan-bulan, dia dan Ibu Sage berjuang untuk memahami apa yang terjadi. Mereka mempekerjakan seorang pengacara untuk membantu mereka melacak siapa yang membuat video YouTube dan bagaimana suara Mr. Lehrman telah direkonstruksi. Tetapi pemilik saluran YouTube itu tampaknya berbasis di Indonesia, dan mereka tidak memiliki cara untuk menemukan orang tersebut.
Kemudian mereka mendengar podcast tersebut dalam perjalanan ke kantor dokter. Melalui podcast “Deadline Strike Talk,” mereka dapat mengidentifikasi sumber klon suara Mr. Lehrman. Seorang profesor Massachusetts Institute of Technology telah menyusun chatbot tersebut menggunakan teknologi sintesis suara dari Lovo.
Ibu Sage juga menemukan video online di mana perusahaan tersebut mencari teknologi suara mereka kepada investor selama acara di Berkeley pada awal 2020. Dalam video tersebut, seorang eksekutif Lovo menunjukkan versi sintetis dari suara Ms. Sage dan membandingkannya dengan rekaman suara aslinya. Keduanya diputar seiring dengan foto seorang wanita yang bukan dia. “Saya ada dalam video pemasaran mereka untuk mengumpulkan uang,” kata Ibu Sage. Perusahaan tersebut sejak itu berhasil mengumpulkan lebih dari $7 juta dan mengklaim memiliki lebih dari dua juta pelanggan di seluruh dunia.
Mr. Lehrman dan Ibu Sage juga mengetahui bahwa Lovo mempromosikan klon suara dari dia dan Mr. Lehrman di situs web mereka. Setelah mereka mengirimkan surat larangan kepada perusahaan tersebut, perusahaan mengatakan telah menghapus klon suara mereka dari situs. Namun, Mr. Lehrman dan Ibu Sage berpendapat bahwa perangkat lunak yang menggerakkan klon suara ini telah diunduh oleh sejumlah pelanggan perusahaan dan masih bisa digunakan.
Mr. Lehrman juga mempertanyakan apakah perusahaan tersebut telah menggunakan suara pasangan tersebut bersama banyak orang lain untuk membangun teknologi inti yang menggerakkan sistem klon suara mereka. Pemutar suara sering mempelajari keterampilan mereka dengan menganalisis ribuan jam kata-kata yang diucapkan, dengan cara yang sama seperti ChatGPT dari OpenAI dan chatbot lainnya mempelajari keterampilan mereka dengan menganalisis sejumlah besar teks yang diambil dari internet.
Lovo mengakui bahwa mereka telah melatih teknologinya menggunakan ribuan jam rekaman dari ribuan suara, menurut korespondensi dalam gugatan.
Mr. Case, pengacara yang mewakili Lovo, mengatakan bahwa perusahaan tersebut melatih sistem A.I. mereka menggunakan audio dari database rekaman bahasa Inggris yang secara bebas tersedia yang disebut Openslr.org. Dia tidak menanggapi ketika ditanyakan apakah rekaman suara Mr. Lehrman dan Ibu Sage telah digunakan untuk melatih teknologi tersebut.
“Kami berharap dapat mengendalikan kembali suara kami, siapa kami, karier kami,” kata Mr. Lehrman. “Kami ingin mewakili orang lain yang mengalami hal ini dan mereka yang akan mengalami hal ini jika tidak ada perubahan.”