Tecnologia

Atores de voz processam empresa cuja IA se parece com eles

No verão passado, enquanto dirigiam para uma consulta médica perto de sua casa em Manhattan, Paul Skye Lehrman e Linnea Sage ouviram um podcast sobre a ascensão da inteligência artificial e a ameaça que ela representava para a subsistência de escritores, atores e outros profissionais do entretenimento.

O tema era particularmente importante para o jovem casal. Eles ganhavam a vida como dubladores, e as tecnologias de IA estavam começando a gerar vozes que pareciam reais.

Mas o podcast teve uma reviravolta inesperada. Para sublinhar a ameaça da IA, o anfitrião conduziu uma longa entrevista com um chatbot falante chamado Poe. Parecia o Sr. Lehrman.

“Ele estava entrevistando minha voz sobre os perigos da IA ​​e os danos que ela poderia causar à indústria do entretenimento”, disse Lehrman. “Paramos o carro e ficamos ali sentados, incrédulos, tentando descobrir o que aconteceu e o que deveríamos fazer.”

Lehrman e Sage agora estão processando a empresa que criou a voz do bot. Eles alegam que a Lovo, uma start-up em Berkeley, Califórnia, usou ilegalmente gravações de suas vozes para criar tecnologia que pudesse competir com seu trabalho vocal. Depois de ouvir um clone da voz do Sr. Lehrman no podcast, o casal descobriu que Lovo também havia criado um clone da voz da Sra.

O casal junta-se a um número crescente de artistas, editores, programadores de computador e outros criadores que processaram os fabricantes de tecnologias de IA, argumentando que estas empresas usaram o seu trabalho sem permissão para criar ferramentas que poderiam, em última instância, substituí-los no mercado de trabalho. (O New York Times processou duas das empresas, a OpenAI e a sua parceira, a Microsoft, em Dezembro, acusando-as de utilizarem os seus artigos noticiosos protegidos por direitos de autor na construção dos seus chatbots online.)

No processo, aberto na quinta-feira no tribunal federal de Manhattan, o casal disse que funcionários anônimos da Lovo lhes pagaram por alguns clipes de voz em 2019 e 2020, sem revelar como os clipes seriam usados.

Eles dizem que a Lovo, fundada em 2019, está violando a lei federal de marcas registradas e várias leis estaduais de privacidade ao promover clones de suas vozes. O processo busca status de ação coletiva, com Lehrman e Sage convidando outros dubladores para se juntarem a ele.

“Não sabemos quantas outras pessoas foram afetadas”, disse seu advogado, Steve Cohendisse.

Lovo nega as acusações do processo, disse David Case, advogado que representa a empresa. Ele acrescentou que se todos os indivíduos que forneceram gravações de voz a Lovo dessem o seu consentimento, “então não haveria problema”.

Tom Lee, o presidente-executivo da empresa, disse em um podcast episódio do ano passado em que Lovo agora oferecia um programa de divisão de receitas que permitia aos dubladores ajudar a empresa a criar clones de voz de si mesmos e receber uma parte do dinheiro ganho por esses clones.

O processo parece ser o primeiro do género, disse Jeffrey Bennett, conselheiro geral do SAG-AFTRA, o sindicato que representa 160 mil profissionais da comunicação social em todo o mundo.

“Este processo mostrará às pessoas – especialmente às empresas de tecnologia – que existem direitos na sua voz, que existe um grupo inteiro de pessoas que ganha a vida usando a sua voz”, disse ele.

Em 2019, o Sr. Lehrman e a Sra. Sage estavam se promovendo como dubladores em Fiverr, um site onde profissionais autônomos podem divulgar seu trabalho. Através deste mercado on-line, eles eram frequentemente solicitados a fornecer trabalho de voz para comerciais, anúncios de rádio, vídeos on-line, videogames e outras mídias.

Naquele ano, a Sra. Sage foi contatada por uma pessoa anônima que lhe pagou US$ 400 para gravar vários roteiros de rádio e explicou que as gravações não seriam usadas para fins públicos, de acordo com a correspondência citada na ação.

“Estes são roteiros de teste para anúncios de rádio”, disse a pessoa anônima, de acordo com o processo. “Eles não serão divulgados externamente e serão consumidos apenas internamente, portanto não exigirão direitos de qualquer espécie.”

Sete meses depois, outra pessoa não identificada contatou Lehrman sobre um trabalho semelhante. Lehrman, que também trabalha como ator de televisão e cinema, perguntou como os clipes seriam usados. A pessoa disse diversas vezes que seriam usados ​​apenas para fins acadêmicos e de pesquisa, conforme correspondência citada na ação. Lehrman recebeu US$ 1.200. (Ele forneceu gravações mais longas do que a Sra. Sage.)

Em abril de 2022, o Sr. Lehrman descobriu um Vídeo do youtube sobre a guerra na Ucrânia que foi narrada por uma voz que parecia a dele.

“É a minha voz falando sobre armamento no conflito russo-ucraniano”, disse ele. “Eu fico branco como um fantasma – arrepios nos braços. Eu sabia que nunca tinha dito essas palavras nessa ordem.”

Durante meses, ele e a Sra. Sage lutaram para entender o que havia acontecido. Eles contrataram um advogado para ajudá-los a descobrir quem havia feito o vídeo no YouTube e como a voz do Sr. Lehrman foi recriada. Mas o dono do canal do YouTube parecia estar na Indonésia e não tinha como encontrar a pessoa.

Então eles ouviram o podcast a caminho do consultório médico. Através do podcast, “Discussão sobre greve de prazo”, eles conseguiram identificar a origem do clone da voz do Sr. Lehrman. Um professor do Instituto de Tecnologia de Massachusetts montou o chatbot usando a tecnologia de síntese de voz da Lovo.

Sra. Sage também encontrou um vídeo on-line no qual a empresa apresentou sua tecnologia de voz a investidores durante um evento em Berkeley no início de 2020. No vídeo, um executivo da Lovo exibiu uma versão sintética da voz da Sra. Ambos brincaram ao lado da foto de uma mulher que não era ela.

“Eu estava no vídeo de apresentação deles para arrecadar dinheiro”, disse Sage. Desde então, a empresa levantou mais de US$ 7 milhões e reivindica mais de dois milhões de clientes em todo o mundo.

Lehrman e Sra. Sage também descobriram que Lovo estava promovendo clones de voz dela e Sr. Lehrman em seu site. Depois de enviarem à empresa uma carta de cessação e desistência, a empresa disse que havia removido seus clones de voz do site. Mas Lehrman e Sage argumentaram que o software que acionava esses clones de voz já havia sido baixado por um número incontável de clientes da empresa e ainda poderia ser usado.

Lehrman também questionou se a empresa usou as vozes do casal junto com muitos outros para construir a tecnologia central que impulsiona seu sistema de clonagem de voz. Os sintetizadores de voz muitas vezes aprendem suas habilidades analisando milhares de horas de palavras faladas, da mesma forma que o ChatGPT da OpenAI e outros chatbots aprendem suas habilidades analisando grandes quantidades de texto extraído da Internet.

Lovo reconheceu que treinou sua tecnologia usando milhares de horas de gravações de milhares de vozes, segundo correspondência no processo.

Case, o advogado que representa Lovo, disse que a empresa treinou seu sistema de IA usando áudio de um banco de dados de gravações em inglês disponível gratuitamente, chamado Openslr.org. Ele não respondeu quando questionado se as gravações de voz do Sr. Lehrman e da Sra. Sage foram usadas para treinar a tecnologia.

“Esperamos recuperar o controle sobre nossas vozes, sobre quem somos, sobre nossas carreiras”, disse Lehrman. “Queremos representar outras pessoas a quem isso aconteceu e aquelas a quem isso acontecerá se nada mudar.”

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button