A resposta da China à Google consegue clonar a nossa voz em segundos

A “google” chinesa, Baidu, acaba de lançar um documento que mostra o seu mais recente desenvolvimento em Inteligência Artificial (IA): um programa que pode clonar vozes depois de analisar até um clip de segundos de duração, usando uma rede neural.

Não só o software consegue imitar uma voz, como pode alterá-la para refletir outro género ou mesmo um sotaque diferente. Pode ouvir alguns dos exemplos gerados aqui, hospedados no GitHub.

As iterações anteriores desta tecnologia permitiram a clonagem de voz depois de os sistemas analisarem amostras de voz mais longas. Em 2017, a equipa de pesquisa Baidu Deep Voice introduziu tecnologia que poderia clonar vozes com 30 minutos de material de treino.

A Adobe tem um programa chamado VoCo que pode imitar uma voz com apenas 20 minutos de áudio. Uma inicialização canadiana, chamada Lyrebird, pode clonar uma voz com apenas um minuto de áudio.

A inovação do Baidu reduziu ainda mais esse tempo para poucos segundos. Enquanto no início isso pode parecer uma atualização de tecnologia que se tornou popular nos anos 90, com a ajuda de “Home Alone 2” e “Scream”, existem realmente algumas aplicações nobres para essa tecnologia.

Por exemplo: imagine o seu filho ouvir uma história contada com a sua voz, enquanto está longe, ou ter uma voz duplicada criada para uma pessoa que não consegue falar.

Esta tecnologia também pode ser usada para criar assistentes digitais personalizados e serviços de tradução de voz mais naturais. No entanto, como em muitas tecnologias, a clonagem de voz também vem com o risco de ser abusada, ou simplesmente mal usada.

A New Scientist informa que o programa foi capaz de produzir uma voz que enganou o software de reconhecimento de voz com uma precisão de mais de 95% nos testes. Os seres humanos até avaliaram a voz clonada com uma pontuação de 3.16 em 4. Isso poderia abrir a possibilidade de fraude assistida por IA.

Existem programas que podem usar a IA para substituir ou alterar – e até mesmo gerar a partir do zero – os rostos dos indivíduos em vídeos. Agora, isso é principalmente usado na internet para trazer gargalhados aos utilizadores ao inserir Nicolas Cage na série Senhor dos Anéis.

Mas, com a tecnologia que pode clonar vozes, em breve podemos ser bombardeadas com mais “notícias falsas” de políticos a fazer ou dizer coisas que na verdade não fizeram.

Já é muito fácil enganar pessoas usando apenas a palavra escrita ou ferramentas como o Photoshop. Se tecnologias como esta da Baidu forem colocadas nas mãos erradas, pode haver ainda mais problemas.

PARTILHAR

RESPONDER

Turista danifica escultura do século XIX enquanto posa para fotografia (e é apanhado pelas câmaras de vigilância)

A polícia italiana identificou um austríaco de 50 anos que danificou uma estátua do século XIX num museu em Itália, enquanto posava para uma fotografia. O incidente ocorreu no passado dia 31 de junho, segundo …

Covid-19: Brasil supera as 100.000 mortes

O Brasil ultrapassou hoje a barreira das 100.000 mortes associadas à covid-19, quase cinco meses depois da confirmação do primeiro óbito no país, indicam dados oficiais divulgados pelas secretarias regionais de Saúde. Segundo os mais recentes …

As vacas leiteiras têm relações complexas (que se alteram quando mudam de grupo)

Uma nova investigação levada a cabo por cientistas do Chile e dos Estados Unidos concluiu que as vacas leiteiras vivem em redes sociais complexas que se alteram quando estes animais são movidos para outros grupos.  Para …

Virgin Galactic quer desenvolver avião comercial supersónico (que promete superar a velocidade do som)

A Virgin Galactic vai aliar-se à Rolls-Royce para criar um avião comercial supersónico, ainda mais rápido do que o mítico Concorde. A empresa de turismo espacial Virgin Galactic anunciou uma parceria com a Rolls-Royce para desenvolver …

PayPal resiste à pandemia. Volume de pagamentos cresce 30% no segundo trimestre

O volume de pagamentos através do PayPal cresceu 30% no segundo trimestre. A empresa parece resistir à pandemia de covid-19, que abalou o setor das viagens, cujos pagamentos estão muitas vezes associados a meios eletrónicos. …

Quatro pessoas morreram nos Estados Unidos depois de beberem desinfetante para as mãos

Quatro pessoas morreram nos Estados Unidos depois de ingerirem desinfetante para as mãos à base de álcool, revelou um relatório do Centros de Controlo e Prevenção de Doenças (CDC) do país esta quarta-feira publicado. De …

Jim Hackett deixa a Ford após três anos de liderança

Ao fim de três anos como CEO da Ford, Jim Hackett será substituído por Jim Farley. Um mandato que fica marcado por problemas financeiros, de produção e pela morte dos três volumes e utilitários. O mandato …

Covid-19: Portugal tem mais 186 casos e quatro pessoas morreram desde sexta-feira

Portugal regista hoje mais quatro mortos e 186 novos casos de infeção por covid-19 em relação a sexta-feira, segundo o boletim diário da Direção-Geral da Saúde. De acordo com o relatório da DGS sobre a situação …

Versão americana da Eurovisão chega em 2021

O Festival Eurovisão da Canção — o maior espetáculo de entretenimento televisivo do mundo — vai chegar aos Estados Unidos no final do próximo ano. A novidade foi divulgada, esta sexta-feira (7), em comunicado oficial. A …

Contratações na TVI após apoios financeiros "suscitam preocupação"

O professor universitário e ex-ministro Miguel Poiares Maduro manifestou "preocupação" relativamente às contratações na TVI, da Media Capital, grupo que beneficia do apoio do Estado, através da compra antecipada de publicidade institucional. Em entrevista à Lusa, …