Uma rede neural artificial ouviu várias vozes e, de seguida, gerou uma imagem de como os seus rostos poderiam ser. Apesar dos bons resultados, a tecnologia ainda tem algumas limitações.
As pessoas têm a tendência de associar uma voz a uma determinada cara. Mesmo quando nunca viram a cara, tendem a construir uma imagem mental de como poderá parecer essa pessoa. Agora, a inteligência artificial fez um teste que não esteve longe de confirmar esse pressuposto.
Os resultados da investigação foram pré-publicados na revista online arXiv, mas ainda não foram revistos pelos pares.
A rede neural artificial chamada Speech2Face foi treinada por cientistas para gerar caras de pessoas com base nas suas vozes. Para o efeito, ouviu áudios de mais de 100 mil pessoas a falarem. Associando certas características vocais a determinadas características físicas, a inteligência artificial tornou-se capaz de recriar uma cara foto-realista.
As caras geradas pela Speech2Face são bastante semelhantes às reais, mas de acordo com o Live Science, a rede neural ainda não tem a capacidade de determinar as características físicas exatas através da voz. Para chegar a este resultado final, a inteligência artificial tem como base indicadores do género, idade e etnia das pessoas.
“Como tal, o modelo apenas produz caras mais ou menos parecidas com as reais”, escreveram os cientistas. Apesar do realismo das simulações não ser perfeito, a IA acertou com sucesso no género, faixa etária e etnia de maior parte das pessoas.
O problema surgiu quando a rede neural era confrontada com variações na linguagem. Por exemplo, quando um asiático foi gravado a falar chinês, a inteligência artificial gerava o rosto de um asiático. No entanto, num outro clip em que falava inglês, o Speech2Face gerava uma cara de um ocidental caucasiano.
A tecnologia também associava normalmente vozes agudas a mulheres e vozes graves a homens, mesmo quando não era esse o caso.
A intelegência artifical está sendo a bola da vez, depois de algumas criações impressionantes, agora foi a vez de criar através de vozes, rostos de pessoas, o que é facinante. Limitações serão normal no início, mas é fenomenal, e ainda com bons resultados, muito show mesmo. Essa rede natural Speech2Face vai fazer história, mesmo com as variações de linguagem.