/

Conhece o MusicLM? É o novo gerador de música com IA da Google

A Inteligência Artificial (IA) está cada vez mais sofisticada, demonstrando imensas qualidades extremamente úteis. É o caso do MusicLM, um gerador de música com IA, revelado pela Google no início deste ano, capaz de compor canções de 5 minutos com base em pequenos textos.

De acordo com o Big Think, transformar um fragmento de texto numa canção é possível com o MusicLM, mas devido a eventuais preocupações legais, poderá não ser possível algum dia chegar a público.

O MusicLM pode gerar faixas de áudio de até 5 minutos de duração. Com este gerador IA da Google, o áudio produzido é semelhante à música gravada por humanos.

Para chegar a este resultado, a Google treinou o MusicLM com mais de 280.000 horas de música provenientes do MuLan — um modelo treinado para associar música a descrições escritas em linguagem natural.

Posteriormente, criou o MusicCaps, ou seja, um conjunto de dados acessível ao público, com mais de 5500 clipes de música, para avaliar o gerador de música da IA. Músicos profissionais escreveram legendas para cada um destes áudios, bem como listas de aspetos para os descrever, nomeadamente o seu género e o seu estado de espírito.

No decorrer do processo, a Google comparou o MusicLM com duas outras IAs de texto para música — Mubert e Riffusion — utilizando várias métricas quantitativas para avaliar a qualidade de áudio de uma faixa e a adesão a uma descrição de texto.

Também apresentaram aos críticos as descrições do MusicCaps e dois áudios, que podiam ser produzidos por IAs, e a música em que se baseava a descrição do MusicCaps. Nessa altura, os críticos escolhiam qual das faixas achavam que correspondia melhor à descrição.

Segundo o documento publicado pela Google no arXiv, o MusicLM teve um desempenho superior ao das outras IAs, em todos os aspetos.

Assim, o MusicLM pode ser capaz de de produzir áudio muito semelhante ao da música produzida por humanos.

A Google diz que o futuro da plataforma poderá passar por resolver questões como  melhorar a qualidade geral do áudio e legalidade para o tornar público.

Teresa Campos, ZAP //

Deixe o seu comentário

Your email address will not be published.