Um novo estudo concluiu que um modelo de IA treinado com humanos é capaz de identificar com bastante precisão o significado dos latidos dos cães.
Imagine compreender cada latido, lamento ou rosnado do seu cão. Esta possibilidade intrigante é o foco de um estudo recente apresentado na Conferência Internacional Conjunta sobre Linguística Computacional, Recursos Linguísticos e Avaliação.
Os investigadores estão a explorar a forma como a inteligência artificial (IA) pode interpretar as vocalizações dos cães, distinguindo potencialmente entre latidos de brincadeira e rosnados agressivos e até identificando características como a idade, a raça e o sexo do cão.
A equipa reuniu um conjunto de dados de latidos de 74 cães em Tepic e Puebla, no México. Os cães, com idades compreendidas entre os 5 e os 84 meses, eram predominantemente Chihuahuas, Caniches franceses e Schnauzers. As gravações foram efetuadas no ambiente doméstico natural dos cães para captar respostas vocais autênticas.
Os cães foram expostos a vários estímulos destinados a provocar diferentes tipos de vocalizações, tais como a presença de um estranho, interações lúdicas e ataques simulados ao dono. As vocalizações foram captadas com uma câmara Sony CX405 Handycam e apenas os componentes áudio foram utilizados para análise.
Os clips de áudio foram depois segmentados em partes mais curtas e anotados manualmente com base no contexto em que ocorreram. O processo de anotação resultou em 14 categorias distintas de vocalizações, tais como latidos muito agressivos para um estranho, latidos normais para um estranho e latidos de brincadeira durante jogos.
O núcleo da análise envolveu a utilização de um modelo sofisticado de IA conhecido como Wav2Vec2, inicialmente desenvolvido para o reconhecimento da fala humana. Os investigadores afinaram este modelo com o seu conjunto de dados de vocalizações de cães, explorando tarefas como a identificação de cães individuais, a determinação da raça, a previsão do género e a ligação dos latidos aos seus contextos específicos, explica o Psy Post.
O modelo de IA demonstrou uma capacidade notável para reconhecer cães individuais com base nos seus latidos, atingindo uma precisão de quase 50% em comparação com 24% para um modelo treinado apenas com vocalizações de cães. Este facto sugere que a pré-treino do discurso humano fornece uma base sólida para a compreensão das estruturas complexas das vocalizações dos animais.
O modelo de IA também identificou com êxito a raça de um cão a partir do seu ladrar, com uma taxa de precisão de 62%. Este resultado implica que as diferentes raças de cães têm padrões vocais distintos, semelhantes à forma como os sotaques podem ser identificados no discurso humano. No entanto, prever o género de um cão com base nas suas vocalizações revelou-se mais difícil, indicando que as pistas vocais relacionadas com o género podem ser menos distintas.
Por último, o modelo de IA foi excelente na fundamentação dos latidos nos seus contextos específicos, diferenciando entre vários tipos de latidos. Este facto sublinha os benefícios da utilização do pré-treino da fala humana para compreender as vocalizações dos animais.
Embora os resultados do estudo sejam promissores, pesquisas futuras devem incluir uma gama mais ampla de raças de cães e amostras mais diversas para garantir que os modelos de IA possam se generalizar em diferentes populações.