A Inteligência Artificial está ainda mais perto de ser humana

O desenvolvimento da inteligência artificial depende da aprendizagem das máquinas. De certa forma, as máquinas precisam de aprender a aprender. E se a melhor forma de aprender é através dos nossos erros, estão no caminho certo.

Um novo algoritmo permite que a Inteligência Artificial (IA) aprenda com os seus próprios erros, quase como os seres humanos fazem.

Este avanço acontece graças a um novo algoritmo de código aberto chamado Hindsight Experience Replay (HER), desenvolvido por investigadores da empresa OpenAI, com sede nos EUA. Nos últimos meses, investigadores da OpenAI têm se concentrado no desenvolvimento do processo de aprendizagem da inteligência artificial.

O algoritmo ajuda um agente de IA a “olhar para trás” em retrospetiva, por assim dizer, à medida que completa uma tarefa. De acordo com a OpenAI, a máquina passa a interpretar as falhas como sucessos, para chegar ao resultado pretendido no início da tarefa.

“O ponto chave da HER é algo o que os humanos fazem intuitivamente: mesmo que não tenhamos sucesso num objetivo específico, pelo menos conseguimos um objetivo diferente. Então, por que não apenas fingir que queríamos atingir esse objetivo para começar, em vez do que pretendemos alcançar originalmente?”, explicam os investigadores.

“Ao fazer a substituição, o algoritmo de aprendizagem de reforço pode obter um sinal de aprendizagem, uma vez que alcançou um objetivo, esmo que não fosse esse o que pretendia originalmente. Se repetirmos esse processo, eventualmente aprenderemos a alcançar objetivos arbitrários, incluindo os objetivos que realmente queríamos alcançar”, assinalam.

Isso significa que todas as tentativas falhadas da inteligência artificial funcionam como outro objetivo “virtual” não planeado.

Acontece algo parecido connosco quando estamos a aprender. Quando tentamos andar de bicicleta pela primeira vez, não nos conseguimos equilibrar corretamente. Mesmo assim, essas tentativas ensinam-nos o que não fazer e o que evitar. Cada fracasso aproxima-nos do objetivo. É assim que os seres humanos aprendem – e agora as máquinas também.

Com a HER, o OpenAI quer que as suas inteligências artificiais aprendam da mesma forma. Ao mesmo tempo, o método tornar-se-á uma alternativa ao sistema de recompensas usual envolvido em modelos de reforço de aprendizagem.

Para ensinar a IA a aprender por conta própria, ela tem que trabalhar com um sistema de recompensas. Os sistemas usados hoje ou dão cookies para a inteligência artificial quando esta alcança o objetivo – e não quando não alcança, ou dão cookies dependendo de quão perto a IA está de atingir o seu objetivo.

Nenhum dos métodos é perfeito. O primeiro não dá espaço para a aprendizagem, enquanto o segundo pode ser bastante complicado de implementar.

Ao tratar cada tentativa como um objetivo em retrospetiva, HER dá a um agente de IA uma recompensa mesmo quando na verdade ele não conseguiu realizar a tarefa especificada. Isso ajuda a inteligência artificial a aprender mais rápido e com maior qualidade.

No vídeo abaixo, é possível ver como isso funciona na prática. São mostradas diversas tarefas feitas pela HER e por outra inteligência artificial. A aprendizagem do novo sistema tem resultados muito melhores.

Este método não significa que o HER facilita completamente a aprendizagem. “Aprender com HER em robôs reais ainda é difícil, pois ainda requer uma quantidade significativa de amostra”, aponta Matthias Plappert, da OpenAI.

Em qualquer caso, como as simulações da OpenAI demonstraram, esta pode ser bastante útil para “encorajar” os agentes de IA para aprender com os seus erros.

PARTILHAR

1 COMENTÁRIO

Detidos 21 suspeitos de desviarem fundos para financiar Puigdemont na Bélgica

A operação da polícia espanhola contra o alegado desvio de fundos públicos para financiar as despesas do ex-presidente regional catalão Carles Puigdemont fugido na Bélgica resultou hoje em 21 detidos ligados ao movimento independentista na …

Ativista detido depois de tentar retirar uma escultura indonésia do Museu do Louvre

Mwazulu Diyabanza foi detido na semana passada em Paris, depois de tentar retirar uma escultura indonésia do Louvre. O ativista congolês disse que a ação foi parte de um protesto para que os museus europeus …

Proteção Civil do Porto já pediu recolher obrigatório e recomenda novo estado de emergência

A Proteção Civil do distrito do Porto já avançou com o pedido ao Governo de recolher obrigatório para a região. Marco Martins sugere ainda o regresso ao estado de emergência. Marco Martins, responsável pela proteção Civil …

Exames nacionais de 2021 mantêm normas excecionais criadas no anterior ano letivo

Os professores vão voltar a contabilizar, na classificação dos próximos exames nacionais, apenas as respostas às perguntas obrigatórias e àquelas em que o aluno tenha melhor pontuação, à semelhança das normas excecionais aplicadas no ano …

PSD-Madeira critica preços "pornográficos" e "obscenos" nas viagens da TAP no Natal

O PSD-Madeira voltou nesta quarta-feira a criticar os preços praticados pela TAP nas viagens para a região, referindo que na época do Natal chegam a atingir 1.143 euros, e considerou os valores “pornográficos” e “obscenos”. “São …

Autarca de Roma revela que máfia italiana planeou um ataque contra si e a sua família

A presidente da Câmara de Roma, Virginia Raggi, revelou que grupos do crime organizado planearam matá-la e a sua família porque ela os estava a atacar em partes da capital italiana que dominam. Aos 37 anos, …

OE2021. "Quem vota contra quer outro modelo ou desistiu de melhorar o SNS", diz Temido

A ministra da Saúde, Marta Temido, sustentou esta quarta-feira que os partidos que vão votar contra o Orçamento do Estado para 2021 querem outro modelo de sistema de saúde ou desistiram de melhorar o SNS. Numa …

Mais 3.960 casos e 24 mortes. É o pior dia desde o início da pandemia

Portugal registou nas últimas 24 horas mais 3.960 casos positivos e 24 mortes por covid-19. Os dados foram divulgados no mais recente boletim epidemiológico da Direção-Geral da Saúde (DGS). Este foi o pior dia desde o …

Reconhecimento para cuidadores informais vai ser mais fácil e rápido

O pedido de estatuto de cuidador informal fica, a partir de hoje, mais fácil, deixando de ser necessário apresentar atestado médico e permitindo que documentos que impliquem atos médicos possam ser apresentados posteriormente. De acordo com …

OE2021 ainda não foi votado, mas já se espera um aumento da despesa em mais de 300 milhões

Entre a entrega da proposta e a votação, o Governo voltou a negociar com os partidos, mostrando abertura para medidas na especialidade que deverão custar pelo menos mais 300 milhões de euros. O Orçamento do Estado …