A Inteligência Artificial está ainda mais perto de ser humana

O desenvolvimento da inteligência artificial depende da aprendizagem das máquinas. De certa forma, as máquinas precisam de aprender a aprender. E se a melhor forma de aprender é através dos nossos erros, estão no caminho certo.

Um novo algoritmo permite que a Inteligência Artificial (IA) aprenda com os seus próprios erros, quase como os seres humanos fazem.

Este avanço acontece graças a um novo algoritmo de código aberto chamado Hindsight Experience Replay (HER), desenvolvido por investigadores da empresa OpenAI, com sede nos EUA. Nos últimos meses, investigadores da OpenAI têm se concentrado no desenvolvimento do processo de aprendizagem da inteligência artificial.

O algoritmo ajuda um agente de IA a “olhar para trás” em retrospetiva, por assim dizer, à medida que completa uma tarefa. De acordo com a OpenAI, a máquina passa a interpretar as falhas como sucessos, para chegar ao resultado pretendido no início da tarefa.

“O ponto chave da HER é algo o que os humanos fazem intuitivamente: mesmo que não tenhamos sucesso num objetivo específico, pelo menos conseguimos um objetivo diferente. Então, por que não apenas fingir que queríamos atingir esse objetivo para começar, em vez do que pretendemos alcançar originalmente?”, explicam os investigadores.

“Ao fazer a substituição, o algoritmo de aprendizagem de reforço pode obter um sinal de aprendizagem, uma vez que alcançou um objetivo, esmo que não fosse esse o que pretendia originalmente. Se repetirmos esse processo, eventualmente aprenderemos a alcançar objetivos arbitrários, incluindo os objetivos que realmente queríamos alcançar”, assinalam.

Isso significa que todas as tentativas falhadas da inteligência artificial funcionam como outro objetivo “virtual” não planeado.

Acontece algo parecido connosco quando estamos a aprender. Quando tentamos andar de bicicleta pela primeira vez, não nos conseguimos equilibrar corretamente. Mesmo assim, essas tentativas ensinam-nos o que não fazer e o que evitar. Cada fracasso aproxima-nos do objetivo. É assim que os seres humanos aprendem – e agora as máquinas também.

Com a HER, o OpenAI quer que as suas inteligências artificiais aprendam da mesma forma. Ao mesmo tempo, o método tornar-se-á uma alternativa ao sistema de recompensas usual envolvido em modelos de reforço de aprendizagem.

Para ensinar a IA a aprender por conta própria, ela tem que trabalhar com um sistema de recompensas. Os sistemas usados hoje ou dão cookies para a inteligência artificial quando esta alcança o objetivo – e não quando não alcança, ou dão cookies dependendo de quão perto a IA está de atingir o seu objetivo.

Nenhum dos métodos é perfeito. O primeiro não dá espaço para a aprendizagem, enquanto o segundo pode ser bastante complicado de implementar.

Ao tratar cada tentativa como um objetivo em retrospetiva, HER dá a um agente de IA uma recompensa mesmo quando na verdade ele não conseguiu realizar a tarefa especificada. Isso ajuda a inteligência artificial a aprender mais rápido e com maior qualidade.

No vídeo abaixo, é possível ver como isso funciona na prática. São mostradas diversas tarefas feitas pela HER e por outra inteligência artificial. A aprendizagem do novo sistema tem resultados muito melhores.

Este método não significa que o HER facilita completamente a aprendizagem. “Aprender com HER em robôs reais ainda é difícil, pois ainda requer uma quantidade significativa de amostra”, aponta Matthias Plappert, da OpenAI.

Em qualquer caso, como as simulações da OpenAI demonstraram, esta pode ser bastante útil para “encorajar” os agentes de IA para aprender com os seus erros.

PARTILHAR

1 COMENTÁRIO

RESPONDER

Revelada origem das galáxias mais "extremas"

Os astrónomos descobriram que a chave para entender as galáxias com tamanhos "extremos", pequenas ou grandes, pode estar nos seus arredores. Em dois estudos relacionados, uma equipa internacional descobriu que as galáxias que são "ultracompactas" ou …

Cientista sugere construir abrigos em Marte com polímeros de insetos e solo marciano

Um cientista da Universidade de Tecnologia e Design de Singapura desenvolveu uma tecnologia à base de quitina que poderia ser utilizada para produzir ferramentas e abrigos marcianos. Javier Fernandez e os seus colegas utilizaram substâncias químicas …

Mergulhadores terão encontrado o USS Grenadier, um submarino norte-americano perdido na 2.ª Guerra

O submarino norte-americano USS Grenadier, perdido durante a II Guerra Mundial, terá sido encontrado por mergulhadores no estreito de Malaca, perto da Tailândia. Os mergulhadores acreditam ter encontrado no estreito de Malaca, a 150 quilómetros a …

Justiça angolana manda encerrar todos os templos da IURD em Angola

A justiça angolana ordenou o encerramento e apreensão de todos os templos da Igreja Universal do Reino de Deus (IURD) em Angola, estando o processo de selagem a ser feito “de forma gradual”, disse à …

"Reality show" afirma que vai enviar concorrente à Estação Espacial Internacional

Space Hero, uma unidade de produção com sede nos Estados Unidos que afirma ser a "primeira empresa de media espacial", alega que garantiu um lugar numa missão da SpaceX para a Estação Espacial Internacional de …

Oceanbird: O navio movido a energia eólica que vai revolucionar a indústria da navegação

A transportadora Oceanbird deverá transportar 7 mil carros e será movido a energia eólica, e por isso deverá tornar o processo de deslocação de veículos mais sustentável. De acordo com um relatório do The Driven, um …

"Esqueceu-se disto". Parque Nacional na Tailândia envia lixo deixado pelos visitantes por correio

Se deitar lixo ao chão no Parque Nacional Khao Yai, na Tailândia, esse mesmo lixo será enviado de volta para sua casa. Os infratores também serão registados na polícia local. O Parque Nacional Khao Yai, no …

Banco britânico HSBC permitiu branqueamento de esquema de Ponzi de milhões de dólares

O banco britânico HSBC permitiu que fossem transferidos milhões de dólares para todo o mundo de forma fraudulenta, mesmo depois de ter tomado conhecimento da fraude, de acordo com documentos secretos revelados, divulgou hoje a …

Este é o primeiro aeroporto 5 estrelas do mundo devido aos seus protocolos contra covid-19

A Skytrax, órgão que examina e classifica aeroportos em todo o mundo, costuma chamar a atenção do setor pelo menos uma vez por ano, durante a sua cerimónia de prémios. Este ano, o World Airline Awards, …

Há alguma ligação entre stress, insónias e sistema imunitário? Estudo americano sugere que sim

Um estudo realizado por neuro-cientistas da Universidade de Stanford, nos Estados Unidos, sugere que poderá existir uma relação entre o stress, as insónias e um fraco sistema imunitário. Investigadores do laboratório Cold Spring Harbor e da …