Inteligência Artificial desenvolvida pela Google aprendeu a andar sozinha

A empresa de inteligência artificial da Google, DeepMind, desenvolveu uma Inteligência Artificial que aprendeu sozinha a andar, correr, saltar e escalar, sem nenhuma orientação prévia.

Para tal, os cientistas do Google usaram uma aprendizagem de reforço, a prática de ensinar e orientar o comportamento através um sistema em que o comportamento desejável produz recompensas e o comportamento indesejável não.

No seu nível mais básico, o sistema funciona da seguinte forma: quanto mais rápido a Inteligência Artificial se movimenta através do terreno, maiores são as recompensas, sendo que foram adicionados incentivos e penalidades em níveis mais complexos.

Foram utilizadas três figuras diferentes em três ambientes diferentes, com níveis de complexidade variáveis: o “caminhante planar”, o “quadrúpede” e o “humanóide”.

A DeepMind utiliza soluções criativas para contornar os obstáculos apresentados mas, na maioria das vezes, o movimento que fornece a solução mais eficiente não possui um aspecto exactamente natural.

Um dos três estudos publicados pela empresa foca-se na definição do objetivo e descreve uma rede neural capaz de ensinar máquinas a navegar por percursos complexos usando um objetivo muito simples: o progresso horizontal.

Como os agentes tinham apenas o objetivo de ultrapassar os obstáculos e não instruções específicas sobre como se devem mover, o sistema de aprendizagem pode ser usado para agentes de qualquer tipo – desde aqueles que imitam comportamento humano, até outros tipos de robôs, como a aranha.

Mas, como não recebem instruções detalhadas, as Inteligências Artificiais podem desenvolver métodos extremamente ineficientes de se movimentar. Por isso, o segundo estudo realizado pela Deep Mind pretende usar de dados de captura de movimentos de humanos a andar para ensinar as máquinas a andar correctamente.

No entanto, as maneiras estranhas de andar que os robôs desenvolvem podem ser úteis em algumas situações, portanto o terceiro estudo divulgado pela empresa foca-se na transição entre comportamentos diferentes.

Para tal, a DeepMind criou um modelo que permite que os sistemas aprendam a imitar comportamentos observados. Assim, se um dos sistemas aprende, por exemplo, a andar em percursos inclinados, o outro consegue aprender a mesma coisa ao observar o primeiro. E não só: o robô também consegue entender quando tem de mudar de comportamento.

Os estudos foram elaborados com base em simulações mas, segundo os especialistas, a existência dos modelos de aprendizagem que permitem ensinar este tipo de movimentos a Inteligências Artificiais é um avanço muito importante.

PARTILHAR

1 COMENTÁRIO

RESPONDER

Mais duas mortes e 120 novos casos. Lisboa com 60% dos novos infetados

Portugal regista esta segunda-feira mais duas mortes, 120 novos casos de infeção por covid-19 e 160 curados em relação a segunda-feira, segundo o boletim diário da Direção-Geral da Saúde (DGS). O número de pessoas internadas é …

Encontrado cadáver com 30 anos em mansão abandonada em Paris

As obras de reforma numa mansão abandonada em Paris tiveram de ser suspensas inesperadamente depois de trabalhadores terem descoberto um cadáver a decompor-se na cave há 30 anos. De acordo com o jornal britânico The Guardian, …

Quase cem mil crianças contraíram a covid-19 em apenas duas semanas nos Estados Unidos

Noventa e sete mil crianças norte-americanas foram identificadas como infetadas com o novo coronavírus (covid-19) nas últimas semanas de julho. Os números relativos a estas duas semanas são avançados pela empresa norte-americana, que cita um relatório …

A1 terá novo acesso em Grijó no sentido sul/norte em 2021

A autoestrada A1 terá em 2021 um novo acesso em Grijó, concelho de Vila Nova de Gaia, no sentido sul/norte, revelou esta segunda-feira o presidente da autarquia que acredita que, com este projeto, o nó …

Tiros em frente à Casa Branca levam à retirada de Trump de conferência de imprensa

Um agente do Serviço Secreto retirou, esta segunda-feira, o Presidente norte-americano da sala na Casa Banca na qual estava a começar uma conferência de imprensa. O período em que Donald Trump esteve fora da sala foi …

Nani candidato a melhor jogador nos Estados Unidos

Internacional português e o colega João Moutinho (este para melhor jovem) estão na corrida para os prémios e também para o onze. Os futebolistas portugueses Nani e João Moutinho, ambos do Orlando City, estão entre os …

102 dias depois, coronavírus regressa à Nova Zelândia

A Nova Zelândia anunciou a sua primeira infeção por coronavírus transmitida localmente em 102 dias esta terça-feira, o que levou a primeira-ministra do país a emitir uma ordem de confinamento em Auckland, a maior cidade …

Taiwan acusa China de querer fazer da ilha o "próximo Hong Kong"

O ministro dos Negócios Estrangeiros de Taiwan, Joseph Wu, disse que há pressão da China sobre a ilha para aceitar condições políticas que farão de Taiwan o próximo Hong Kong. A Presidente de Taiwan recebeu esta …

Líderes do Líbano terão sido alertados sobre explosivos no porto de Beirute em julho

O Presidente do Líbano, Michel Aoun, e o primeiro-ministro, Hassan Diab, terão sido alertados em julho sobre a existência de 2.750 toneladas de nitrato de amónio armazenadas no porto de Beirute, avançou a agência Reuters. A …

OMS desiludida. Faltam pelo menos 90 mil milhões para investigação da vacina

O diretor da Organização Mundial de Saúde (OMS) afirmou, esta segunda-feira,  estar desiludido com a resposta global no combate à pandemia de covid-19. O responsável disse que faltam pelo menos 90 mil milhões de dólares do …