Técnicas usadas em treino de cães podem ser usadas para monitorizar robôs

Técnicas de treino regularmente usadas para ensinar cães foram agora usadas por uma equipa de investigadores, que mostrou que estes métodos também podem ser usados em robôs. Desta forma o robô Spot conseguiu aprender em dias o que normalmente demora um mês a adquirir.

Através do reforço positivo – uma abordagem bastante familiar quem já usou guloseimas para mudar o comportamento de um cão – a equipa melhorou a capacidade de Spot.

Andrew Hundt, do Laboratório de Robótica e Interação Computacional da Universidade Johns Hopkin, explica que “a questão aqui era como fazer com que o robô aprendesse algumas habilidades”, então o autor do estudo revela que “tive cães, então sei que a estratégia das recompensas funciona, por isso essa foi a inspiração para desenvolver o algoritmo de aprendizagem”.

Ao contrário dos humanos e animais que nascem com cérebros altamente intuitivos, os computadores são um autêntico quadro em branco e devem adquirir tudo do zero. Contudo, esta aprendizagem geralmente é realizada com tentativa e erro.

A equipa conseguiu criar um sistema de recompensas que é aplicado no robô da mesma forma que era usado num cão. Por exemplo, enquanto um cão pode ganhar um biscoito depois de realizar uma tarefa bem, o robô ganha pontos numéricos.

Para conseguir empilhar blocos o robô Spot precisava aprender como se concentrar em ações construtivas. Conforme o robô explorava os blocos, ia aprendendo rapidamente que comportamentos corretos deveria ter para que o empilhamento rendesse uma alta pontuação, sabendo que os incorretos não lhe atribuíam pontos.

Por exemplo, não agarrar um bloco ou derrubar uma torre deles não dava direito a pontos. A pontuação máxima foi atingida quando Spot conseguiu colocar o último bloco no topo de uma torre de quatro blocos.

A tática de treino funcionou. Para além de ser eficaz foi rápida pois demorou apenas alguns dias para ensinar ao robô o que normalmente era ensinado em semanas. Segundo Hundt, o robô está programado para querer alcançar a pontuação mais alta. Desta forma aprende rapidamente o comportamento certo para obter a melhor recompensa.

De acordo com o Futurity, o reforço positivo não funcionou apenas para ajudar o robô a aprender a empilhar blocos, mas também na execução de outras tarefas. A capacidade de aprender com os erros em todos os tipos de situações ajudou a que o robô possa se adaptar a novos ambientes.

A equipa acredita que esta descoberta pode ajudar a treinar robôs domésticos para lavar a loiça ou ajudar idosos a viver de forma independente. Os especialistas garantem que o objetivo é desenvolver robôs que possam realizar tarefas complexas.

Para já os investigadores não sabem como programar tarefas como essas. “Mas um trabalho como este mostra-nos que existe uma promessa na ideia de que os robôs podem aprender como realizar essas tarefas do mundo real e de uma forma segura e eficiente ”, revela o investigador no estudo que realizou e que foi publicado na IEEE Xplore em agosto.

ZAP ZAP //

PARTILHAR

RESPONDER

Cientistas descobrem o segredo das pessoas que vivem mais de 105 anos

Uma equipa de investigadores descobriu que os idosos que vivem mais de 105 anos tendem a possuir uma base genética única que torna os seus corpos mais eficazes na reparação de ADN. Esta é a primeira …

Quem já teve covid-19 pode agendar vacina em junho. No verão, vacinados podem vir a deixar máscara

Os doentes recuperados há mais de seis meses de infeção por SARS-CoV-2 vão poder marcar a sua vacinação através do portal de auto-agendamento a partir da primeira semana de junho, confirmou fonte da task force …

Governo aprova 11 milhões de euros para SIRESP de indemnização compensatória

A indemnização compensatória foi aprovada no dia em que o Presidente da República promulgou o decreto-lei que define o modelo transitório de gestão, operação, manutenção, modernização e ampliação da rede de comunicações do Estado SIRESP. O …

Tal como os humanos, há animais que podem sofrer ataques cardíacos (mas é raro)

Todos os dias milhões de pessoas no mundo são vítimas de ataques cardíacos. Mas será possível que também os animais possam passar por isto? Um ataque cardíaco ocorre quando um vaso sanguíneo que distribui sangue oxigenado …

Antigos corais revelam terramoto em "câmara lenta". Durou 32 anos

Uma equipa de investigadores descobriu um terramoto em "câmara lenta" que durou 32 anos - o mais lento já registado. O sismo levou eventualmente ao catastrófico terramoto de Sumatra em 1861. Terramotos de "câmara lenta" ou …

Astrónomos encontram uma das mais antigas estrelas do Universo

Uma equipa de investigadores descobriu uma estrela gigante vermelha a 16 mil anos-luz de distância que parece ser um membro da segunda geração de estrelas do Universo. Embora tenhamos uma boa compreensão da forma como o …

Marinha dos EUA está a desenvolver drones para matar ovos em ninhos de pássaros selvagens

A Marinha norte-americana e a empresa Hitron Technologies uniram esforços para desenvolver um drone autónomo projetado especificamente para procurar e destruir o maior inimigo da Marinha: os pássaros. Os drones, que estão já a ser testados …

Cientistas criam hologramas que se movem pelo ar

Uma equipa de cientistas da Universidade Brigham Young, nos Estados Unidos, conseguiu desenvolver um holograma que projeta imagens em movimento. Se é fã de Star Treck, ficará impressionado com a mais recente inovação. Um grupo de …

Gangue detido por falsificar a especiaria mais cara do mundo

As autoridades espanholas detiveram um gangue que fazia milhões de euros por ano a falsificar a especiaria mais cara do mundo: o açafrão. Os 17 membros da quadrilha foram detidos na região de Castela-Mancha. Os criminosos …

Santuário medieval recebe escultura em pedra que usa máscara contra a covid-19

Uma catedral histórica do Reino Unido renovou um santuário do século XIV, acrescentando um detalhe que coloca em evidência o momento pandémico que o mundo vive. Agora, a nova escultura está a usar uma máscara …