Técnicas usadas em treino de cães podem ser usadas para monitorizar robôs

Técnicas de treino regularmente usadas para ensinar cães foram agora usadas por uma equipa de investigadores, que mostrou que estes métodos também podem ser usados em robôs. Desta forma o robô Spot conseguiu aprender em dias o que normalmente demora um mês a adquirir.

Através do reforço positivo – uma abordagem bastante familiar quem já usou guloseimas para mudar o comportamento de um cão – a equipa melhorou a capacidade de Spot.

Andrew Hundt, do Laboratório de Robótica e Interação Computacional da Universidade Johns Hopkin, explica que “a questão aqui era como fazer com que o robô aprendesse algumas habilidades”, então o autor do estudo revela que “tive cães, então sei que a estratégia das recompensas funciona, por isso essa foi a inspiração para desenvolver o algoritmo de aprendizagem”.

Ao contrário dos humanos e animais que nascem com cérebros altamente intuitivos, os computadores são um autêntico quadro em branco e devem adquirir tudo do zero. Contudo, esta aprendizagem geralmente é realizada com tentativa e erro.

A equipa conseguiu criar um sistema de recompensas que é aplicado no robô da mesma forma que era usado num cão. Por exemplo, enquanto um cão pode ganhar um biscoito depois de realizar uma tarefa bem, o robô ganha pontos numéricos.

Para conseguir empilhar blocos o robô Spot precisava aprender como se concentrar em ações construtivas. Conforme o robô explorava os blocos, ia aprendendo rapidamente que comportamentos corretos deveria ter para que o empilhamento rendesse uma alta pontuação, sabendo que os incorretos não lhe atribuíam pontos.

Por exemplo, não agarrar um bloco ou derrubar uma torre deles não dava direito a pontos. A pontuação máxima foi atingida quando Spot conseguiu colocar o último bloco no topo de uma torre de quatro blocos.

A tática de treino funcionou. Para além de ser eficaz foi rápida pois demorou apenas alguns dias para ensinar ao robô o que normalmente era ensinado em semanas. Segundo Hundt, o robô está programado para querer alcançar a pontuação mais alta. Desta forma aprende rapidamente o comportamento certo para obter a melhor recompensa.

De acordo com o Futurity, o reforço positivo não funcionou apenas para ajudar o robô a aprender a empilhar blocos, mas também na execução de outras tarefas. A capacidade de aprender com os erros em todos os tipos de situações ajudou a que o robô possa se adaptar a novos ambientes.

A equipa acredita que esta descoberta pode ajudar a treinar robôs domésticos para lavar a loiça ou ajudar idosos a viver de forma independente. Os especialistas garantem que o objetivo é desenvolver robôs que possam realizar tarefas complexas.

Para já os investigadores não sabem como programar tarefas como essas. “Mas um trabalho como este mostra-nos que existe uma promessa na ideia de que os robôs podem aprender como realizar essas tarefas do mundo real e de uma forma segura e eficiente ”, revela o investigador no estudo que realizou e que foi publicado na IEEE Xplore em agosto.

ZAP //

PARTILHAR

RESPONDER

"Era como se a morte estivesse num copo." No século XVIII, o gin estava a arruinar a Inglaterra

A bebida alcoólica tornou-se tão popular no Reino Unido que os empresários começaram a utilizar todo o tipo de aditivos para enriquecerem. No século XVIII, o gin tornou-se a maior droga que o homem poderia consumir …

Vacinar animais contra a covid-19? Dezenas de zoos nos EUA estão a avançar com a ideia

Cerca de 70 jardins zoológicos e espaços de conservação nos Estados Unidos estão a administrar a vacina da farmcêutica veterinária Zoetis aos seus animais. Não são só os humanos que estão a ser vacinados contra a …

Lewis Hamilton: "Eu não disse que estava a morrer"

Acidente com Max Verstappen originou dores no campeão; Helmut Marko disse que já era "espectáculo" a mais. Troca de palavras entre os dois candidatos ao título. Como se esperava, o acidente que envolveu Lewis Hamilton e …

Autorretrato de Frida Kahlo deverá ser vendido por um valor recorde de 30 milhões de dólares

A Sotheby’s espera ultrapassar os 30 milhões de dólares (mais de 25 milhões de euros) com o autorretrato da pintora mexicana Frida Kahlo, no qual aparece também o seu marido Diego Rivera. O autorretrato Diego y …

David Luiz: "Um dos dias mais especiais da minha vida" - e ainda se fala sobre Jorge Jesus

Flamengo ficou mais próximo de mais uma final da Libertadores, depois de derrotar o Barcelona de Guayaquil. David Luiz estreou-se. O Flamengo venceu o Barcelona de Guayaquil por 2-0, na primeira "mão" das meias-finais da Copa …

Iémen. Escassez de alimentos empurra 16 milhões de pessoas para a fome, revela ONU

Pelo menos 5 milhões de pessoas no Iémen estão à beira da fome e outros 16 milhões estão "a caminhar para a fome", num país dilacerado pela guerra civil. O Programa Mundial de Alimentos (WFP, na …

Presidente da Tunísia governará por decreto, ignorando partes da constituição

O Presidente da Tunísia, Kais Saied, declarou que governará por decreto e ignorará partes da constituição, enquanto se prepara para mudar o sistema político, gerando críticas imediatas da oposição. Desde 25 de julho, dia em que …

Alemanha deixa de pagar quarentena a trabalhadores não vacinados

A Alemanha vai deixar de indemnizar trabalhadores não vacinados que forem forçados a quarentena devido ao coronavírus, por ser "injusto pedir aos contribuintes que subsidiem aqueles que se recusam a ser vacinados", disse na quarta-feira …

Governo acaba com recomendação do teletrabalho

O Conselho de Ministros decidiu acabar com a recomendação da opção pelo teletrabalho e eliminar a testagem em locais de trabalho com mais de 150 trabalhadores. Estas medidas integram a terceira e última fase do plano …

Cansado de denúncias, Betis pede aos seus sócios: "Portem-se bem"

Clube onde jogam dois portugueses quer que os adeptos tenham um "comportamento adequado" durante os jogos no Benito Villamarín. O Betis de Sevilha jogou seis vezes até agora, nesta época. Quatro desses encontros foram disputados em …