Essa I.A. acabou de se ensinar a andar

Por , em 12.07.2017

A empresa de inteligência artificial do Google, DeepMind, desenvolveu uma IA que aprendeu sozinha a andar, correr, pular e escalar, sem nenhuma orientação prévia.

Para isso, os cientistas do Google usaram aprendizagem de reforço, a prática de ensinar e orientar o comportamento usando um sistema de recompensa: o comportamento desejável produz recompensas; o comportamento indesejável não.

É uma ferramenta comum no aprendizado de máquinas, utilizada com sucesso pela DeepMind para que sua IA navegasse um curso de parkour.

O sistema

No seu nível mais básico, o sistema funciona da seguinte forma: quanto mais rápido a IA se move através do terreno, maiores são as recompensas. Foram adicionados incentivos e penalidades em níveis mais complexos.

Toda a navegação foi ensinada através da aprendizagem de reforço. A IA usou um sistema de teste e erro para descobrir como avançar o mais rápido possível sem “falhar”.

Vídeo

Três figuras diferentes foram utilizadas em três ambientes diferentes, com níveis de complexidade variáveis: o “caminhante planar”, o “quadrúpede” e o “humanoide”.

Como você pode perceber no vídeo abaixo, a DeepMind usa soluções criativas para contornar os obstáculos apresentados. Na maioria das vezes, o movimento que fornece a solução mais eficiente não possui um aspecto exatamente natural.

Isso apresenta possibilidades interessantes para futuras IAs, porque os robôs não precisam se restringir a movimentos semelhantes aos de seres humanos a fim de atingir os objetivos estabelecidos.

Será fascinante ver que efeito isso terá sobre o desenvolvimento de máquinas. [Engadget]

Deixe seu comentário!