Essa I.A. acabou de se ensinar a andar
A empresa de inteligência artificial do Google, DeepMind, desenvolveu uma IA que aprendeu sozinha a andar, correr, pular e escalar, sem nenhuma orientação prévia.
Para isso, os cientistas do Google usaram aprendizagem de reforço, a prática de ensinar e orientar o comportamento usando um sistema de recompensa: o comportamento desejável produz recompensas; o comportamento indesejável não.
É uma ferramenta comum no aprendizado de máquinas, utilizada com sucesso pela DeepMind para que sua IA navegasse um curso de parkour.
O sistema
No seu nível mais básico, o sistema funciona da seguinte forma: quanto mais rápido a IA se move através do terreno, maiores são as recompensas. Foram adicionados incentivos e penalidades em níveis mais complexos.
Toda a navegação foi ensinada através da aprendizagem de reforço. A IA usou um sistema de teste e erro para descobrir como avançar o mais rápido possível sem “falhar”.
Vídeo
Três figuras diferentes foram utilizadas em três ambientes diferentes, com níveis de complexidade variáveis: o “caminhante planar”, o “quadrúpede” e o “humanoide”.
Como você pode perceber no vídeo abaixo, a DeepMind usa soluções criativas para contornar os obstáculos apresentados. Na maioria das vezes, o movimento que fornece a solução mais eficiente não possui um aspecto exatamente natural.
Isso apresenta possibilidades interessantes para futuras IAs, porque os robôs não precisam se restringir a movimentos semelhantes aos de seres humanos a fim de atingir os objetivos estabelecidos.
Será fascinante ver que efeito isso terá sobre o desenvolvimento de máquinas. [Engadget]