Ícone do site HypeScience

Esta inteligência artificial aprendeu sozinha, em questão de horas, a jogar xadrez, Go e shogi em um nível sobre-humano

Um novo programa de inteligência artificial do Google DeepMind, chamado AlphaZero, aprendeu a jogar três jogos de tabuleiro em questão de horas: xadrez, Go e shogi (essencialmente, xadrez japonês).

AlphaZero foi baseado em um programa anterior projetado para jogar apenas o jogo de tabuleiro chinês Go, AlphaGo.

Segundo o Google, a inteligência artificial (IA) mais recente atinge um nível de “desempenho sobre-humano”, dominando os jogos muito mais rápido que nós conseguiríamos.

Vantagens

O programa foi desenvolvido pela equipe de cientistas e engenheiros da computação do Google liderada por David Silver.

O que torna o AlphaZero tão impressionante é que ele não é específico; é flexível e pode aprender dentro de certos parâmetros. Sua programação inteligente aumenta sua jogabilidade, uma habilidade que tem sido reverenciada como um padrão de ouro na pesquisa de inteligência artificial.

Isso porque jogos interativos e estruturados são simplificações de cenários do mundo real: decisões difíceis devem ser tomadas; vitórias e derrotas aumentam as apostas; e previsão, pensamento crítico e estratégia são fundamentais.

Silver e sua equipe estão esperançosos de que algum dia verão um sistema similar aplicado ao desenvolvimento de medicamentos ou à ciência dos materiais.

Inovação

Codificar jogabilidade é complicado. Inteligências artificiais anteriores, incluindo os primeiros protótipos do original AlphaGo, são geralmente bombeadas de códigos e dados para imitar a experiência tipicamente ganha através de anos de jogabilidade natural humana.

O AlphaZero é diferente. Os pesquisadores deram ao programa apenas uma informação: as regras de um jogo em questão. Então, o sistema aprendeu sozinho os truques do próprio jogo.

Essa estratégia, chamada de aprendizado de reforço por autojogo, é exatamente o que parece: o AlphaZero joga exaustivamente contra si mesmo, aprimorando suas habilidades por tentativa e erro iteração após a iteração.

Como resultado, pode bater os melhores IAs do negócio não somente no Go, mas no xadrez e no shogi também.

O processo de aprendizado é impressionantemente eficiente, exigindo apenas duas, quatro ou 30 horas de autojogo para superar programas especificamente adaptados para dominar shogi, xadrez e Go, respectivamente.

AlphaZero também conseguiu derrotar o Stockfish (uma IA mestre de xadrez) e o Elmo (IA especialista em shogi), apesar de avaliar menos possíveis próximos movimentos durante o jogo. Mas como os algoritmos em questão são inerentemente diferentes e podem consumir quantidades diferentes de energia, é difícil comparar diretamente o AlphaZero com outros programas mais antigos.

Energia

Embora o Google não tenha divulgado tudo sobre o consumo de energia do programa, está claro que o AlphaZero precisa de uma quantidade considerável de munição computacional.

Seu regime de treino intensivo usou 5.000 unidades de processamento de aprendizado de máquina proprietárias do Google, ou TPUs, que, segundo algumas estimativas, consomem cerca de 200 watts por chip.

Em outras palavras, o AlphaZero requer muito mais energia do que um cérebro humano, que gira em torno de 20 watts.

Esse consumo absoluto de energia deve ser levado em consideração. O AlphaZero é poderoso, mas pode ser energeticamente muito caro. Seu benefício é que muito elástico – é admirável que o AlphaZero tenha usado a mesma arquitetura em três jogos diferentes.

IA x humanos

Mesmo que a expertise em jogos de tabuleiro requeira acuidade mental, muitos especialistas acreditam que é cedo para dizer que o AlphaZero seja “sobre-humano”.

Por exemplo, se surpreendido com um novo conjunto de regras no meio do jogo, o AlphaZero pode ficar desconcertado. O cérebro humano real, por outro lado, pode armazenar mais do que três jogos de tabuleiro em seu repertório.

Além disso, a IA não é capaz de aprender absolutamente tudo sozinha: os programadores ainda precisam alimentá-la com as regras do jogo. Tais regras poderiam constituir uma muleta significativa. O mundo está cheio de tarefas que não têm regras; será que o AlphaZero as desempenharia de forma tão inteligente?

Cientistas como Bin Yu, da Universidade da Califórnia em Berkeley (EUA), acreditam que o futuro não será de dominação robótica, e sim uma espécie de integração entre humanos e máquinas, em co-evolução. As máquinas certamente continuarão a se destacar em certas tarefas, mas a colaboração e a supervisão humanas podem ser sempre necessárias para compensar o que não pode ser automatizado.

Um artigo sobre a pesquisa foi publicado na revista científica Science. [SmithsonianMag]

Sair da versão mobile