Translate

Mostrando postagens com marcador Go. Mostrar todas as postagens
Mostrando postagens com marcador Go. Mostrar todas as postagens

28 janeiro 2019

AlphaZero

No final de 2018, a chinesa Ju Wenjun (rating de 2578, na data de hoje) confirmou o título mundial de xadrez feminino. Quase na mesma época, o norueguês Magnus Carlsen (rating de 2844, hoje) derrotou o desafiante Fabiano Caruana para manter seu título. Carlsen talvez seja o maior jogador na história do xadrez, acima de Fisher ou Kasparov. Também no final do ano, o programa Stockfish novamente ganhava o título de software de campeão de xadrez (rating de 3390).

A versão 8 do Stockfish pesquisa 70 milhões de posições por segundo. É algo realmente assombroso. Mas em dezembro, o Stockfish levou um surra de um programa que pesquisa somente 80 mil posições por segundo.

O AlphaZero é um software desenvolvido pela mesma empresa que criou o AlphaGo, que derrotou o campeão mundial de Go, um feito que muitas pessoas achavam que não ocorreria tão cedo. O programa foi programado para treinar com ele mesmo, sem usar jogos passados ou teoria. Apenas programação, com redes neurais. Com quatro horas de treinamento, o Alpha Zero estava jogando melhor que o Stockfish 8 (e melhor que Carlsen, obviamente). Depois de 9 horas de treino, o AlphaZero jogou 100 partidas de xadrez contra o Stockfish 8 e ganhou 28 e empatou 72.

Além disto, o AlphaZero joga também Go e Shoji (um tipo de jogo de estratégia japonês). Ele jogou contra a versão AlphaGo e venceu. Como o AlphaZero analisa menos posições, a qualidade da sua análise é muito melhor. O estilo de jogo do programa foi elogiado por Kasparov, o ex-campeão mundial de xadrez que foi derrotado por um antecessor, chamado DeepBlue.

Em razão dos resultados, o AlphaZero está sendo considerado hoje o auge da pesquisa de inteligência artificial no mundo. Conforme lembra um especialista da área:

(...) o próximo passo é usar suas capacidades para resolver problemas do mundo real - como o dobramento de proteínas, que é responsável por doenças como Alzheimer, Parkinson e fibrose cística. Mas ele também espera que o AlphaZero seja capaz de desenvolver materiais mais fortes e leves, melhores remédios e eventualmente se tornar flexível o suficiente para se adaptar a novas situações.

Enquanto o DeepBlue foi programado para jogar xadrez, o AlphaZero aprendeu a jogar xadrez. O próximo passo talvez seja colocar o AlphaZero para jogos com informações ocultas, como pôquer. O fato é tão relevante que deu origem a um artigo na prestigiosa revista Science, de Kasparov.

Nota 1: Aqui tem algumas das partidas. Em uma delas, o Alphazero sufoca o Stockfish com os peões.

Nota 2: Existem algumas críticas. O GM, e um dos maiores jogadores da atualidade, Nakamura (rating 2744 no tradicional, segundo melhor jogador do mundo no rápido e terceiro no blitz) chama a atenção para o fato das condições não serem as mesmas e que as partidas com o Stockfish não são comparáveis, pelo fato do AlphaZero estar usando um supercomputador. Ou seja, o hardware não era igual.

Nota 3: O Alphazero é uma empresa do Google.

Imagem, fonte aqui

16 fevereiro 2007

Inteligência artificial

Já postei anteriormente comentário sobre o fato dos computadores estarem derrotando os seres humanos no xadrez (clique aqui). Fiquei sabendo, através da The Economist (27/01/2007, Winning Ways, p.80) que ainda existe um jogo onde o homem derrota a máquina: o Go (clique aqui para ler sobre esse jogo).

Os programas batem os humanos no xadrez através da "força bruta". Ao analisar uma posição, o computador verifica todas as possibilidades nos próximos lances e escolhe a alternativa mais adequada. Ou seja, é realizado um cálculo de milhares de possibilidades. O ser humano trabalha pensando somente nas alternativas mais viáveis.

"Infelizmente, a força bruta não funciona no Go. Primeiro, o jogo tem muito mais possíveis posições do que o xadrez. Segundo, o número de possíveis movimentos para uma posição típica do Go é cerca de 200, comparado com cerca de doze no xadrez. Finalmente, avaliar uma posição do Go é difícil. Os mais rápidos programas podem estudar cerca de 50 posições por segundo, comparado com mais de 500 mil do xadrez."

Entretanto, a The Economist informa que os programadores estão fazendo melhorias com uma técnica denominada de análise de Monte Carlo. Essa técnica é mais rápida do que a força bruta. O resultado já está aparecendo: um programa desenvolvido por pesquisadores da Universidade de Paris já ocupa a posição 2323 no mundo no Go.