Contabilidade Financeira: Go

28 janeiro 2019

AlphaZero

No final de 2018, a chinesa Ju Wenjun (rating de 2578, na data de hoje) confirmou o título mundial de xadrez feminino. Quase na mesma época, o norueguês Magnus Carlsen (rating de 2844, hoje) derrotou o desafiante Fabiano Caruana para manter seu título. Carlsen talvez seja o maior jogador na história do xadrez, acima de Fisher ou Kasparov. Também no final do ano, o programa Stockfish novamente ganhava o título de software de campeão de xadrez (rating de 3390).

A versão 8 do Stockfish pesquisa 70 milhões de posições por segundo. É algo realmente assombroso. Mas em dezembro, o Stockfish levou um surra de um programa que pesquisa somente 80 mil posições por segundo.

O AlphaZero é um software desenvolvido pela mesma empresa que criou o AlphaGo, que derrotou o campeão mundial de Go, um feito que muitas pessoas achavam que não ocorreria tão cedo. O programa foi programado para treinar com ele mesmo, sem usar jogos passados ou teoria. Apenas programação, com redes neurais. Com quatro horas de treinamento, o Alpha Zero estava jogando melhor que o Stockfish 8 (e melhor que Carlsen, obviamente). Depois de 9 horas de treino, o AlphaZero jogou 100 partidas de xadrez contra o Stockfish 8 e ganhou 28 e empatou 72.

Além disto, o AlphaZero joga também Go e Shoji (um tipo de jogo de estratégia japonês). Ele jogou contra a versão AlphaGo e venceu. Como o AlphaZero analisa menos posições, a qualidade da sua análise é muito melhor. O estilo de jogo do programa foi elogiado por Kasparov, o ex-campeão mundial de xadrez que foi derrotado por um antecessor, chamado DeepBlue.

Em razão dos resultados, o AlphaZero está sendo considerado hoje o auge da pesquisa de inteligência artificial no mundo. Conforme lembra um especialista da área:

(...) o próximo passo é usar suas capacidades para resolver problemas do mundo real - como o dobramento de proteínas, que é responsável por doenças como Alzheimer, Parkinson e fibrose cística. Mas ele também espera que o AlphaZero seja capaz de desenvolver materiais mais fortes e leves, melhores remédios e eventualmente se tornar flexível o suficiente para se adaptar a novas situações.

Enquanto o DeepBlue foi programado para jogar xadrez, o AlphaZero aprendeu a jogar xadrez. O próximo passo talvez seja colocar o AlphaZero para jogos com informações ocultas, como pôquer. O fato é tão relevante que deu origem a um artigo na prestigiosa revista Science, de Kasparov.

Nota 1: Aqui tem algumas das partidas. Em uma delas, o Alphazero sufoca o Stockfish com os peões.

Nota 2: Existem algumas críticas. O GM, e um dos maiores jogadores da atualidade, Nakamura (rating 2744 no tradicional, segundo melhor jogador do mundo no rápido e terceiro no blitz) chama a atenção para o fato das condições não serem as mesmas e que as partidas com o Stockfish não são comparáveis, pelo fato do AlphaZero estar usando um supercomputador. Ou seja, o hardware não era igual.

Nota 3: O Alphazero é uma empresa do Google.

Imagem, fonte aqui

16 fevereiro 2007

Inteligência artificial

Já postei anteriormente comentário sobre o fato dos computadores estarem derrotando os seres humanos no xadrez (clique aqui). Fiquei sabendo, através da The Economist (27/01/2007, Winning Ways, p.80) que ainda existe um jogo onde o homem derrota a máquina: o Go (clique aqui para ler sobre esse jogo).

Os programas batem os humanos no xadrez através da "força bruta". Ao analisar uma posição, o computador verifica todas as possibilidades nos próximos lances e escolhe a alternativa mais adequada. Ou seja, é realizado um cálculo de milhares de possibilidades. O ser humano trabalha pensando somente nas alternativas mais viáveis.

"Infelizmente, a força bruta não funciona no Go. Primeiro, o jogo tem muito mais possíveis posições do que o xadrez. Segundo, o número de possíveis movimentos para uma posição típica do Go é cerca de 200, comparado com cerca de doze no xadrez. Finalmente, avaliar uma posição do Go é difícil. Os mais rápidos programas podem estudar cerca de 50 posições por segundo, comparado com mais de 500 mil do xadrez."

Entretanto, a The Economist informa que os programadores estão fazendo melhorias com uma técnica denominada de análise de Monte Carlo. Essa técnica é mais rápida do que a força bruta. O resultado já está aparecendo: um programa desenvolvido por pesquisadores da Universidade de Paris já ocupa a posição 2323 no mundo no Go.

Contabilidade Financeira

Translate

Páginas

28 janeiro 2019

AlphaZero

01 março 2007

Links

16 fevereiro 2007

Inteligência artificial

Pesquisar este blog

Total de visualizações de página

Redes Sociais:

Coautores

Instagram

Arquivos

Tags

Seguidores

Contabilidade Financeira

Translate

Páginas

28 janeiro 2019

AlphaZero

01 março 2007

Links

16 fevereiro 2007

Inteligência artificial

Pesquisar este blog

Total de visualizações de página

Redes Sociais:

Coautores

Instagram

Arquivos

Tags

Seguidores

Inscrever-se