Proposta:

Download

Contextualização:

Hex é um jogo de tabuleiro jogado em uma grade hexagonal, esta grade pode ter qualquer forma ou tamanho mas tradicionalmente ela é utilizada na forma de um losango de dimensões 11x11 ou 13x13 com cada par de lados opostos de uma cor. Nele dois jogadores se alternam colocando peças em um espaço vazio do tabuleiro, ganha quem conseguir conectar os dois lados opostos do tabuleiro respectivo a sua cor.
Apesar de suas regras simples, Hex tem uma grande profundidade estratégica e já foi estudado diversas vezes. O famoso matemático John Nash foi um dos criadores do jogo e provou que é impossível haver empates. Hex também é muito utilizado para testar inteligencias artificiais devido ao seu elevado número de configurações possíveis, computadores já resolveram o todas as aberturas em um tabuleiro 9x9 e duas aberturas quando jogado 10x10.

Motivação:

Em 2016 o programa AlphaGo, desenvolvido pela Alphabet Inc.'s, se tornou a primeira IA a ganhar de um campeão mundial de Go sem nenhum tipo de handicap. Feitos como este já aconteceram antes, como por exemplo o famoso computador Deep Blue que derrotou Garry Kasparov quando ele tinha o título de campeão mundial. Apesar disto ter ocorrido em 1997, o jogo de Go era considerado por muitos o jogo mais complexo que existe e portanto, muito dificil de se criar uma IA.
O resultado da AlphaGo se mostrou tão impressionante que foi inclusive considerado um dos maiores avanços científicos do ano e atraiu atenção de todo o globo. Diante disto o estudo de "machine learning" e dos algorítmos que permitiram tal feito se mostram de grande importância, não somente pelo o que já conquistaram, mas principalmente pelas possibilidades que podem trazer.

Objetivo:

Desta forma, este projeto tem como objetivo aprofundar o conhecimento em inteligência artificial e machine learning. Por fim, objetiva-se construir uma implementação do que foi estudado de forma a ser aplicado num jogo mais simples, Hex, para desta forma trabalhar o lado prático deste campo de estudos.

Metodologia:

A metodologia consistirá da pesquisa sobre reinforcement e deep learning além dos algorítmos necessários a estes campos como, deep Q-learning e árvore de busca de Monte-Carlo. O estudo da bibliografia também é de suma importância para a construção do projeto. Além da parte de pesquisa, será construida uma IA que implementa as técnicas estudadas a cima.

Cronograma:

Abril: Estudo e pesquisa das plataformas e requisitos necessários para poder vizualizar o jogo de Hex e executar outras IAs já existentes.

Maio-Junho: Pesquisa sobre os algorítmos de
Q-learning, deep learning, árvore de busca de Monte-Carlo e deep Q-learning.

Julho: Início da implementação do programa.

Agosto-Novembro: Implementação da IA e escrita da monografia.