Esta IA sobre-humana derrotou os principais profissionais do Texas Hold’em Poker


0
Esta IA sobre-humana derrotou os principais profissionais do Texas Hold'em Poker
Esta IA sobre-humana derrotou os principais profissionais do Texas Hold’em Poker

Recentemente, uma inteligência artificial da Carnegie Mellon University conseguiu derrotar quatro jogadores profissionais de poker jogando Texas Hold’em. Agora, os criadores desta IA acabaram de confirmar que esta IA tem uma capacidade sobre-humana de vencer este jogo.

Esta IA sobre-humana derrotou os principais profissionais do Texas Hold’em Poker

No início de 2017, Libratus, uma inteligência artificial da Carnegie Mellon University, conseguiu derrotar quatro jogadores profissionais de poker jogando Texas Hold’em. Agora, os criadores desta IA acabaram de confirmar que Libratus tem uma capacidade sobre-humana para vencer este jogo.

No estudo, publicado na Science, Tuomas Sandholm, professor de Ciência da Computação, e Noam Brown, seu aluno, detalha como sua inteligência artificial conseguiu dividir o jogo em partes computacionalmente gerenciáveis ​​e, com o jogo de seus oponentes, resolver possíveis Fraquezas em sua estratégia durante a competição. Ele fez isso com mais pontos de decisão do que os átomos têm no universo.

Os programas de IA derrotaram os melhores humanos no xadrez e no jogo, todos os jogos de desafio, mas em que ambos os jogadores sabem o estado exato do jogo o tempo todo. Os jogadores de pôquer, por outro lado, lidam com informações ocultas: quais cartas seus oponentes têm e se um oponente está blefando.

Em uma competição de 20 dias envolvendo 120.000 mãos no Rivers Casino em Pittsburgh, Libratus se tornou a primeira máquina a derrotar os melhores jogadores humanos no heads-up no-limit Texas Hold’em.

Libratus venceu cada um dos jogadores individualmente no jogo de dois jogadores e acumulou coletivamente mais de 2,1 milhões de dólares em fichas.

Ganhe sem analisar caras de pôquer

“As técnicas do Libratus não usam conhecimento especializado ou dados humanos e não são específicas do poker”, disseram Sandholm e Brown no documento. “Portanto, eles se aplicam a um grande número de conjuntos de informações imperfeitos.” Essas informações ocultas são infinitas nas interações estratégicas do mundo real, eles observaram, incluindo negociação de negócios, segurança cibernética, finanças, preços e aplicações militares.

Libratus inclui três módulos principais, o primeiro dos quais calcula uma abstração do jogo que é menor e mais fácil de resolver do que considerar 10^161 (o número 1 seguido de 161 zeros) possíveis pontos de decisão no jogo. Em seguida, ele cria sua própria estratégia detalhada para as primeiras rodadas do Texas Hold’em e uma estratégia aproximada para as rodadas posteriores. Um exemplo dessas abstrações no poker é agrupar mãos semelhantes e tratá-las de forma idêntica.

“Intuitivamente, há pouca diferença entre uma escada de rei alto e uma cor de rainha alta”, disse Brown. “Tratar essas mãos como idênticas reduz a complexidade do jogo e, portanto, facilita do ponto de vista computacional.”

Mas nas rodadas finais do jogo, um segundo módulo constrói uma nova abstração baseada no estado do jogo. Durante a competição de janeiro, Libratus fez esse cálculo usando o computador Bridges do Pittsburgh Supercomputing Center.

Cada vez que um oponente faz um movimento que não está na abstração, o módulo calcula uma solução para este subjogo que inclui o movimento do oponente. Sandholm e Brown chamam essa solução de subjogo aninhado.

O terceiro módulo é projetado para melhorar a estratégia do plano à medida que o jogo avança. Normalmente, disse Sandholm, os robôs usam aprendizado de máquina para encontrar erros na estratégia do oponente e explorá-los.

Em vez disso, o módulo de autoexecução do Libratus analisa o tamanho das apostas dos oponentes para detectar possíveis falhas na própria estratégia. Em seguida, o Libratus adiciona esses ramos de decisão ausentes, calcula estratégias para eles e os adiciona ao plano.

Além de bater profissionais humanos, Libratus foi avaliado contra a melhor inteligência artificial do poker. Estes incluem Baby Tartanian8, um bot desenvolvido por Sandholm e Brown que venceu o Concurso Anual de Poker de Computador de 2016 realizado em conjunto com a Associação para o Avanço da Conferência Anual de Inteligência Artificial.

As máquinas veem um jogo como uma árvore. Simplificando, de cada nó saem dois ramos, que são as possíveis decisões ou caminhos a serem tomados. Para cada um desses ramos brotam frutos, que são as possíveis reações do oponente. De acordo com a origem do fruto, surgirão outros dois ramos. Folhagens e frutas competem por um objetivo: alcançar a luz do sol.

Obviamente, nem todos os ramos são tão frondosos, nem todos os frutos tão comprometedores para eles. Olhar a árvore como um todo, de baixo para cima, nos daria uma visão do caminho ideal para chegar ao sol. Mas isso leva tempo. Por esse motivo, alguns galhos podem ser cortados com seus frutos, deixando-os mais estreitos.

As redes neurais são como jardineiros experientes. Eles podem aprender quais galhos são tipicamente os que alcançam mais alto ou aqueles que darão mais frutos. A experiência faz você pontuar os galhos de acordo com se eles são mais produtivos ou frondosos e assim ajudar a tomar decisões sobre onde podar.

Então, o que você pensa sobre isso? Basta compartilhar suas opiniões e pensamentos na seção de comentários abaixo.


Like it? Share with your friends!

0

What's Your Reaction?

hate hate
0
hate
confused confused
0
confused
fail fail
0
fail
fun fun
0
fun
geeky geeky
0
geeky
love love
0
love
lol lol
0
lol
omg omg
0
omg
win win
0
win

0 Comments

Your email address will not be published. Required fields are marked *