giochi

L’intelligenza artificiale di Facebook vince a poker contro campioni umani

di Luca Tremolada


default onloading pic

2' di lettura

Un programma di intelligenza artificiale sviluppato dalla Carnegie Mellon University, in collaborazione con Facebook AI, ha sconfitto giocatori professionisti a poker nella variante Texas Hold'em, la più popolare negli Stati Uniti. L'AI chiamata Pluribus ha battuto Darren Elias, giocatore professionista che detiene il record per la maggior parte dei titoli del World Poker Tour, e Chris «Jesus» Ferguson, vincitore di sei eventi delle World Series of Poker. Nel 2015 un sistema di intelligenza artificiale c’era già riuscito ma solo nella variante a due giocatori, questa volta al tavolo erano seduti in sei.

VIDEO - L’intelligenza artificiale di Google batte il campione di Go

Come è andata? Ci ha messo 12 giorni e 10.000 mani per avere la meglio su 12 professionist impegnata in due diverse modalità. Nella prima, l'intelligenza artificiale ha giocato al fianco di cinque giocatori umani; nell'altro, cinque versioni dell'IA giocate con un giocatore umano (senza mettersi d’accordo). Pluribus ha vinto in media 5 dollari per mano con vincite orarie di circa 1.000 dollari.

La sfida per l’Ai. In un articolo pubblicato sulla rivista scientifica Science , gli scienziati di Pluribus hanno spiegato che la vittoria è una pietra miliare significativa nella ricerca di intelligenza artificiale.
Ricordiamo che il computer in passato ha già prevalso negli scacchi, ai quiz e nell’antico gioco cinese Go (e in videogame strategici come Starcraft II e Dota). Con il Texas Hold’em a sei giocatori - secondo loro - la macchina avrebbe compiuto un salto di qualità.

Come funziona. Il poker come sappiamo è un gioco dove l’informazione è imperfetta. In Go la sfida per l’Ai è tracciare le mosse. Lo sforzo è calcolare tutte le variabili per ogni mossa che nel caso di Go sono particolarmente alte. A differenza del poker le informazioni in Go sono, come dire, tutte sul tavolo, disponibili a tutti i giocatori senza asimmetrie. Il che rende più facile, in un certo senso, addestrare gli algoritmi di machine learning.

Il bluff. Per affrontare la complessità di sei giocatori, i ricercatori dopo avere sottoposto l’AI a centinaia sessioni di gioco contro se stessa, hanno introdotto una funzione di ricerca che al posto di calcolare tutte le possibili combinazioni di mosse fino alla fine della partita, limitava la simulazione a due o tre mosse. Il passo in avanti, dovuto anche alla complessità del calcolo è stato appunto quello di sacrificare una strategia a lungo termine. Come hanno sottolineato i giocatori professionisti, Pluribus ha bluffato anche su puntate basse rendendosi così per certi versi imprevedibile. Per il computer bluffare - si legge su un articolo di Techcrunch - non è mentire ma persegure la strategia migliore per fare più soldi. Come dargli torto.

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti
Loading...