In neemEsiste un numero limitato di mosse ottimali per una determinata configurazione del tabellone. Se non ne giochi una, essenzialmente cedi il controllo al tuo avversario, che può vincere giocando solo le mosse migliori. E ancora, la mossa ottimale può essere identificata valutando una funzione matematica di uguaglianza.

Quindi, c’è motivo di pensare che il processo di formazione che ha funzionato per gli scacchi potrebbe non funzionare neem. Ciò che sorprende è quanto fosse davvero grave. Zhou e Riis lo hanno scoperto per esempio neem Scheda con cinque righe, l’intelligenza artificiale è migliorata abbastanza rapidamente e stava ancora migliorando dopo 500 iterazioni di allenamento. Ma l’aggiunta di un’altra riga rallenta notevolmente il tasso di miglioramento. E, per il tabellone a sette file, i miglioramenti prestazionali si sono sostanzialmente fermati quando l’IA è stata giocata 500 volte.

Per illustrare meglio il problema, i ricercatori hanno scambiato il sottosistema che suggeriva possibili azioni con uno che operava in modo casuale. Sette file neem A bordo, le prestazioni delle versioni addestrate e casuali sono indistinguibili oltre 500 guadagni di allenamento. Fondamentalmente, una volta che il tabellone è diventato abbastanza grande, il sistema non è stato in grado di imparare osservando il risultato del gioco. Lo stato iniziale della configurazione a sette file prevede tre mosse possibili, che corrispondono tutte alla vincita finale. Tuttavia, quando al valutatore di mosse addestrato del loro sistema è stato chiesto di esaminare tutte le mosse possibili, ha valutato ciascuna come più o meno equivalente.

I ricercatori hanno concluso che i giocatori devono imparare la funzione di parità per giocare a Neem in modo efficace. E il metodo di allenamento che funziona così bene per gli scacchi e andare Impossibile farlo.

non solo neem

Un modo di vedere la conclusione è questo neem (e per estensione, tutti i giochi neutrali) è semplicemente strano. Ma Zhou e Riis hanno anche trovato segni che problemi simili potrebbero sorgere negli scacchi IA addestrati in questo modo. Hanno identificato diverse mosse di scacchi “sbagliate” – quelle che mancavano gli attacchi di accoppiamento o mandavano all’aria il gioco finale – che inizialmente erano state valutate positivamente dai valutatori del tabellone dell’IA. Solo perché il software ha preso così tanti rami aggiuntivi e diversi passi nel futuro, è stato in grado di evitare queste gaffe.

Collegamento alla fonte