Bien utiliser la méthode de MonteCarlo

Louis Geisler · May 2020

Bonjour
(Mon problème est purement mathématique et algorithmique, pas informatique ;-))
Je veux créer une IA de Puissance 4, pour cela, je voudrais utiliser la méthode de MonteCarlo pour mon IA. (Juste MonteCarlo, pas UCT)

De ce que je sais (et comprends), la méthode de MonteCarlo, consiste à jouer plein de partie au hasard (ou quasiment au hasard) et à en tirer des conclusions sur le potentiel moyen de chaque coup.

Donc ma 1er approche pour mon IA a été la suivante.
Pour évaluer le "potentiel" d'un coup C, pour une partie P1 donnée, on simule le fait qu'on ait joué ce coup C, ce qui donne une partie P2. Et à partir de cette partie, on joue aléatoirement plein de parties, et on en tire des conclusions sur le potentiel du coup C.

Mon problème est : quelle formule dois-je utiliser pour calculer le potentiel de ce coup ? (Quelle est la meilleure formule pour gagner ?)
1) Nombre de victoire / Nombre de parties simulées ?
2) Nombre de victoire / Nombre de défaite ?
3) Score Moyen / Nombre de parties simulées ? (Score: -1 = perdu | 0 = match nul | 1 = Gagné )
4) Nombre de tours moyen pour gagner / Nombre de tours moyen pour gagner ?
Etc ...

En y réfléchissant bien, je me suis aussi demandé, si au lieu de jouer N parties pour évaluer chaque coup (ce qui fait 7*N parties en tout, car le puissance 4 a une largeur de 7 cases), on ne pouvait pas jouer seulement N parties, et en tirer des conclusions pour l'ensemble des 7 coups à évaluer ...

Par exemple, à partir d'une partie donnée, je veux savoir quel coup à le meilleur potentiel. Donc je jouerais N parties, puis à la fin de chacune, je regarderais combien de fois à était joué chaque coup que je cherche à évaluer, combien de fois en le jouant, on a gagné, ou on a perdu, etc...
Si cette approche était valide, elle serait 7 fois plus rapide que la précédente, mais me ramènerais aussi au problème précédent.

Quelle formule dois-je utiliser pour tirer le maximum d'information de toute ces fin de parties, pour avoir une IA la plus efficace possible ??

J’espère vraiment qu'il y a un moyen d'y répondre mathématiquement, sans que j'ai besoin d'expérimenter toutes ces combinaisons ^^'

Merci d'avance à tout ceux qui auront le courage de se plonger dans mon épineux problème

Bien utiliser la méthode de MonteCarlo

Bonjour!

Catégories

Qui est en ligne 18