[Vidéo] Jeu d'Échecs - Apprendre en 1 mois avec l'IA et défier le grand maître Magnus Carlsen

Je ne comprends pas dsl aha
Comment est-ce que son IA va lui apprendre les bon coups ?
Et qu’est-ce que ça change d’utiliser une IA déjà existante ?

en gros l’ia va jouer à des millions de parties
et extraire de ça
les coups qui ont eu la meilleure proba de faire gagner la partie
les IA déjà existantes sont pas faites pour te donner les possibilités générales
elles sont faites pour gagner une partie spécifique

Plutôt pour arriver à une position spécifique non (profondeur limité) ?

oui enfin elles s’adaptent à la partie précise quoi
sinon elles seraient moins fortes
pour gagner une partie spécifique il vaut mieux des connaissances spécifique sur cette partie que des connaissances générales sur toutes les parties de jeu d’échec
en gros il a développé une IA pour trouver les raccourcis permettant de gagner

un peu comme si tu voulais trouver les hack/cheats pour speedrunner un jeu
pas très malin pour un jeu comme les échecs mais bon

En gros son IA joue contre des êtres humains et tire parti de leurs défauts (probables) et du coup joue des coups qui seraient sous-optimaux contre une machine mais qui peuvent baiser un humain ?

pas très malin pour un jeu comme les échecs mais bon

@Bertrand louable étant donné le contexte quand même

non elle joue pas contre des êtres humains. son programme fait jouer deux IA, et une autre IA (la sienne) extrait les meilleurs coups dans les parties que jouent les deux IA
par exemple il me semble que pour faire des speedrun
certaines personnes font ça
ils font jouer une IA à un jeu en mode accélérée
càd que l’IA fait le jeu à échelle temporelle ultra accélérée
elle termine le jeu un million de fois
et donc sur ce million, la partie qui a duré le moins longtemps = celle qui te donne le chemin a suivre pour speedrunner le jeu

D’accord mais du coup on peut faire tourner le truc à l’infini non ?

on peut mais au bout d’un moment on se rapproche d’une asymptote

Mais donc il aurait pu utiliser le peu de calculs de son algo non ?

non elle joue pas contre des êtres humains. son programme fait jouer deux IA, et une autre IA (la sienne) extrait les meilleurs coups dans les parties que jouent les deux IA

@Bertrand Et quel est l’intérêt si on compare à une IA type min-max avec heuristiques ?

oui mais je pense qu’il l’a pas programmé pour s’arrêter car il pensait que ça allait être rapide
donc il s’est retrouvé dans un dilemme

oui mais je pense qu’il l’a pas programmé pour s’arrêter car il pensait que ça allait être rapide

@Bertrand Ah oupsi

attendre que ça se termine en espérant que c’est pour bientôt, ou perdre la progression faite et recommencer en mettant un système pour interrompre en gardant les résultats

Et quel est l’intérêt si on compare à une IA type min-max avec heuristiques ?

@DocDoc Je sais pas j’arrive pas à comparer les deux pour te répondre

les IA déjà existantes sont pas faites pour te donner les possibilités générales

@Bertrand Mais du coup là tu avais l’air de dire que cette IA (proba sur X parties) était meilleure qu’une IA type min max non ?

pour le cas précis de l’apprentissage par un humain
en gros c’est l’équivalent de faire un stage de self-defense où on t’apprend les techniques essentielles pour survivre. Les 20% qui vont te donner les 80%
Après pour l’IA qui joue et qui a une mega puissance matérielle sous le capot, aucun intérêt

elle aura de meilleurs résultats sans « heuristiques »
pour en revenir à l’analogie de la self-defense, même si mettre un coup de poing direct peut être une bonne option dans la plupart des cas, dans un cas précis ça reste moins bien que des techniques plus particulières