Téléchargement ChessCoach - Téléchargement du code source ChessCoach

ChessCoach

C/C++

1.0.0

Télécharger

Coach à l'échec

@Playchesscoach sur lichess: Regardez | Statistiques | Défi (1 + 0 ou 0 + 1 jusqu'à 15 + 10)

Aperçu

ChessCoach est un moteur d'échecs basé sur le réseau neuronal capable de commentaires en langage naturel. Il joue aux échecs avec une note d'environ 3450 ELO, ce qui signifie qu'il devrait généralement battre même les joueurs humains les plus forts à 2850 ELO, et de nombreux autres moteurs, mais perd souvent contre les plus forts, comme Stockfish 14 à 3550 ELO.

Comme pour tous les moteurs, ChessCoach s'appuie sur l'examen de millions de positions d'échecs pour décider du meilleur coup à jouer. Il utilise un grand réseau neuronal lent tout comme Alphazero ou Leela Chess Zero (LC0) pour évaluer chaque position, contrairement aux moteurs classiques qui visent la vitesse avec une évaluation beaucoup plus simple, ou des moteurs NNUE plus récents, qui sont un hybride plus fort des deux styles.

Le réseau neuronal au cœur du moteur est formé en jouant contre lui-même, en utilisant un cycle de rétroaction pour commencer de presque zéro connaissance - juste les règles des échecs - et apprendre de nouvelles façons de se battre à mesure qu'elle se renforce. Des évaluations de réseaux neuronaux plus fortes permettent de mieux rechercher et des résultats de recherche plus forts le permettent de former plus efficacement son évaluation de réseau neuronal.

ChessCoach peut également alimenter ses connaissances d'échecs dans un réseau neuronal supplémentaire pour commenter les mouvements et les positions en anglais. Ce n'est pas très perspicace et souvent faux, mais montre une certaine promesse pour les données limitées sur lesquelles il a pu s'entraîner.

Contenu

Aperçu
Motivation
Comparaisons
Résultats
Mesures
Documentation
Programmes
Fichiers
Installation
- Pré-installation
- Linux (Debian / Ubuntu), GPU
- Linux (Debian / Ubuntu), TPU de style plus ancien
- Linux (Debian / Ubuntu), VM Cloud TPU de style récent
- Windows, GPU
- Post-installation
- Linux, post-installation pour la prise en charge de Google Cloud Storage
- Linux, post-installation pour le support de cluster
Usage
Tests en cours d'exécution
- Linux
- Fenêtre
Remerciements
Licence
Contact

Motivation

J'ai commencé à développer ChessCoach en tant que projet de deux à trois mois pour voir si j'aimais l'apprentissage automatique et j'ai fini par aller plus loin que ce à quoi je m'attendais. Le plan d'origine avait trois objectifs trop ambitieux: reproduire un petit moteur de type alphazer, ajoutant des commentaires en langue naturelle au cycle de rétroaction de la formation et rendant un certain degré de formation possible sur un poste de travail à GPU unique.

Après un peu plus d'un an de développement, je peux revendiquer presque aucun progrès sur les méthodes de formation. Cependant, je suis satisfait du commentaire que ChessCoach produit, toutes choses considérées et surpris par la force éventuelle du moteur.

J'ai eu la chance d'avoir autant de ressources publiques disponibles, notamment un calcul cloud gratuit et des articles, des discussions et des données disponibles gratuitement. Je suis également très reconnaissant à un certain nombre de gens qui ont aidé à des clarifications, des discussions et un débogage importants.

Comparaisons

Le moteur d'échecs au cœur de ChessCoach est très similaire à celui d'Alphazero (Silver et al., 2018) ou LC0 (Linscott & Pascutto, 2018), dans la structure du réseau neuronal, de la calendrier de formation et de l'algorithme de recherche, mais avec une approche pratique et ingénierie par la nécessité, dépourvu de l'échelle et de la profondeur de la recherche d'un talent d'une plus grande équipe. Cependant, j'espère qu'il y a quelques nouvelles idées qui peuvent être utiles ailleurs.

Le commentaire en langage naturel ressemble le plus au travail d'apprentissage pour générer des commentaires déplacés pour les jeux d'échecs à partir de données sur le forum social à grande échelle (Jhamtani, Gangal, Hovy, Neubig & Berg-Kirkpatrick, 2018) et un commentateur de Chess automatisé propulsé par un moteur d'immeuble neural (Zang, Yu & Wan, 2019), mais RELIES sur un moteur à imprimer plus lourd et plus éloigné et plus Bien qu'avec une architecture plus simpliste.

Résultats

ChessCoach est conçu pour être quelque peu minimal et portable. Il s'exécute sur Linux et Windows et prend en charge les unités de traitement à GPU, multi-GPU et tenseur (TPU). Le code axé sur les performances est en C ++ (lignes de 10,5k) et le code réseau neuronal est en Python (lignes de 3,7k), en s'appuyant sur TensorFlow 2. Le code de stockfish est utilisé pour la gestion de la position, la génération de déplacements et le sondage de base de table de jeu, mais pas pour la recherche ou l'évaluation. Les données de formation sur la lecture de la play ont été entièrement générées dans le projet ChessCoach, à la suite du calendrier Alphazero de 44 millions de jeux et 700 000 lots de formation de 4 096 positions chacun.

Certaines idées au-delà de l'alphazer mais existantes dans la littérature et des projets tels que Katago (Wu, 2020) et LC0 ont été intégrées (souvent je pensais que j'essayais quelque chose de nouveau, mais il s'avère que les gens intelligents de LC0 ont essayé presque tout). Il s'agit notamment de la fourniture de mateaux, du sondage de base de table de jeu, du minimax de fin de partie, de la moyenne du poids stochastique (SWA), des moyennes mobiles pondérées de façon exponentielle (EWMA), de diverses incitations d'exploration, de la mise en cache de prédiction, des cibles d'entraînement auxiliaires et de la distillation des connaissances.

Je crois que certaines idées sont nouvelles. Le premier est une méthode de recherche qui vise à éviter les pièges tactiques et à minimiser les regrets simples via l'exploration linéaire et la rétro-compagation sélective, appliquée via l'élimination - SBE-PUCT. Le second est une simple architecture neuronale pour les commentaires en langage naturel sur les positions et les mouvements en conjonction avec une application modifiée de l'échantillonnage du noyau (TOP-P) axée sur l'exactitude avec l'échantillonnage de la variété - Covet.

Le résultat est une suite d'outils pour jouer aux échecs, former les réseaux de neurones, optimiser les paramètres, tester la force, les données de formation de traitement, la vue et le débogage des données de formation, organiser les données de formation, le test unitaire et les grappes de coordonnées. Pour conclure le projet, un bot est mis en place sur https://lichess.org///playchesscoach pour jouer à des jeux contre les challengers et autres robots, et fournir des commentaires aux spectateurs.

Mesures

Sur une machine virtuelle V3-8 Cloud plus récente:

Tournoi approximatif ELO notes de 3535 à 40/15 Time, 3486 à 300 + 3 fois, 3445 à 60 + 0,6 Temps, vs Stockfish 14 avec 8 fils, 8192 Hash, 3-4-5 Syzygy, épinglé à 3550 ELO (Détails)
125 000 nœuds par seconde (NPS) (variant de 68 000 à 141 000 en position) (détails)
2 360 jeux auto-play par heure (beaucoup de place à l'amélioration) (détails)
3317 STS ELO Estimation (variant généralement 3260 - 3350 avec paramètres) (détails)
Score 117/199 ARASAN21 (variant généralement 118 - 126 avec paramètres) (détails)

Documentation

Explication de haut niveau
Explication technique
Processus de développement
Données

Programmes

ChessCoachuci est le moteur d'échecs lui-même, mettant en œuvre le protocole d'interface d'échecs universel (UCI).
ChessCoachTrain est au cœur du projet, générant des données de jeu auto-play et formant les réseaux de neurones.
ChessCoachoptimeParameters est utilisé pour trouver un optimum global pour une collection de paramètres qui affectent la force de jeu d'échecs, en utilisant l'optimisation bayésienne via Scikit-Optimize (SKOPT).
CHESSCOACHSTRENGLINGTEST exécute des suites de test de position et tactique au format de description de la position étendue (EPD) et donne un score et parfois une estimation de notation.
ChessCoachpgnTogames traite les collections existantes de jeux au format de notation de jeu portable (PGN) et génère soit des données de formation supervisées pour le réseau neuronal principal, soit des données de formation de commentaires.
ChessCoachgui (Windows-Only) lance une interface utilisateur Web pour analyser les données de formation via une carte d'échecs. La même interface peut à la place être utilisée pour vivre des recherches de moteurs en direct en exécutant ChessCoachuci plutôt qu'à ChessCoachgui et en entrant la commande gui avant de rechercher.
ChessCoachTest exécute une suite de 36 tests dans les catégories Config, Game, MCTS, Network, PGN, Poolallocator, PredictionCache et Stockfish.
ChessCoachbot gère un bot sur la plate-forme licheess, jouant à des jeux et fournissant des commentaires, basés sur https://github.com/shailchoksi/lichess-bot.
Cluster-Up / Down / Run / Kill.sh sont des scripts qui gèrent un cluster Kubernetes de TPU de style plus ancien et calculent les machines virtuelles sur Google Cloud, en coordonnant via Google Storage, pour générer de plus grands volumes de données auto-play et s'entraîner sur ces données.
Alpha.py est un script qui gère un cluster de machines virtuelles Cloud TPU plus récentes, actuellement disponibles via l'aperçu, mais appelée Alpha TPU VMS dans le code. Ceux-ci sont plus rapides et plus simples à utiliser, mais manquent actuellement de support Kubernetes et nécessitent des querelles SSH à la place.
gsclean.py est un script simple pour nettoyer les points de contrôle de la formation du réseau neuronal et les images Docker dans Google Cloud Storage à l'aide de prédicats comme la version de supprimer <= 29 .
Scrape.py est un script qui utilise le service SctringBee pour télécharger les jeux d'échecs accessibles au public avec des commentaires.
uci_proxy_client.py, uci_proxy_server.py sont des scripts qui permettent d'exécuter un moteur d'échecs sur une machine distante comme s'il était sur la machine locale. Ceci est utile pour exécuter des tournois à l'aide de TPU, car chaque puce d'accélérateur ne peut être maintenue que par un seul processus, et elle permet également d'accélérer l'optimisation des paramètres à l'aide d'un cluster. Ce ne sont vraiment que des proxys d'entrée / sortie standard et ne font rien de spécifique à l'UCI.
docker-build-upload.sh est un script qui construit des images Docker pour les clusters de formation / auto-play et les grappes d'optimisation des paramètres distribuées. Les images sont téléchargées sur Google Container Registry (GCR) et référencées par le cluster de style plus ancien - *. SH (via cluster - *. YAML) et les scripts alpha.py de style plus récent pour la gestion des cluster.

Fichiers

Certains fichiers clés sont situés à la racine, y compris config.toml qui pilote la plupart des outils et est lu à partir du code C ++ et Python. Meson.build définit la construction Linux, et CPP / ChessCoach.sln et CPP / ** / *. VCXPROJ Définissez la construction Windows. Les scripts setup.sh/.cmd et build.sh/.cmd automatisent la configuration et la construction, bien que des étapes supplémentaires puissent être nécessaires. Dockerfiles à la racine définit les images pour chaque rôle de travailleur de cluster, et Docker - *. Les scripts SH aident à construire et à télécharger ces images.

Dans le répertoire de cluster, les fichiers .sh / .yaml gèrent les clusters Kubernetes sur des TPU de style plus ancien, tandis que Py / alpha.py gère les clusters sur les machines virtuelles cloud plus récentes.

Le répertoire CPP contient du code C ++, principalement dans CPP / ChessCoach. Le code CLESSCOACH C ++ est principalement orienté vers les performances. Les bibliothèques tierces incluent CPP / CRC32C, CPP / Hunspell, CPP / Numpy, CPP / Protobuf-3.13.0, CPP / Stockfish, CPP / TCLAP, CPP / TOML11 et CPP / ZLIB. Les données tierces incluent le CPP / dictionnaires et les tests de force CPP /. Des bibliothèques C ++ tierces supplémentaires sont installées à l'aide de l'outil de package avancé (APT) et découvertes par le système de construction Meson sur Linux, et installé et découvert à l'aide de Nuget sur Windows. La bibliothèque CPP / Protobuf est générée par le code à l'aide de l'outil Protoc et CPP / Protobuf / ChessCoach.proto.

Le répertoire PY contient du code Python, accessible au primaire via Network.py à partir de C ++, mais aussi quelques outils de script autonome. Le code Python ChessCoach est principalement préoccupé par le réseau neuronal et le stockage cloud. Des bibliothèques Python tierces supplémentaires sont installées à l'aide de PIP.

Le répertoire JS contient l'interface graphique de débogage utilisée dans ChessCoachgui et ChessCoachuci, en s'appuyant sur les échecs.

Le répertoire des outils contient la bouchette-CLI et Bayeselo pour diriger des tournois et calculer les cotes ELO des participants, ainsi que le binaire du moteur Stockfish 13 pour agir en tant qu'adversaire.

Le répertoire des scripts contient divers scripts et commodités situationnels.

Le répertoire DOCS contient des documents et des actifs de support.

Après l'installation, ChessCoach localise des données statiques à / usr / local / share / ChessCoach sur Linux et à côté du binaire sous Windows. Il localise des données dynamiques à $ {xdg_data_home} / chesscoach, ou à l'échec, à ~ / .local / share / chesscoach sur Linux, et à% localappdata% / chesscoach sur Windows. Les données dynamiques peuvent également être situées dans Google Cloud Storage; Par exemple, gs: // chesscoach-eu / chesscoach.

Installation

Pré-installation

Installez GIT et clone ce référentiel.
Personnalisez les paramètres dans config.toml selon GPU / TPU, suivant les directives commentées (alternativement, en utilisant uniquement ChessCoachuci, l'option Search_Threads peut être définie au moment de l'exécution).

Linux (Debian / Ubuntu), GPU

Si vous exécutez sur Google Cloud, cela peut simplifier la configuration du GPU pour utiliser une image de disque d'apprentissage en profondeur prédéfinie avec CUDA 11.

Suivez les instructions de configuration du GPU Linux TensorFlow si vous n'utilisez pas une image de disque en profondeur prédéfinie sur Google Cloud.
Exécutez ./setup.sh (il peut prendre 30 minutes pour construire Protobuf à partir de la source).
Pour ajouter un support de commentaires:
- Exécutez pip3 install -r requirements-all.txt .
Exécutez sudo ./build.sh release install .

Linux (Debian / Ubuntu), TPU de style plus ancien

Activer l'API Cloud TPU .
Créez une machine virtuelle de calcul et TPU avec le nom, la zone et la version TensorFlow correspondant.
Exécutez ./setup.sh (il peut prendre 30 minutes pour construire Protobuf à partir de la source).
Pour ajouter un support de commentaires:
- Exécutez pip3 install -r requirements-all.txt .
Exécutez sudo ./build.sh release install .

Linux (Debian / Ubuntu), VM Cloud TPU de style récent

Activer l'API Cloud TPU .
Créez une VM TPU Cloud.
Exécutez ./setup.sh (il peut prendre 30 minutes pour construire Protobuf à partir de la source).
Pour ajouter un support de commentaires:
1. Obtenez des binaires privés pour TF-Nightly et TF-Text-Nightly qui ne sont pas monolithiques et prennent en charge les opérations personnalisées.
2. Exécutez pip3 install tf-models-official==2.5.0 (ceci vous accroche le TF-Nightly préinstallé).
3. Exécutez pip3 uninstall tensorflow tf-slim tf-nightly .
4. Installez le package TF-Nightly privé avec --force-reinstall .
5. Installez le package TF-Text-Nightly privé.
Exécutez sudo ./build.sh release install .

Windows, GPU

Installez Visual Studio (par exemple, Visual Studio Community).
- Installez le développement de bureau avec le composant C ++ .
Installez Python et ajoutez-le sur le chemin.
- Il peut simplifier la configuration GPU pour installer Python à l'aide d'Anaconda et installer le package Anaconda Tensorflow-GPU.
- Mettre à jour activer_virtual_env.cmd si vous utilisez Anaconda ou un autre environnement virtuel. La valeur par défaut est d'essayer conda activate chesscoach , mais il est normal que cela échoue lorsqu'il n'utilise pas un environnement virtuel.
Suivez les instructions de configuration des fenêtres GPU TensorFlow si vous n'utilisez pas le package Anaconda Tensorflow-GPU.
Exécutez setup.cmd (cela définit CESSCOACH_PYTHONHOME après avoir exécuté Activate_Virtual_env.cmd).
Run build.cmd .

Post-installation

ChessCoach s'appuie sur les données installées sur $ {xdg_data_home} / ChessCoach, ou à l'échec, à ~ / .local / share / chesscoach sur Linux, et à% localappdata% / chesscoach sur Windows.

Installez les poids du réseau neuronal. Cela nécessite un téléchargement 372 MIB et un espace de disque MIB 406.

Linux: exécutez scripts/download_install_data.sh .
Windows: Exécutez scripts/download_install_data.cmd .
Après avoir fonctionné,… / ChessCoach / Networks / ChessCoach1_005600000 et… / ChessCoach / Commentary / tokenizer.model devrait exister.
Les poids de réseau neuronal accessibles par ces scripts sont situés à https://github.com/chrisbutner/chesscoachdata/releases/download/v1.0.0/data.zip.

Facultativement, installez des bases de table de jeu de syzygie. Les fichiers pour 3-4-5 pièces prennent environ 1 gib et les fichiers pour 3-4-5 + 6 pièces prennent environ 150 gib. Le processus d'installation est quelque peu technique.

Téléchargez les fichiers WDL et DTZ pour la pièce choisie compte de la pièce à partir de https://syzygy-tables.info/, en utilisant soit un téléchargement Web récursif ou un téléchargement BitTorrent.
Valider l'intégrité du fichier à l'aide des sommes de contrôle fournies.
Installez les fichiers sur… / ChessCoach / Syzygy (ou définissez l'option Syzygy UCI).

En mode de stockage cloud, les tables de syzygie sont automatiquement reproduites au stockage local lors du lancement.

Le script Scripts / Ramdisk_Syzygy6.sh met en place un disque de RAM sur des machines comme les machines virtuelles TPU Cloud de style récent pour héberger des tables 3-4-5 + 6 pièces, lorsque la mémoire est élevée mais que l'espace disque est faible. Lorsque vous utilisez un disque, il est préférable de placer ces tables sur SSD pour maintenir la vitesse de recherche. Le script Scripts / Ramdisk_Syzygy6.sh utilise le chemin… / ChessCoach / Syzygy6, en s'appuyant sur un changement de configuration dans config.toml, mais… / ChessCoach / Syzygy pourrait être utilisé à la place.

Linux, post-installation pour la prise en charge de Google Cloud Storage

Créez un seau de stockage, mettez à jour Cloud_data_root dans config.toml et réinstallez.
Copiez les réseaux nécessaires, le tokenzer des commentaires, les bases de table de syzygie, les données de validation, etc. dans le seau.

Linux, post-installation pour le support de cluster

Activer l'API Registre des conteneurs .
Exécutez export PROJECT_ID=<your Google Cloud project ID> .
Mettez à jour Distributed_Zone dans config.toml avec votre zone de calcul et réinstallez.

Si vous utilisez alpha.py (cette partie est particulièrement désordonnée):

Exécutez cluster/cluster-prep-creds.sh pour créer un compte de service et un fichier Key.json correspondant.
Mettez à jour Image_Prefix dans Alpha.py avec votre domaine de registre de conteneur Google préféré et votre ID de projet Google Cloud.
Mettez à jour Key_path dans alpha.py avec votre seau de stockage.
Copier Key.json sur KEY_PATH en utilisant gsutil cp .

La section Formation et auto-play distribuée dans l'explication technique comprend plus d'informations sur la gestion des clusters de style plus ancien et plus récent.

Usage

La plupart des programmes ChessCoach dépendent de la configuration construite et installée .toml. Il est particulièrement important de définir le paramètre Search_Threads lors de l'exécution de ChessCoachuci, via config.toml à l'heure de construction ou à l'option UCI à l'exécution, pour éviter la famine de threads à partir de la planification de prédiction déloyale.

Le binaire ChessCoachuci peut être chargé en tant que moteur UCI dans diverses GUS d'échecs.

Cependant, lorsque vous utilisez un environnement virtuel pour Python, il peut être nécessaire de: soit:

a) Activer l'environnement virtuel avant de lancer l'interface graphique d'échecs, ou
b) Chargez le moteur à l'aide d'un script wrapper qui active d'abord l'environnement virtuel avant de lancer ChessCoachuci (scripts / uci.cmd le script est un exemple de temps de développement sur Windows).

ChessCoachuci propose des commandes personnalisées en plus de celles du protocole UCI:

comment génère des commentaires en langage naturel pour la position actuelle et le dernier coup joué. Il est préférable de fournir un historique complet avec une position startpos moves … Commande.
gui rapporte l'interface graphique de débogage à lancer lors du démarrage d'une recherche (comme le montre la figure 9 dans l'explication de haut niveau).
~ puct [moves …] [csv] Affiche les données de GUI de débogage sous forme de texte.
~ fen affiche la position actuelle dans la notation de Forsyth - Edwards (FEN).

Pour l'auto-play et la formation, consultez l'auto-play et le processus de formation dans le document de données.

Pour les autres utilitaires répertoriés dans les programmes, recherchez des commentaires dans config.toml pour les conseils de configuration. De nombreux services publics soutiennent l'argument --help . Le contenu des scripts dans le répertoire des scripts peut montrer des exemples. Lorsque vous utilisez un environnement virtuel pour Python, il peut devoir être activé avant d'exécuter des services publics, bien que certains ne dépendent pas de Python.

Tests en cours d'exécution

Linux

Exécutez build/gcc/debug/ChessCoachTest ou build/gcc/release/ChessCoachTest .

Fenêtre

Exécutez activate_virtual_env.cmd puis cpp/x64/Debug/ChessCoachTest.exe ou cpp/x64/Release/ChessCoachTest.exe .

Vous pouvez également exécuter / déboguer le projet ChessCoachtest dans Visual Studio, ou utiliser l'interface d'explorateur de test dans Visual Studio.

Remerciements

Le programme TPU Research Cloud (TRC) de Google a été exceptionnellement généreux avec les ressources informatiques qui ont rendu ce projet possible, et je remercie Jonathan Caton en particulier d'avoir fait bouger les choses.

Je suis très appréciable de l'équipe TPU Cloud de Google pour l'utilisation des VM Cloud TPU, et en particulier Michael Banfield pour l'aide d'ingénierie à travers l'alpha de la nouvelle technologie.

Je remercie sincèrement Karlson Pfannschmidt (Université de Paderborn), dont les outils de réglage d'échecs et la mise en œuvre de Bayes-Skopt et les conseils sur l'optimisation bayésienne étaient inestimables pour renforcer le moteur ChessCoach.

Je suis très reconnaissant à Matthew Lai (Deepmind) d'avoir fourni à une capacité indépendante, d'importantes clarifications sur le papier Alphazer.

Je remercie Pierre de Wulf d'avoir fourni des crédits de recherche pour StracingBee pour permettre une formation de commentaires en langage naturel à ChessCoach.

Merci à Ted Li pour ses précieuses idées et discussions au début du projet.

Merci à Freya Wilcox pour son aide au prototypage du diagramme.

Et un merci spécial à Gary Butner et Lynell Rafton pour l'édition, la relecture et le soutien.