ChessCoachのダウンロードChessCoachソースコードのダウンロード

ChessCoach

C/C++

1.0.0

ダウンロード

チェスコーチ

@playchesscoach on lichess：watch |統計|チャレンジ（1+0または0+1から15+10まで）

概要

Chesscoachは、自然言語の解説が可能なニューラルネットワークベースのチェスエンジンです。それは約3450 ELOの評価でチェスを演奏します。つまり、通常、2850 ELOや他の多くのエンジンで最も強力な人間のプレイヤーでさえも倒すはずですが、3550 ELOのストックフィッシュ14など、最強に負けることがよくあります。

すべてのエンジンと同様に、チェスコーハは何百万ものチェスのポジションを調べて、プレイする最良の動きを決定することに依存しています。 AlphazeroやLeela Chess Zero（LC0）のように、大規模で遅いニューラルネットワークを使用して、より単純な評価、またはより最近のNNUEエンジンを対象とした古典的なエンジンとは異なり、両方のスタイルのより強いハイブリッドです。

エンジンのコアにあるニューラルネットワークは、フィードバックサイクルを使用してほぼゼロの知識（チェスのルールだけ）から始まり、より強く成長するにつれて自分自身を打ち負かす新しい方法を学びます。より強力なニューラルネットワークの評価により、検索を改善し、検索結果が強くなり、ニューラルネットワークの評価をより効果的に訓練できます。

チェスコーチはまた、チェスの知識を追加のニューラルネットワークに送り込み、英語の動きと位置についてコメントすることもできます。それはあまり洞察力がなく、しばしば間違っているが、訓練できた限られたデータにいくつかの約束を示している。

コンテンツ

概要
モチベーション
比較
結果
測定
ドキュメント
プログラム
ファイル
インストール
- 事前インストール
- Linux（Debian/Ubuntu）、GPU
- Linux（Debian/Ubuntu）、古いスタイルのTPU
- Linux（Debian/Ubuntu）、新しいスタイルのクラウドTPU VM
- Windows、GPU
- インストール後
- Linux、Googleクラウドストレージサポートのインストール後
- Linux、クラスターサポートのためのインストール後
使用法
実行中のテスト
- Linux
- Windows
謝辞
ライセンス
接触

モチベーション

私は2〜3か月のプロジェクトとしてチェスコーチの開発を開始し、機械学習が好きで、予想以上に物事を進めてしまったかどうかを確認しました。元の計画には、小さなアルファゼロのようなエンジンの複製、トレーニングフィードバックサイクルに自然言語の解説を追加し、シングルGPUワークステーションである程度のトレーニングを可能にするという3つの過度に野心的な目標がありました。

1年以上の開発の後、トレーニング方法にほとんど進歩がないと主張することができます。しかし、チェスコーチが生産する解説に満足しています。すべてのものが考慮され、エンジンの最終的な強さに驚いています。

無料のクラウドコンピューティングや自由に利用可能な論文、ディスカッション、データなど、非常に多くの公共リソースを利用できることは幸運でした。また、重要な説明、議論、デバッグを手伝ってくれた多くの人々にも非常に感謝しています。

比較

チェスコーハの中心にあるチェスエンジンは、ニューラルネットワークの構造、トレーニングスケジュールと検索アルゴリズムの構造で、アルファゼロ（Silver et al。、2018）またはLC0（Linscott＆Pascutto、2018）のチェスエンジンと非常によく似ていますが、必要に応じて実用的なエンジニアリングアプローチを備えており、より大きなチームの幅と深さの才能を欠いています。ただし、他の場所で役立つ新しいアイデアがいくつかあることを願っています。

自然言語の解説の記事は、大規模なソーシャルフォーラムデータ（Jhamtani、Gangal、Hovy、Neubig＆Berg-Kirkpatrick、2018）からチェスゲームの移動解説のコメントを生成する学習の仕事に最も似ています。より単純なアーキテクチャがありますが、コーパス。

結果

チェスコーハは、やや最小限でポータブルになるように設計されています。 LinuxとWindowsで実行され、シングルGPU、マルチGPU、テンソル処理ユニット（TPU）をサポートします。パフォーマンス指向のコードはC ++（10.5Kライン）で、ニューラルネットワークコードはPython（3.7kライン）にあり、Tensorflow 2に依存しています。セルフプレイトレーニングデータは、4400万ゲームのアルファゼロスケジュールとそれぞれ4,096ポジションの700,000トレーニングバッチのスケジュールに続いて、Chesscoachプロジェクト内で完全に生成されました。

アルファゼロ以外のいくつかのアイデアは、カタゴ（WU、2020）やLC0などの文学やプロジェクトに存在しています（多くの場合、私は何か新しいことを試みていると思いましたが、LC0の賢い人たちはほとんどすべてを試しました）。これらには、メイトプロビング、エンドゲームテーブルベースプロービング、エンドゲームミニマックス、確率的重量平均化（SWA）、指数関数的な重みの移動平均（EWMA）、さまざまな探索インセンティブ、予測キャッシュ、補助トレーニング目標、知識の蒸留が含まれます。

いくつかのアイデアは新しいと思います。 1つ目は、戦術的なトラップを避け、線形探索と選択的バックプロパゲーションを介して単純な後悔を最小限に抑えることを目的とする検索方法です。 2つ目は、空気の正確性（トップP）の微調整された適用と、空気のある核のサンプリング - 貪欲なサンプリングの微調整と組み合わせて、位置と動きに関する自然言語の解説のための単純な神経アーキテクチャです。

結果は、チェスを再生し、ニューラルネットワークを訓練し、パラメーターを最適化し、テスト強度、プロセストレーニングデータ、ビューとデバッグデータ、トレーニングデータの編成、ユニットテスト、およびクラスターを調整するためのツールスイートです。プロジェクトをまとめるために、https://lichess.org/@/playchesscoachにボットがセットアップされ、チャレンジャーや他のボットに対してゲームをプレイし、観客に解説を提供します。

測定

新しいスタイルのV3-8クラウドTPU VM：

40/15時間で3535のおおよそのトーナメントELO評価、300+3時間で3486、60+0.6で3445、8スレッド付きのストックフィッシュ14、8192ハッシュ、3-4-5シジー、3550 ELOにピン留めします（詳細）
125,000秒あたりのノード（NPS）（さまざまな68,000-141,000ポジション）（詳細）
1時間あたり2,360のセルフプレイゲーム（改善のための部屋がたくさん）（詳細）
3317 STS ELO推定（一般的に3260-3350がパラメーターを含む3350）（詳細）
117/199 arasan21スコア（一般的に異なる118-126がパラメーターを含む）（詳細）

ドキュメント

高レベルの説明
技術的な説明
開発プロセス
データ

プログラム

Chesscoachuciはチェスエンジン自体であり、ユニバーサルチェスインターフェイス（UCI）プロトコルを実装しています。
Chesscoachtrainはプロジェクトの中核であり、自己プレイゲームデータを生成し、ニューラルネットワークをトレーニングしています。
Chesscoachoptimizeparametersは、Scikit-Optimize（Skopt）を介したベイジアンの最適化を使用して、チェスプレイ強度に影響を与えるパラメーターのコレクションのグローバルな最適なものを見つけるために使用されます。
ChessCoachStrengthTestは、拡張位置説明（EPD）形式で位置および戦術的なテストスイートを実行し、スコアと時には評価の見積もりを提供します。
Chesscoachpgntogamesは、ポータブルゲーム表記（PGN）形式で既存のゲームのコレクションを処理し、プライマリニューラルネットワークの監視されたトレーニングデータまたは解説トレーニングデータを生成します。
Chesscoachgui（Windowsのみ）Webユーザーインターフェイスを起動して、チェスボード上のトレーニングデータを分析します。代わりに、同じインターフェイスを使用して、チェスコアチュギではなくチェスコチュッチを実行し、検索する前にguiコマンドに入ることにより、エンジン検索を生成するために使用できます。
ChessCoachTestは、構成、ゲーム、MCT、ネットワーク、PGN、プールアロケーター、予測キャッシュ、ストックフィッシュカテゴリで36のテストのスイートを実行します。
Chesscoachbotは、https：//github.com/shailchoksi/lichess-botに基づいて、地衣類プラットフォームでボットを実行し、ゲームをプレイし、解説を提供します。
Cluster-up/down/run/kill.shは、Googleクラウドで古いスタイルのTPUとコンピューティートVMのKubernetesクラスターを管理し、Googleストレージを介して調整し、より多くの自己プレイデータを生成し、そのデータをトレーニングするスクリプトです。
Alpha.pyは、現在プレビューで利用可能ですが、コードのアルファTPU VMと呼ばれる新しいスタイルのクラウドTPU VMのクラスターを管理するスクリプトです。これらはより速く、使用がより簡単にシンプルですが、現在Kubernetesのサポートがなく、代わりにSSHの争いが必要です。
gsclean.pyは、削除バージョン<= 29などの述語を使用して、GoogleクラウドストレージのニューラルネットワークトレーニングチェックポイントとDocker画像をクリーンアップするための簡単なスクリプトです。
Scrape.pyは、ScrapingBeeサービスを使用して、公開されているChess Gamesを解説でダウンロードするスクリプトです。
uci_proxy_client.py、uci_proxy_server.pyは、リモートマシンでチェスエンジンをローカルマシン上にあるかのように実行できるスクリプトです。これは、各アクセラレータチップは1つのプロセスでのみ保持できるため、TPUを使用してトーナメントを実行するのに役立ち、クラスターを使用してパラメーターの最適化を高速化することもできます。これらは実際には単なる標準入力/出力プロキシであり、UCIに固有のことは何もしません。
Docker-Build-upload.shは、トレーニング/自己プレイクラスターと分散パラメーター最適化クラスターのDocker画像を構築するスクリプトです。画像はGoogleコンテナレジストリ（GCR）にアップロードされ、古いスタイルのクラスター - *。sh（クラスター - *。yamlを介して）およびクラスター管理用の新しいスタイルのalpha.pyスクリプトによって参照されます。

ファイル

一部のキーファイルは、ほとんどのツールを駆動し、C ++およびPythonコードから読み取られるconfig.tomlを含むルートにあります。 Meson.BuildはLinuxビルドを定義し、CPP/Chesscoach.slnおよびcpp/**/*。vcxprojはWindowsビルドを定義します。 Setup.sh/.cmd and build.sh/.cmdスクリプトは、セットアップと構築を自動化する必要がありますが、追加の手順が必要です。ルートのdockerfilesは、各クラスターワーカーの役割の画像を定義し、docker-*。shスクリプトは、これらの画像の構築とアップロードを支援します。

クラスターディレクトリでは、.sh/.yamlファイルは古いスタイルのTPUでKubernetesクラスターを管理しますが、Py/Alpha.pyは新しいスタイルのクラウドTPU VMでクラスターを管理します。

CPPディレクトリには、主にCPP/ChesscoachでC ++コードが含まれています。 Chesscoach C ++コードは、主にパフォーマンス指向です。サードパーティライブラリには、CPP/CRC32C、CPP/Hunspell、CPP/Numpy、CPP/Protobuf-3.13.0、CPP/Stockfish、CPP/TCLAP、CPP/Toml11およびCPP/Zlibが含まれます。サードパーティのデータには、CPP/辞書とCPP/Strengthtestsが含まれます。追加のサードパーティC ++ライブラリは、高度なパッケージツール（APT）を使用してインストールされ、Linux上のMesonビルドシステムによって発見され、WindowsのNugetを使用してインストールおよび発見されます。 CPP/Protobufライブラリは、ProtocツールとCPP/Protobuf/Chesscoach.protoを使用してコード生成されます。

PYディレクトリには、C ++からのNetwork.pyからアクセスされるプライマリにアクセスされるPythonコードが含まれていますが、一部のスタンドアロンスクリプトツールも含まれています。 Chesscoach Pythonコードは、主にニューラルネットワークとクラウドストレージに関係しています。追加のサードパーティPythonライブラリは、PIPを使用してインストールされます。

JSディレクトリには、ChessboardJSに依存して、ChesscoachguiとChesscoachuciで使用されるデバッグGUIが含まれています。

このツールディレクトリには、トーナメントを実行し、参加者のELO評価を計算するためのCutechess-CliとBayeselo、およびStockfish 13エンジンバイナリが対戦相手として機能することが含まれています。

スクリプトディレクトリには、さまざまな状況スクリプトと便利さが含まれています。

Docsディレクトリには、ドキュメントとサポート資産が含まれています。

インストール後、ChesscoachはLinux上およびWindowsのバイナリと一緒に/usr/local/share/chesscoachで静的データを見つけます。 $ {xdg_data_home}/chesscoachで動的データを見つけます。または、linux上の〜/.local/share/chesscoach、およびwindowsの％localappdata％/chesscoachでそれを失敗させます。動的データは、Google Cloudストレージにも配置できます。たとえば、gs：// chesscoach-eu/chesscoach。

インストール

事前インストール

gitをインストールし、このリポジトリをクローンします。
GPU/TPUに従ってconfig.tomlでパラメーターをカスタマイズし、コメントされたガイドラインに続きます（あるいは、Chesscoachuciを使用する場合のみ、 search_threadsオプションを実行時に設定できます）。

Linux（Debian/Ubuntu）、GPU

Google Cloudで実行されている場合、GPUセットアップを簡素化して、CUDA 11を使用して事前に構築されたディープラーニングディスクイメージを使用できます。

Googleクラウドで事前に構築されたディープラーニングディスクイメージを使用していない場合は、Tensorflow GPU Linuxセットアップの手順に従ってください。
./setup.sh実行します（ソースからProtoBufを構築するのに30分かかる場合があります）。
解説サポートを追加するには：
- pip3 install -r requirements-all.txtを実行します。
sudo ./build.sh release installを実行します。

Linux（Debian/Ubuntu）、古いスタイルのTPU

クラウドTPU APIを有効にします。
一致する名前、ゾーン、テンソルフローバージョンを使用して、コンピューティートVMとTPUを作成します。
./setup.sh実行します（ソースからProtoBufを構築するのに30分かかる場合があります）。
解説サポートを追加するには：
- pip3 install -r requirements-all.txtを実行します。
sudo ./build.sh release installを実行します。

Linux（Debian/Ubuntu）、新しいスタイルのクラウドTPU VM

クラウドTPU APIを有効にします。
クラウドTPU VMを作成します。
./setup.sh実行します（ソースからProtoBufを構築するのに30分かかる場合があります）。
解説サポートを追加するには：
1. 非正義であり、カスタムOPSをサポートするTF-NightlyおよびTF-Text-Nightlyのプライベートバイナリを取得します。
2. pip3 install tf-models-official==2.5.0 （これにより、事前にインストールされたtf泊があります）。
3. pip3 uninstall tensorflow tf-slim tf-nightlyを実行します。
4. Private TF-Nightlyパッケージを--force-reinstallでインストールします。
5. プライベートTF-Text-Nightlyパッケージをインストールします。
sudo ./build.sh release installを実行します。

Windows、GPU

Visual Studio（たとえば、Visual Studioコミュニティなど）をインストールします。
- C ++コンポーネントを使用してデスクトップ開発をインストールします。
Pythonをインストールし、パスに追加します。
- GPUセットアップを簡素化して、Anacondaを使用してPythonをインストールし、Anaconda Tensorflow-GPUパッケージをインストールできます。
- Anacondaまたは別の仮想環境を使用している場合、Activate_virtual_env.cmdを更新します。デフォルトでは、 conda activate chesscoachを試みることですが、仮想環境を使用していないときにこれが失敗しても問題ありません。
Anaconda Tensorflow-GPUパッケージを使用していない場合は、Tensorflow GPU Windowsのセットアップ手順に従ってください。
run setup.cmd （Activate_virtual_env.cmdを実行した後、Chesscoach_pythonhomeを設定します）。
build.cmdを実行します。

インストール後

Chesscoachは、$ {xdg_data_home}/chesscoachにインストールされたデータに依存しています。または、linux上の〜/.local/share/chesscoach、およびwindows上の％localappdata％/chesscoachで失敗します。

ニューラルネットワークの重みをインストールします。これには、372 MIBのダウンロードと406 MIBディスクスペースが必要です。

Linux： scripts/download_install_data.shを実行します。
Windows： scripts/download_install_data.cmdを実行します。
実行後、…/chesscoach/networks/chesscoach1_005600000および…/chesscoach/commentary/tokenizer.modelが存在するはずです。
これらのスクリプトでアクセスされるニューラルネットワークの重みは、https：//github.com/chrisbutner/chesscoachdata/releases/download/v1.0.0/data.zipにあります。

オプションで、syzygyエンドゲームテーブルベースをインストールします。 3-4-5ピースのファイルには約1ギブがかかり、3-4-5 + 6ピースのファイルは約150ギブを服用します。インストールプロセスはやや技術的です。

https://syzygy-tables.info/から選択したピースカウントのWDLおよびDTZファイルをダウンロードして、再帰的なWebダウンロードまたはBittorrentダウンロードを使用してください。
提供されたチェックサムを使用してファイルの整合性を検証します。
ファイルを…/chesscoach/syzygyにインストールします（またはSyzygy UCIオプションを設定します）。

クラウドストレージモードでは、Syzygyテーブルは、起動時にローカルストレージに自動的に複製されます。

スクリプトスクリプト/ramdisk_syzygy6.shは、メモリが高いがディスクスペースが低い場合、3-4-5 + 6ピーステーブルをホストするために、新しいスタイルのクラウドTPU VMなどのマシンにRAMディスクを設定します。ディスクを使用する場合、これらのテーブルをSSDに配置して検索速度を維持することが最善です。スクリプトスクリプト/ramdisk_syzygy6.shは、config.tomlの構成変更に依存してパスを使用します。

Linux、Googleクラウドストレージサポートのインストール後

ストレージバケットを作成し、config.tomlでcloud_data_rootを更新し、再インストールします。
必要なネットワーク、解説トークイザー、Syzygyテーブルベース、検証データなどをバケットにコピーします。

Linux、クラスターサポートのためのインストール後

コンテナレジストリAPIを有効にします。
export PROJECT_ID=<your Google Cloud project ID>を実行します。
config.tomlでdistributed_zoneをコンピューティングゾーンで更新し、再インストールします。

Alpha.pyを使用する場合（この部分は特に乱雑です）：

cluster/cluster-prep-creds.shを実行して、サービスアカウントと対応するkey.jsonファイルを作成します。
Alpha.pyのImage_Prefixを希望するGoogle ContainerレジストリドメインとGoogle Cloud Project IDを使用して更新します。
ストレージバケットでalpha.pyのkey_pathを更新します。
gsutil cpを使用して、key.jsonをkey_pathにコピーします。

技術的な説明の分散トレーニングと自己プレイセクションには、古いスタイルと新しいスタイルのクラスターの管理に関する詳細情報があります。

使用法

ほとんどのチェスコーチプログラムは、構築およびインストールされたconfig.tomlに依存します。 Config.tomlを介して、Config.tomlを使用して実行時にUCIオプションを実行するために、Config.tomlを実行するときに、Chesscoachuciを実行するときにSearch_Threadsパラメーターを設定することが特に重要です。

Chesscoachuciバイナリは、さまざまなチェスGUIのUCIエンジンとしてロードできます。

ただし、Pythonに仮想環境を使用する場合、次のことが必要になる場合があります。

a）チェスGUIを起動する前に仮想環境をアクティブにする、または
b）Chesscoachuciを起動する前に、最初に仮想環境をアクティブにするラッパースクリプトを使用してエンジンをロードします（Scripts/uci.cmdスクリプトは、Windowsの開発時間の例です）。

Chesscoachuciは、UCIプロトコルのコマンドに加えてカスタムコマンドを提供します。

comment 、現在の位置と最終的な動きの自然言語の解説を生成します。 position startpos moves …コマンドで完全な移動履歴を提供することが最善です。
gui 、検索を開始するときに起動するデバッグGUIにフラグを立てます（高レベルの説明で図9に示すように）。
~ puct [moves …] [csv]デバッグGUIデータをテキスト形式で表示します。
~ fen Forsyth – Edwards Notation（Fen）の現在の位置を表示します。

自己プレイとトレーニングについては、データドキュメントの自己プレイとトレーニングプロセスを参照してください。

プログラムにリストされている他のユーティリティについては、構成ガイダンスのためにconfig.tomlのコメントを探してください。多くのユーティリティは、 --help引数をサポートしています。スクリプトディレクトリ内のスクリプトの内容には、例を表示できます。 Pythonに仮想環境を使用する場合、ユーティリティを実行する前にアクティブ化する必要がある場合がありますが、Pythonに依存していません。

実行中のテスト

Linux

build/gcc/debug/ChessCoachTestまたはbuild/gcc/release/ChessCoachTestを実行します。

Windows

activate_virtual_env.cmdを実行し、 cpp/x64/Debug/ChessCoachTest.exeまたはcpp/x64/Release/ChessCoachTest.exe実行します。

また、Visual Studio内のChesscoachtestプロジェクトを実行/デバッグすることも、Visual Studio内のテストエクスプローラーインターフェイスを使用することもできます。

謝辞

GoogleのTPU Research Cloud（TRC）プログラムは、このプロジェクトを可能にしたコンピューティングリソースで非常に寛大であり、特にJonathan Catonが物事を実現してくれたことに感謝します。

Cloud TPU VMSを使用するためのGoogleのCloud TPUチーム、特に新しいテクノロジーのアルファ全体でのエンジニアリング支援のためのMichael Banfieldに非常に感謝しています。

チェスチューニングツールとベイズスコプトの実装の実装とベイジアンの最適化に関するアドバイスは、チェスコーチエンジンの強化において非常に貴重であることに心から感謝します。

Matthew Lai（Deepmind）に、Alphazeroの論文で独立した重要な説明を提供してくれたことに非常に感謝しています。

Chesscoachでの自然言語の解説トレーニングを可能にするために、Scrapingbeeの研究クレジットを提供してくれたPierre de Wulfに感謝します。

プロジェクトの開始時に貴重なアイデアと議論をしてくれたTed Liに感謝します。

図のプロトタイピングの支援については、Freya Wilcoxに感謝します。

編集、校正、サポートに感謝します。

ライセンス

チェスコーハは、GPLV3以降のライセンスの下でリリースされます。

接触

クリス・バトナー、[email protected]

拡大する

追加情報

バージョン 1.0.0
タイプ C/C++
更新時間 2025-03-15
サイズ 62.82MB
から Github