gpt lightダウンロードgpt light光源コードのダウンロード

gpt light

AI ソースコード

1.0.0

ダウンロード

gpt-light

tldr

このレポの目標は、生産アプリケーションに使用できるGPTモデルの簡単な実装を提供することです。現在、コードは次のユースケースをサポートしています。

GPTアーキテクチャをゼロからトレーニングします。
新しいデータで既存のGPTモデル（オープンソースGPT2モデルなど）を微調整します。
トレーニングされたGPTモデルを使用して、バッチ予測を行います。
訓練されたGPTモデルをサービング用のREST APIとして展開します。

このレポをフォークして、独自のGPTアプリケーションを開発するためのテンプレートとして使用してください。

将来の仕事

最終的には、RLベースのCHATGPTの微調整を含めたいと思います。一般に、これは根本的な知識モデルを変更しませんが、モデルとの相互作用をより人間のようにします。

設定

コードのセットアップはかなり最小限であり、ローカルまたはクラウドVM環境で簡単に再現できます。*

Pytorch（オプションのGPUサポート付き）をインストールする
コンドラ環境を作成する：

 conda create -n python38 python=3.8
conda activate python38

依存関係をインストールします：

 conda install --file requirements.txt

*将来、このセットアップのDockerバージョンを提供しようとします。

物事を実行しています

小さなシェークスピアデータの準備

トレーニングと微調整のために、小さなシェークスピアデータセットをダウンロードおよび前処理するサンプルコードを提供します。このコードをテンプレートとして使用して、独自のデータに合わせてデータを処理するデータを作成します。

 python src/data_io/fetch_shakespeare.py

Tiny-Shakespeareのトレーニング

前のステップで作成された小さなシェークスピアデータセットで、非常に小さなGPTモデルをゼロからトレーニングします。結果のモデルは、かなり小さく、非常に小さなデータセットでトレーニングされているため、あまり一般化できませんが、シェークスピアのような引用を生成できます。

構成ファイルを変更し、モデルを独自のデータでゼロからトレーニングします。この時点で、データのサイズとリソースに応じて、技術的に非常に大きなモデルサイズにスケーリングできます。*

 python src/training/train_main.py --config_file config/train_shakespeare_small.yml

*このステップでは、おそらく1つまたは複数のGPUが必要になります。

シェークスピアの微調整GPT2

独自のデータでオープンソースGPT2モデルを微調整します。オープンソースのGPT様モデル（GPT2-MEDIUM、GPT2-XLなど）を使用することができます。これは、より少ないデータとリソースが必要であるため、より一般的なオプションです（CPUでもこれを実行することは可能です）。ゼロからトレーニングよりもはるかに高速です。

 python src/training/train_main.py --config_file config/finetune_shakespeare.yml

シェークスピアモデルからのサンプリング

入力プロンプトが与えられたトレーニングモデルからの多くの出力をサンプリングします。これは、バッチ推論に使用できます。

 python src/inference/sample_main.py --config_file config/sample_shakespeare.yml

サーバーを開始します

REST APIで訓練されたモデルを提供する軽量サーバー。

 uvicorn src.inference.service_main:app --reload --reload-include config/sample_gpt2.yml

サーバーが実行されたら、プロンプト（POSTリクエストとして）でエンドポイントをクエリすることができます。クエリの詳細の詳細については、次のテストスクリプトをご覧ください。

エンドポイントをテストします

サーバーが実行されたら、次のスクリプトを使用してエンドポイントをテストできます。

 python src/inference/test_query.py

テスト

このレポは、生産アプリケーションを念頭に置いて展開されており、ユニットと統合テストが含まれています。

*テシングは広範囲にわたるATMではありませんが、将来的にはカバレッジを増やすようにします。

ユニットテストを実行します

主要な機能をカバーするために、単体テストが含まれています。次のコマンドで完全なユニットテストスイートを実行できます。

 pytest test/unit/

統合テストを実行します

ユニットテストに加えて、トレーニング、微調整、サンプリングワークフローのための統合テストがいくつか含まれています。

 pytest test/integration/

*統合テストでは現在、データが機能する必要があります（上記を参照）。

事前コミットのセットアップ

一般に、リポジトリを使用するときに、コミット前のフックを有効にすることをお勧めします。現在、いくつかの基本的なフォーマットチェックを実行し、ユニットテストスイートを実行します（ただし、統合テストではありません）。

 conda install -c conda-forge pre-commit
pre-commit install

謝辞

このリポジトリのGPT実装は、Andrej KarpathyのNanogpt Repoに触発されています。私たちの目標は、再実装、再構築、およびモジュールを使用してそれを拡張し、その上にさまざまな種類の生産アプリケーションを簡単に構築できるようにすることでした。

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2025-09-10
サイズ 468.07KB
から Github

gpt light

gpt-light

tldr

将来の仕事

設定

物事を実行しています

小さなシェークスピアデータの準備

Tiny-Shakespeareのトレーニング

シェークスピアの微調整GPT2

シェークスピアモデルからのサンプリング

サーバーを開始します

エンドポイントをテストします

テスト

ユニットテストを実行します

統合テストを実行します

事前コミットのセットアップ

謝辞

GPT 映画とテレビの最新バージョン

ライトライトソフトウェア

BWEEライトアプリ

メイズライト中国語版

ハイパーライトドリフター

最後の光

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express