TinyStoriesのダウンロードTinyStoriesソースコードのダウンロード

TinyStories

その他のソースコード

1.0.0

ダウンロード

リポジトリには、28mのPARAM GPT-2モデルを構成するコードが含まれています。TinyStoriesペーパーのようなTinyStoriesデータセットでトレーニングします。論文では、 GPT-2およびGPT-Neoモデルのいくつかのバリエーションを使用しましたが、 GPT-2はスポットライトバージョンでした。彼らは、理にかなってLLMSと競争するまで、小さなサイズがパラマルになるSLM（小さな言語モデル）を作成できることを示しようとしました。

私は28mモデルを設定するためのコードのみを提供しています。トランスは現在私のお気に入りのバージョンtransformers==4.2.2インストールするための問題を抱えているために変圧器として、Pytorchを使用している場合に加速する必要があり、 partial stateを必要とします。しかし、私は28mモデルをできるだけ早く設定する方法を望んでいました！だから、私は構成コードのみを提供しています。後でリポジトリを更新してトレーニングコードを追加します。

今後の更新：