open language models
1.0.0
これは、MIT、Apache 2.0、またはその他の同様のライセンスを備えた許可されたライセンス言語モデルのリストです。ここでは、言語モデルという用語を広く使用して、自己回帰モデルだけでなく、MLMなどのさまざまな目的でトレーニングされたモデルも含めています。
この作品は、主にStella Bidermanの生成AIのディレクトリと、基礎モデル開発のチートシートに触発されました。しかし、これら2つの非常に包括的なソースとは異なり、この作業は迅速かつ焦点を絞った参照になることを意図しています。
重要
これはまだ進行中の作業です。貢献、修正、フィードバックは大歓迎です!
| モデル | パラメーター | 建築 | エンコーダー | デコーダ | MOE | 年 | 顔を抱き締める | ライセンス |
|---|---|---|---|---|---|---|---|---|
| GPT-1 | 120m | トランス | - | ✅ | - | 2018年 | ? | mit |
| Bert-Base-Cased | 110m | トランス | ✅ | - | - | 2018年 | ? | Apache 2.0 |
| Bert-Base-Uncased | 110m | トランス | ✅ | - | - | 2018年 | ? | Apache 2.0 |
| Bert-Large-Cased | 340m | トランス | ✅ | - | - | 2018年 | ? | Apache 2.0 |
| Bert-Large-Uncased | 340m | トランス | ✅ | - | - | 2018年 | ? | Apache 2.0 |
| GPT-2-SMALL | 124m | トランス | - | ✅ | - | 2019年 | ? | mit |
| GPT-2メディアム | 355m | トランス | - | ✅ | - | 2019年 | ? | mit |
| GPT-2-Large | 774m | トランス | - | ✅ | - | 2019年 | ? | mit |
| GPT-2-XL | 1.5b | トランス | - | ✅ | - | 2019年 | ? | mit |
| T5-Small? | 60m | トランス | ✅ | ✅ | - | 2019年 | ? | Apache 2.0 |
| T5ベース? | 220m | トランス | ✅ | ✅ | - | 2019年 | ? | Apache 2.0 |
| T5-large? | 770m | トランス | ✅ | ✅ | - | 2019年 | ? | Apache 2.0 |
| T5-3B? | 3b | トランス | ✅ | ✅ | - | 2019年 | ? | Apache 2.0 |
| T5-11B? | 11b | トランス | ✅ | ✅ | - | 2019年 | ? | Apache 2.0 |
| XLM-Roberta-Large | 560m | トランス | ✅ | - | - | 2019年 | ? | mit |
| xlm-roberta-base | 250m | トランス | ✅ | - | - | 2019年 | ? | mit |
| ロベルタベース | 125m | トランス | ✅ | - | - | 2019年 | ? | mit |
| ロベルタ・ラージ | 355m | トランス | ✅ | - | - | 2019年 | ? | mit |
| Distilbert-Base-Cased | 66m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| Distilbert-Base-Uncased | 66m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| アルバートベース | 12m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| アルバート・ラージ | 18m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| Albert-Xlarge | 60m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| Albert-xxlarge | 235m | トランス | ✅ | - | - | 2019年 | ? | Apache 2.0 |
| Deberta-base | 134m | トランス | ✅ | - | - | 2020 | ? | mit |
| Deberta-Large | 350m | トランス | ✅ | - | - | 2020 | ? | mit |
| deberta-xlarge | 750m | トランス | ✅ | - | - | 2020 | ? | mit |
| Electra-Small-Discriminator | 14m | トランス | ✅ | - | - | 2020 | ? | Apache 2.0 |
| Electra-Base-Discriminator | 110m | トランス | ✅ | - | - | 2020 | ? | Apache 2.0 |
| Electra-Large-Discriminator | 335m | トランス | ✅ | - | - | 2020 | ? | Apache 2.0 |
| gpt-neo-125m? | 125m | トランス | - | ✅ | - | 2021 | ? | mit |
| gpt-neo-1.3b? | 1.3b | トランス | - | ✅ | - | 2021 | ? | mit |
| gpt-neo-2.7b? | 2.7b | トランス | - | ✅ | - | 2021 | ? | mit |
| gpt-j? | 6b | トランス | - | ✅ | - | 2021 | ? | Apache 2.0 |
| xlm-roberta-xl | 3.5b | トランス | ✅ | - | - | 2021 | ? | mit |
| xlm-roberta-xxl | 10.7b | トランス | ✅ | - | - | 2021 | ? | mit |
| deberta-v2-xlarge | 900m | トランス | ✅ | - | - | 2021 | ? | mit |
| deberta-v2-xxlarge | 1.5m | トランス | ✅ | - | - | 2021 | ? | mit |
| deberta-v3-xsmall | 22m | トランス | ✅ | - | - | 2021 | ? | mit |
| deberta-v3-small | 44m | トランス | ✅ | - | - | 2021 | ? | mit |
| deberta-v3-base | 86m | トランス | ✅ | - | - | 2021 | ? | mit |
| Deberta-V3-Large | 304m | トランス | ✅ | - | - | 2021 | ? | mit |
| mdeberta-v3-base | 86m | トランス | ✅ | - | - | 2021 | ? | mit |
| gpt-neox? | 20b | トランス | - | ✅ | - | 2022 | ? | Apache 2.0 |
| UL2? | 20b | トランス | ✅ | ✅ | - | 2022 | ? | Apache 2.0 |
| ヤルム | 100b | トランス | - | ✅ | - | 2022 | ? | Apache 2.0 |
| pythia-14m? | 14m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| pythia-70m? | 70m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| pythia-160m? | 160m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Pythia-410m? | 410m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| pythia-1b? | 1b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| pythia-1.4b? | 1.4b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Pythia-2.8b? | 2.8b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Pythia-6.9b? | 6.9b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Pythia-12b? | 12b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-11mm | 111m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-256M | 256m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-590M | 590m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-1.3B | 1.3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-2.7B | 2.7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-6.7B | 6.7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| セレブラス-GPT-13B | 13b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| btlm? | 3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| PHI-1 | 1.3b | トランス | - | ✅ | - | 2023 | ? | mit |
| PHI-1.5 | 1.3b | トランス | - | ✅ | - | 2023 | ? | mit |
| PHI-2 | 2.7b | トランス | - | ✅ | - | 2023 | ? | mit |
| redpajama-incite-3b? | 2.8b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| redpajama-incite-7b? | 6.9b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| FLM | 101b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| MPT-1B | 1.3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| MPT-7B | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| MPT-7B-8K | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| MPT-30B | 30b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mistral-7B-V0.1 | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mistral-7B-V0.2 | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mistral-7B-V0.3 | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Falcon-1B | 1b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| ファルコン-7b | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| ファルコン-40b | 40b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Tinyllama | 1.1b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openllama-3B-V1? | 3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openllama-7B-V1? | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openllama-13B-V1? | 13b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openllama-3B-V2? | 3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openllama-7B-V2? | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| デシルム-7b | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| アンバー? | 7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| 太陽 | 10.7b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| mixtral-8x7b | 46.7b | トランス | - | ✅ | ✅ | 2023 | ? | Apache 2.0 |
| Openmoe-base-128b | 637m | トランス | - | ✅ | ✅ | 2023 | ? | Apache 2.0 |
| MAMBA-130M | 130m | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| マンバ-370m | 370m | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mamba-790M | 790m | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mamba-1.4b | 1.4m | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Mamba-2.8b | 2.8b | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| mamba-2.8b-slimpj | 2.8b | SSM | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Openba | 15b | トランス | ✅ | ✅ | - | 2023 | ? | Apache 2.0 |
| YI-6B | 6b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| YI-6B-200K | 6b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| YI-9B | 9b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| YI-9B-200K | 9b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| YI-34B-200K | 34b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| perimmon-8b | 8b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| パルミラ-3b | 3b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| パルミラ・スモール-128m | 128m | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| パルミラベース-5B | 5b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| パルミラ・ラージ-20b | 20b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| Sea-Lion-3B | 3b | トランス | - | ✅ | - | 2023 | ? | mit |
| Sea-Lion-7B | 7b | トランス | - | ✅ | - | 2023 | ? | mit |
| PLAMO-13B | 13b | トランス | - | ✅ | - | 2023 | ? | Apache 2.0 |
| リテラマ | 460m | トランス | - | ✅ | - | 2024 | ? | mit |
| H2O-Danube | 1.8b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| H2O-Danube2 | 1.8b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| コスモ | 1.8b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Mobillama-0.5b | 0.5b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Mobillama-0.8b | 0.8b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Mobillama-1B | 1.2b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| olmo-1B? | 1b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| olmo-7b? | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| olmo-7b-twin-2t? | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| olmo-1.7-7b? | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| ポロ | 34b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| GROK-1 | 314b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-1.1T | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-1T | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-800B | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-600B | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-400B | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-8B-200B | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| OpenMOE-34B-200B | 34b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| ジャンバ | 52b | SSMトランスフォーマー | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| ジェットメー | 8b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| マンバウタイ | 1.6b | SSM | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Tele-flm | 52b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| 北極圏 | 480b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| Zamba-7B | 7b | SSMトランスフォーマー | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| mixtral-8x22b-v0.1 | 141b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| 花崗岩-7bベース | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Chuxin-1.6b-base? | 1.6b | トランス | - | ✅ | - | 2024 | ? | mit |
| Chuxin-1.6B-1M? | 1.6b | トランス | - | ✅ | - | 2024 | ? | mit |
| ネオ? | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| YI-1.5-6B | 6b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| YI-1.5-9B | 9b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| YI-1.5-34B | 34b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Gecko-7B | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| QWEN2-0.5B | 0.5b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| QWEN2-1.5B | 1.5b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| QWEN2-7B | 7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| QWEN2-57B-A14B | 57b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| K2? | 65b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| パイル-T5ベース? | 248m | トランス | ✅ | ✅ | - | 2024 | ? | Apache 2.0 |
| パイル-t5-large? | 783m | トランス | ✅ | ✅ | - | 2024 | ? | Apache 2.0 |
| PILE-T5-XL? | 2.85b | トランス | ✅ | ✅ | - | 2024 | ? | Apache 2.0 |
| Smollm-135m? | 135m | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Smollm-360m? | 360m | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Smollm-1.7b? | 1.7b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
| にやにや笑い | 42b | トランス | - | ✅ | ✅ | 2024 | ? | mit |
| olmoe-1b-7b? | 7b | トランス | - | ✅ | ✅ | 2024 | ? | Apache 2.0 |
| Zamba2-1.2b | 1.2b | SSMトランスフォーマー | - | ✅ | - | 2024 | ? | Apache 2.0 |
| Zamba2-2.7b | 2.7b | SSMトランスフォーマー | - | ✅ | - | 2024 | ? | Apache 2.0 |
| FOX-1-1.6B | 1.6b | トランス | - | ✅ | - | 2024 | ? | Apache 2.0 |
@misc { hamdy2024openlmlist ,
title = { The Open Language Models List } ,
author = { Mohammed Hamdy } ,
url = { https://github.com/mmhamdy/open-language-models } ,
year = { 2024 } ,
}