
警告:停止了火語的開發,並且0.18版本(2024年4月)將是圖書館的最後一個穩定版本。
該存儲庫包括:
我們建議Anaconda作為Python軟件包管理系統。有關Pytorch安裝的詳細信息,請參考pytorch.org。以下是相應的torchtext版本和受支持的Python版本。
| Pytorch版本 | TorchText版本 | 支持的Python版本 |
|---|---|---|
| 每晚建造 | 主要的 | > = 3.8,<= 3.11 |
| 2.3.0 | 0.18.0 | > = 3.8,<= 3.11 |
| 2.2.0 | 0.17.0 | > = 3.8,<= 3.11 |
| 2.1.0 | 0.16.0 | > = 3.8,<= 3.11 |
| 2.0.0 | 0.15.0 | > = 3.8,<= 3.11 |
| 1.13.0 | 0.14.0 | > = 3.7,<= 3.10 |
| 1.12.0 | 0.13.0 | > = 3.7,<= 3.10 |
| 1.11.0 | 0.12.0 | > = 3.6,<= 3.9 |
| 1.10.0 | 0.11.0 | > = 3.6,<= 3.9 |
| 1.9.1 | 0.10.1 | > = 3.6,<= 3.9 |
| 1.9 | 0.10 | > = 3.6,<= 3.9 |
| 1.8.1 | 0.9.1 | > = 3.6,<= 3.9 |
| 1.8 | 0.9 | > = 3.6,<= 3.9 |
| 1.7.1 | 0.8.1 | > = 3.6,<= 3.9 |
| 1.7 | 0.8 | > = 3.6,<= 3.8 |
| 1.6 | 0.7 | > = 3.6,<= 3.8 |
| 1.5 | 0.6 | > = 3.5,<= 3.8 |
| 1.4 | 0.5 | 2.7,> = 3.5,<= 3.8 |
| 0.4及以下 | 0.2.3 | 2.7,> = 3.5,<= 3.8 |
使用conda:
conda安裝-C pytorch torchtext
使用PIP:
PIP安裝火炬
如果您想從Spacy使用英語令牌,則需要安裝Spacy並下載其英語模型:
PIP安裝啟動 python -m spacy下載en_core_web_sm
另外,您可能需要在salemoses中使用摩西令牌端口(從NLTK拆分)。您必須安裝Calemoses:
PIP安裝callemess
對於torchtext 0.5及以下, sentencepiece :
conda install -c powerai句子
要從源構建火炬文字,您需要git , CMake和c ++ 11編譯器,例如g++ ::
git克隆https://github.com/pytorch/text terchtext CD火炬 git suppodule更新 - init-回報 #Linux python設置 #OSX cc = clang cxx = clang ++ python設置 #或``python setup.py開發'如果您正在進行修改。
筆記
從源構建時,請確保您的C ++編譯器與用於構建Pytorch的編譯器相同。一種簡單的方法是從源構建pytorch,並使用相同的環境來構建火炬。如果您使用的是pytorch的夜間構建,請簽約它與conda(此處)和pip(此處)構建的環境。
此外,使用Torchdata庫實現了TorchText中的數據集。請查看安裝說明,以下載最新的夜間或從源頭安裝。
在此處找到文檔。
數據集模塊當前包含:
該庫目前包括以下預培訓模型:
轉換模塊當前支持腳本可鍵換器:
為了開始使用TorchText,用戶可以參考Pytorch網站上可用的以下教程。
這是一個實用程序庫,可下載和準備公共數據集。我們不託管或分發這些數據集,保證其質量或公平性,或聲稱您已有使用該數據集的許可證。您有責任確定您是否有權使用數據集許可證下的數據集。
如果您是數據集所有者,並希望更新其中的任何部分(描述,引用等),或者不希望您的數據集包含在此庫中,請通過GitHub問題與您聯繫。感謝您對ML社區的貢獻!