Deeppavlov 1.0是建立在Pytorch和Transformers上的開源NLP框架。 Deeppavlov 1.0是為最先進的NLP模型的模塊化和配置驅動的開發而創建的,並支持廣泛的NLP模型應用程序。 Deeppavlov 1.0專為對NLP/ML知識有限的從業人員而設計。
| 姓名 | 描述 |
|---|---|
| 配進演示 | 在在線演示中查看我們的NLP模型 |
| 文件 | 如何使用Deeppavlov 1.0及其功能 |
| 模型列表 | 在可用模型列表中找到您需要的NLP模型 |
| ?貢獻指南 | 在做出貢獻之前,請閱讀貢獻指南 |
| ?問題 | 如果您對Deeppavlov有問題,請告訴我們 |
| ⏩論壇 | 如果您對Deeppavlov有問題,請告訴我們 |
| ?部落格 | 了解我們目前的發展 |
| ?擴展的COLAB教程 | 查看我們的模型的代碼教程 |
| ? Docker Hub | 查看Docker圖像以進行快速部署 |
| ??回饋 | 請給我們您的反饋,以使Deeppavlov變得更好 |
Deeppavlov支持Linux , Windows 10+ (通過WSL/WSL2), MacOS (Big Sur+)平台, Python 3.6 3.7 3.10 3.9 3.8根據所使用的型號,您可能需要4到16 GB RAM。
創建並激活虛擬環境:
Linux python -m venv env
source ./env/bin/activate
在環境中安裝軟件包:
pip install deeppavlov
Deeppavlov中有許多出色的預訓練NLP模型。每個模型由其配置文件確定。
模型列表可在deeppavlov.configs (Python)的DOC頁面上找到:
from deeppavlov import configs當您決定模型(+配置文件)時,有兩種方法可以培訓,評估和推斷:
默認情況下,Deeppavlov安裝PYPI的模型要求。 PYPI的Pytorch無法支持您的設備CUDA功能。為了在GPU上運行支持的Deeppavlov模型,您應該將CUDA與Deeppavlov型號所需的二手GPU和Pytorch版本兼容。有關詳細信息,請參見文檔。建議使用Pascal或更新的建築和4+ GB VRAM的GPU。
要通過CLI從模型中獲得預測,請運行
python -m deeppavlov interact < config_path > [-d] [-i]-d下載所需的數據 - 驗證的模型文件和嵌入式(可選)。-i安裝了模型要求(可選)。您可以以相同的簡單方式訓練它:
python -m deeppavlov train < config_path > [-d] [-i]無論是否存在-d標誌,數據集都將下載。
要訓練自己的數據,您需要在火車配置文檔中修改數據集讀取器路徑。數據格式在相應的模型文檔頁面中指定。
您可以使用Configs執行更多操作:
python -m deeppavlov < action > < config_path > [-d] [-i]<action>可以install以安裝模型要求(與-i相同),download以下載模型的數據(與-d相同),train以在配置文件中指定的數據上訓練模型,evaluate以計算同一數據集上的指標,interact ,riseapi運行REST API服務器(請參閱DOC),-f <file_path>則predict從stdin或<file_path>獲得樣本的預測。<config_path>指定模型的配置文件的路徑(或名稱)-d下載所需的數據-i安裝了模型要求要通過python從模型中獲得預測,請運行
from deeppavlov import build_model
model = build_model ( < config_path > , install = True , download = True )
# get predictions for 'input_text1', 'input_text2'
model ([ 'input_text1' , 'input_text2' ])在哪裡
install=True安裝模型要求(可選),download=True下載需要從Web中的數據 - 驗證的模型文件和嵌入(可選),<config_path>是模型名稱(例如ner_ontonotes_bert_mult 'ner_ontonotes_bert_mult' ),可選模型的配置文件(例如"deeppavlov/configs/ner/ner_ontonotes_bert_mult.json" )或deeppavlov.configs attribute(eg deeppavlov.configs.ner.ner_ontonotes_bert_mult引號)。您可以以相同的簡單方式訓練它:
from deeppavlov import train_model
model = train_model ( < config_path > , install = True , download = True )要訓練自己的數據,您需要在火車配置文檔中修改數據集讀取器路徑。數據格式在相應的模型文檔頁面中指定。
您還可以在配置文件中指定的數據集上計算指標:
from deeppavlov import evaluate_model
model = evaluate_model ( < config_path > , install = True , download = True )Deeppavlov還允許從組件中構建一個模型,用於使用Python推斷。
Deeppavlov是Apache 2.0-許可。
@inproceedings{savkin-etal-2024-deeppavlov,
title = "DeepPavlov 1.0: Your Gateway to Advanced NLP Models Backed by Transformers and Transfer Learning",
author = "Savkin Maksim and Voznyuk Anastasia and Ignatov Fedor and Korzanova Anna and Karpov Dmitry and Popov Alexander and Konovalov Vasily"
editor = "Hernandez Farias and Delia Irazu and Hope Tom and Li Manling",
booktitle = "Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing: System Demonstrations",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.emnlp-demo.47",
pages = "465--474",
abstract = "We present DeepPavlov 1.0, an open-source framework for using Natural Language Processing (NLP) models by leveraging transfer learning techniques. DeepPavlov 1.0 is created for modular and configuration-driven development of state-of-the-art NLP models and supports a wide range of NLP model applications. DeepPavlov 1.0 is designed for practitioners with limited knowledge of NLP/ML. DeepPavlov is based on PyTorch and supports HuggingFace transformers. DeepPavlov is publicly released under the Apache 2.0 license and provides access to an online demo.",
}