Deeppavlov 1.0是建立在Pytorch和Transformers上的开源NLP框架。 Deeppavlov 1.0是为最先进的NLP模型的模块化和配置驱动的开发而创建的,并支持广泛的NLP模型应用程序。 Deeppavlov 1.0专为对NLP/ML知识有限的从业人员而设计。
| 姓名 | 描述 |
|---|---|
| 配进演示 | 在在线演示中查看我们的NLP模型 |
| 文档 | 如何使用Deeppavlov 1.0及其功能 |
| 模型列表 | 在可用模型列表中找到您需要的NLP模型 |
| ?贡献指南 | 在做出贡献之前,请阅读贡献指南 |
| ?问题 | 如果您对Deeppavlov有问题,请告诉我们 |
| ⏩论坛 | 如果您对Deeppavlov有问题,请告诉我们 |
| ?博客 | 了解我们目前的发展 |
| ?扩展的COLAB教程 | 查看我们的模型的代码教程 |
| ? Docker Hub | 查看Docker图像以进行快速部署 |
| ??反馈 | 请给我们您的反馈,以使Deeppavlov变得更好 |
Deeppavlov支持Linux , Windows 10+ (通过WSL/WSL2), MacOS (Big Sur+)平台, Python 3.6 3.7 3.10 3.9 3.8根据所使用的型号,您可能需要4到16 GB RAM。
创建并激活虚拟环境:
Linux python -m venv env
source ./env/bin/activate
在环境中安装软件包:
pip install deeppavlov
Deeppavlov中有许多出色的预训练NLP模型。每个模型由其配置文件确定。
模型列表可在deeppavlov.configs (Python)的DOC页面上找到:
from deeppavlov import configs当您决定模型(+配置文件)时,有两种方法可以培训,评估和推断:
默认情况下,Deeppavlov安装PYPI的模型要求。 PYPI的Pytorch无法支持您的设备CUDA功能。为了在GPU上运行支持的Deeppavlov模型,您应该将CUDA与Deeppavlov型号所需的二手GPU和Pytorch版本兼容。有关详细信息,请参见文档。建议使用Pascal或更新的建筑和4+ GB VRAM的GPU。
要通过CLI从模型中获得预测,请运行
python -m deeppavlov interact < config_path > [-d] [-i]-d下载所需的数据 - 验证的模型文件和嵌入式(可选)。-i安装了模型要求(可选)。您可以以相同的简单方式训练它:
python -m deeppavlov train < config_path > [-d] [-i]无论是否存在-d标志,数据集都将下载。
要训练自己的数据,您需要在火车配置文档中修改数据集读取器路径。数据格式在相应的模型文档页面中指定。
您可以使用Configs执行更多操作:
python -m deeppavlov < action > < config_path > [-d] [-i]<action>可以install以安装模型要求(与-i相同),download以下载模型的数据(与-d相同),train以在配置文件中指定的数据上训练模型,evaluate以计算同一数据集上的指标,interact ,riseapi运行REST API服务器(请参阅DOC),-f <file_path>则predict从stdin或<file_path>获得样本的预测。<config_path>指定模型的配置文件的路径(或名称)-d下载所需的数据-i安装了模型要求要通过python从模型中获得预测,请运行
from deeppavlov import build_model
model = build_model ( < config_path > , install = True , download = True )
# get predictions for 'input_text1', 'input_text2'
model ([ 'input_text1' , 'input_text2' ])在哪里
install=True安装模型要求(可选),download=True下载需要从Web中的数据 - 验证的模型文件和嵌入(可选),<config_path>是模型名称(例如'ner_ontonotes_bert_mult' ),可选模型的配置文件(例如"deeppavlov/configs/ner/ner_ontonotes_bert_mult.json" )或deeppavlov.configs attribute(eg deeppavlov.configs.ner.ner_ontonotes_bert_mult引述标记)。您可以以相同的简单方式训练它:
from deeppavlov import train_model
model = train_model ( < config_path > , install = True , download = True )要训练自己的数据,您需要在火车配置文档中修改数据集读取器路径。数据格式在相应的模型文档页面中指定。
您还可以在配置文件中指定的数据集上计算指标:
from deeppavlov import evaluate_model
model = evaluate_model ( < config_path > , install = True , download = True )Deeppavlov还允许从组件中构建一个模型,用于使用Python推断。
Deeppavlov是Apache 2.0-许可。
@inproceedings{savkin-etal-2024-deeppavlov,
title = "DeepPavlov 1.0: Your Gateway to Advanced NLP Models Backed by Transformers and Transfer Learning",
author = "Savkin Maksim and Voznyuk Anastasia and Ignatov Fedor and Korzanova Anna and Karpov Dmitry and Popov Alexander and Konovalov Vasily"
editor = "Hernandez Farias and Delia Irazu and Hope Tom and Li Manling",
booktitle = "Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing: System Demonstrations",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.emnlp-demo.47",
pages = "465--474",
abstract = "We present DeepPavlov 1.0, an open-source framework for using Natural Language Processing (NLP) models by leveraging transfer learning techniques. DeepPavlov 1.0 is created for modular and configuration-driven development of state-of-the-art NLP models and supports a wide range of NLP model applications. DeepPavlov 1.0 is designed for practitioners with limited knowledge of NLP/ML. DeepPavlov is based on PyTorch and supports HuggingFace transformers. DeepPavlov is publicly released under the Apache 2.0 license and provides access to an online demo.",
}