ОБНОВЛЕНИЕ : По состоянию на 2021/10/17 проект jiant больше не поддерживается активно. Это означает, что не будет планов добавлять новые модели, задачи или функции или обновить поддержку в новые библиотеки.
jiant - инструментарий NLPМногозадачный инструментарий обучения и переноса для исследований по обработке естественного языка
Почему я должен использовать jiant ?
jiant поддерживает многозадачное обучениеjiant поддерживает обучение передачиjiant поддерживает более 50 задач по пониманию естественного языкаjiant поддерживает следующие тесты:jiant - это исследовательская библиотека, и пользователям рекомендуется расширять, изменять и вносить свой вклад в соответствие их потребностям! Несколько дополнительных вещей, которые вы, возможно, захотите узнать о jiant :
jiant - это управление файлами конфигурацииjiant построен из Pytorchjiant интегрируется с datasets для управления данными задачjiant интегрируется с transformers для управления моделями и токенизаторами. jiant , прочитав наши гиды Для импорта jiant из источника (рекомендуется для исследователей):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt
# Add the following to your .bash_rc or .bash_profile
export PYTHONPATH=/path/to/jiant: $PYTHONPATH Если вы планируете внести свой вклад в JIANT, установите дополнительные зависимости с помощью pip install -r requirements-dev.txt .
Чтобы установить jiant из Source (альтернатива для исследователей):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e
Чтобы установить jiant из PIP (рекомендуется, если вы просто хотите тренировать/использовать модель):
pip install jiant
Мы рекомендовали установить jiant в виртуальную среду или среду Conda.
Чтобы проверить, jiant был правильно установлен, запустите простой пример.
Следующий пример настраивает модель Роберты в наборе данных MRPC.
Версия Python:
from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader
EXP_DIR = "/path/to/exp"
# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )
# Set up the arguments for the Simple API
args = run . RunConfiguration (
run_name = "simple" ,
exp_dir = EXP_DIR ,
data_dir = f" { EXP_DIR } /tasks" ,
hf_pretrained_model_name_or_path = "roberta-base" ,
tasks = "mrpc" ,
train_batch_size = 16 ,
num_train_epochs = 3
)
# Run!
run . run_simple ( args )Версия Bash:
EXP_DIR=/path/to/exp
python jiant/scripts/download_data/runscript.py
download
--tasks mrpc
--output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py
run
--run_name simple
--exp_dir ${EXP_DIR} /
--data_dir ${EXP_DIR} /tasks
--hf_pretrained_model_name_or_path roberta-base
--tasks mrpc
--train_batch_size 16
--num_train_epochs 3Примеры более сложных учебных рабочих процессов найдены здесь.
Рекомендации jiant Project можно найти здесь.
jiant v1.3.2 ? jiant v1.3.2 был перенесен в Jiant-V1-Legacy, чтобы поддержать текущие исследования с библиотекой. jiant v2.xx является более модульным и масштабируемым, чем jiant v1.3.2 , и был разработан, чтобы отразить потребности текущего исследовательского сообщества NLP. Мы настоятельно рекомендовали любые новые проекты, используя jiant v2.xx
jiant 1.x использовался в нескольких статьях. Для инструкций о том, как воспроизвести документы, jiant авторы, которые направляют читателей на этот сайт для документации (включая Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.), См. Jiant-V1-Legacy Readme.
Если вы используете jiant ≥ v2.0.0 в академической работе, пожалуйста, цитируйте это напрямую:
@misc{phang2020jiant,
author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
howpublished = {url{http://jiant.info/}},
year = {2020}
}
Если вы используете jiant ≤ v1.3.2 в академической работе, используйте цитирование, найденное здесь.
jiant выпускается по лицензии MIT.