MISE À JOUR : Depuis 2021/10/17, le projet jiant n'est plus activement entretenu. Cela signifie qu'il ne sera pas prévu d'ajouter de nouveaux modèles, tâches ou fonctionnalités, ou mettre à jour le support aux nouvelles bibliothèques.
jiant est une boîte à outils NLPLa boîte à outils d'apprentissage multitâche et transfert pour la recherche de traitement du langage naturel
Pourquoi devrais-je utiliser jiant ?
jiant prend en charge l'apprentissage multitâchejiant prend en charge l'apprentissage du transfertjiant soutient plus de 50 tâches de compréhension du langage natureljiant prend en charge les repères suivants:jiant est une bibliothèque de recherche et les utilisateurs sont encouragés à étendre, changer et contribuer à répondre à leurs besoins! Quelques choses supplémentaires que vous voudrez peut-être savoir sur jiant :
jiant est piloté au fichier de configurationjiant est construit avec Pytorchjiant s'intègre aux datasets pour gérer les données de tâchejiant s'intègre aux transformers pour gérer les modèles et les tokeniseurs. jiant en lisant nos guides Pour importer jiant de Source (recommandé pour les chercheurs):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt
# Add the following to your .bash_rc or .bash_profile
export PYTHONPATH=/path/to/jiant: $PYTHONPATH Si vous prévoyez de contribuer à Jiant, installez des dépendances supplémentaires avec pip install -r requirements-dev.txt .
Pour installer jiant à partir de Source (alternative pour les chercheurs):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e
Pour installer jiant de PIP (recommandé si vous souhaitez simplement former / utiliser un modèle):
pip install jiant
Nous avons recommandé d'installer jiant dans un environnement virtuel ou un environnement Conda.
Pour vérifier jiant a été correctement installé, exécutez un exemple simple.
L'exemple suivant affine un modèle Roberta sur l'ensemble de données MRPC.
Version Python:
from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader
EXP_DIR = "/path/to/exp"
# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )
# Set up the arguments for the Simple API
args = run . RunConfiguration (
run_name = "simple" ,
exp_dir = EXP_DIR ,
data_dir = f" { EXP_DIR } /tasks" ,
hf_pretrained_model_name_or_path = "roberta-base" ,
tasks = "mrpc" ,
train_batch_size = 16 ,
num_train_epochs = 3
)
# Run!
run . run_simple ( args )Version de bash:
EXP_DIR=/path/to/exp
python jiant/scripts/download_data/runscript.py
download
--tasks mrpc
--output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py
run
--run_name simple
--exp_dir ${EXP_DIR} /
--data_dir ${EXP_DIR} /tasks
--hf_pretrained_model_name_or_path roberta-base
--tasks mrpc
--train_batch_size 16
--num_train_epochs 3Des exemples de flux de travail de formation plus complexes se trouvent ici.
Les directives de contribution du projet jiant peuvent être trouvées ici.
jiant v1.3.2 ? jiant v1.3.2 a été transféré à la légie Jiant-V1 pour soutenir les recherches en cours avec la bibliothèque. jiant v2.xx est plus modulaire et évolutif que jiant v1.3.2 et a été conçu pour refléter les besoins de la communauté de recherche NLP actuelle. Nous avons fortement recommandé que les nouveaux projets utilisent jiant v2.xx
jiant 1.x a été utilisé dans plusieurs articles. Pour des instructions sur la façon de reproduire des articles d'auteurs jiant qui renvoient les lecteurs à ce site pour la documentation (y compris Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.)
Si vous utilisez jiant ≥ v2.0.0 dans le travail académique, veuillez le citer directement:
@misc{phang2020jiant,
author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
howpublished = {url{http://jiant.info/}},
year = {2020}
}
Si vous utilisez jiant ≤ v1.3.2 Dans le travail académique, veuillez utiliser la citation trouvée ici.
jiant est libéré sous la licence du MIT.