ATUALIZAÇÃO : Em 2021/10/17, o projeto jiant não está mais sendo mantido ativamente. Isso significa que não haverá planos para adicionar novos modelos, tarefas ou recursos ou atualizar suporte para novas bibliotecas.
jiant é um kit de ferramentas do NLPO kit de ferramentas de aprendizado multitarefa e transferência para pesquisa de processamento de linguagem natural
Por que devo usar jiant ?
jiant suporta aprendizado multitarefajiant suporta o aprendizado de transferênciajiant suporta mais de 50 tarefas de compreensão da linguagem naturaljiant suporta os seguintes referências:jiant é uma biblioteca de pesquisa e os usuários são incentivados a estender, mudar e contribuir para atender às suas necessidades! Algumas coisas adicionais que você pode querer saber sobre jiant :
jiant é orientado ao arquivo de configuraçãojiant é construído com pytorchjiant se integra aos datasets para gerenciar dados de tarefasjiant se integra aos transformers para gerenciar modelos e tokenizadores. jiant lendo nossos guias Para importar jiant da fonte (recomendado para pesquisadores):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt
# Add the following to your .bash_rc or .bash_profile
export PYTHONPATH=/path/to/jiant: $PYTHONPATH Se você planeja contribuir com o Jiant, instale dependências adicionais com pip install -r requirements-dev.txt .
Para instalar jiant da fonte (alternativa para pesquisadores):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e
Para instalar jiant a partir do PIP (recomendado se você deseja apenas treinar/usar um modelo):
pip install jiant
Recomendamos que você instalasse jiant em um ambiente virtual ou em um ambiente do CONDA.
Para verificar jiant foi instalado corretamente, execute um exemplo simples.
O exemplo seguinte fina-tunes um modelo Roberta no conjunto de dados MRPC.
Versão Python:
from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader
EXP_DIR = "/path/to/exp"
# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )
# Set up the arguments for the Simple API
args = run . RunConfiguration (
run_name = "simple" ,
exp_dir = EXP_DIR ,
data_dir = f" { EXP_DIR } /tasks" ,
hf_pretrained_model_name_or_path = "roberta-base" ,
tasks = "mrpc" ,
train_batch_size = 16 ,
num_train_epochs = 3
)
# Run!
run . run_simple ( args )Versão Bash:
EXP_DIR=/path/to/exp
python jiant/scripts/download_data/runscript.py
download
--tasks mrpc
--output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py
run
--run_name simple
--exp_dir ${EXP_DIR} /
--data_dir ${EXP_DIR} /tasks
--hf_pretrained_model_name_or_path roberta-base
--tasks mrpc
--train_batch_size 16
--num_train_epochs 3Exemplos de fluxos de trabalho de treinamento mais complexos são encontrados aqui.
As diretrizes contribuintes do jiant Project podem ser encontradas aqui.
jiant v1.3.2 ? jiant v1.3.2 foi transferido para o Jiant-V1-Legacy para apoiar a pesquisa em andamento na biblioteca. jiant v2.xx é mais modular e escalável que jiant v1.3.2 e foi projetado para refletir as necessidades da atual comunidade de pesquisa da PNL. Recomendamos fortemente que todos os novos projetos usassem jiant v2.xx
jiant 1.x foi usado em vários papéis. Para instruções sobre como reproduzir artigos de autores jiant que se referem a este site para documentação (incluindo Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.), Consulte o Readme de Jiant-V1-Legacy.
Se você usar jiant ≥ v2.0.0 no trabalho acadêmico, cite -o diretamente:
@misc{phang2020jiant,
author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
howpublished = {url{http://jiant.info/}},
year = {2020}
}
Se você usar jiant ≤ v1.3.2 no trabalho acadêmico, use a citação encontrada aqui.
jiant é liberado sob a licença do MIT.