Download jiant - download do código -fonte jiant

jiant

Outro código-fonte

v2.2.0: Easy to add any H

Baixar

ATUALIZAÇÃO : Em 2021/10/17, o projeto jiant não está mais sendo mantido ativamente. Isso significa que não haverá planos para adicionar novos modelos, tarefas ou recursos ou atualizar suporte para novas bibliotecas.

`jiant` é um kit de ferramentas do NLP

O kit de ferramentas de aprendizado multitarefa e transferência para pesquisa de processamento de linguagem natural

Por que devo usar jiant ?

jiant suporta aprendizado multitarefa
jiant suporta o aprendizado de transferência
jiant suporta mais de 50 tarefas de compreensão da linguagem natural
jiant suporta os seguintes referências:
- COLA
- Supercola
- Xtreme
jiant é uma biblioteca de pesquisa e os usuários são incentivados a estender, mudar e contribuir para atender às suas necessidades!

Algumas coisas adicionais que você pode querer saber sobre jiant :

jiant é orientado ao arquivo de configuração
jiant é construído com pytorch
jiant se integra aos datasets para gerenciar dados de tarefas
jiant se integra aos transformers para gerenciar modelos e tokenizadores.

Começando

Comece com alguns exemplos simples
Saiba mais sobre jiant lendo nossos guias
Veja nossa lista de tarefas suportadas

Instalação

Para importar jiant da fonte (recomendado para pesquisadores):

git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt

# Add the following to your .bash_rc or .bash_profile 
export PYTHONPATH=/path/to/jiant: $PYTHONPATH

Se você planeja contribuir com o Jiant, instale dependências adicionais com pip install -r requirements-dev.txt .

Para instalar jiant da fonte (alternativa para pesquisadores):

 git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e

Para instalar jiant a partir do PIP (recomendado se você deseja apenas treinar/usar um modelo):

 pip install jiant

Recomendamos que você instalasse jiant em um ambiente virtual ou em um ambiente do CONDA.

Para verificar jiant foi instalado corretamente, execute um exemplo simples.

Introdução rápida

O exemplo seguinte fina-tunes um modelo Roberta no conjunto de dados MRPC.

Versão Python:

 from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader

EXP_DIR = "/path/to/exp"

# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )

# Set up the arguments for the Simple API
args = run . RunConfiguration (
   run_name = "simple" ,
   exp_dir = EXP_DIR ,
   data_dir = f" { EXP_DIR } /tasks" ,
   hf_pretrained_model_name_or_path = "roberta-base" ,
   tasks = "mrpc" ,
   train_batch_size = 16 ,
   num_train_epochs = 3
)

# Run!
run . run_simple ( args )

Versão Bash:

EXP_DIR=/path/to/exp

python jiant/scripts/download_data/runscript.py 
    download 
    --tasks mrpc 
    --output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py 
    run 
    --run_name simple 
    --exp_dir ${EXP_DIR} / 
    --data_dir ${EXP_DIR} /tasks 
    --hf_pretrained_model_name_or_path roberta-base 
    --tasks mrpc 
    --train_batch_size 16 
    --num_train_epochs 3

Exemplos de fluxos de trabalho de treinamento mais complexos são encontrados aqui.

Contribuindo

As diretrizes contribuintes do jiant Project podem ser encontradas aqui.

Procurando por `jiant v1.3.2` ?

jiant v1.3.2 foi transferido para o Jiant-V1-Legacy para apoiar a pesquisa em andamento na biblioteca. jiant v2.xx é mais modular e escalável que jiant v1.3.2 e foi projetado para refletir as necessidades da atual comunidade de pesquisa da PNL. Recomendamos fortemente que todos os novos projetos usassem jiant v2.xx

jiant 1.x foi usado em vários papéis. Para instruções sobre como reproduzir artigos de autores jiant que se referem a este site para documentação (incluindo Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.), Consulte o Readme de Jiant-V1-Legacy.

Citação

Se você usar jiant ≥ v2.0.0 no trabalho acadêmico, cite -o diretamente:

 @misc{phang2020jiant,
    author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
    title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
    howpublished = {url{http://jiant.info/}},
    year = {2020}
}

Se você usar jiant ≤ v1.3.2 no trabalho acadêmico, use a citação encontrada aqui.

Agradecimentos

Este trabalho foi possível em parte por uma doação para a NYU de Eric e Wendy Schmidt feita pela recomendação do Programa de Futuros de Schmidt e pelo apoio da Intuit Inc.
Agradecemos o apoio da Nvidia Corporation com a doação de uma GPU Titan V usada na NYU neste trabalho.
O desenvolvedor Jesse Swanson é apoiado pelo ambiente de ciência de dados Moore-Sloan como parte da Iniciativa de Serviços de Ciência de Dados da NYU.