UPDATE : Pada 2021/10/17, proyek jiant tidak lagi dipertahankan secara aktif. Ini berarti tidak akan ada rencana untuk menambahkan model, tugas, atau fitur baru, atau memperbarui dukungan ke perpustakaan baru.
jiant adalah toolkit NLPToolkit pembelajaran multitask dan transfer untuk penelitian pemrosesan bahasa alami
Mengapa saya harus menggunakan jiant ?
jiant mendukung pembelajaran multitaskjiant mendukung pembelajaran transferjiant mendukung 50+ tugas pemahaman bahasa alamijiant mendukung tolok ukur berikut:jiant adalah perpustakaan penelitian dan pengguna didorong untuk memperluas, mengubah, dan berkontribusi agar sesuai dengan kebutuhan mereka! Beberapa hal tambahan yang mungkin ingin Anda ketahui tentang jiant :
jiant adalah file konfigurasi yang didorongjiant dibangun dengan pytorchjiant terintegrasi dengan datasets untuk mengelola data tugasjiant terintegrasi dengan transformers untuk mengelola model dan tokenizer. jiant dengan membaca pemandu kami Untuk mengimpor jiant dari sumber (direkomendasikan untuk peneliti):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt
# Add the following to your .bash_rc or .bash_profile
export PYTHONPATH=/path/to/jiant: $PYTHONPATH Jika Anda berencana untuk berkontribusi pada Jiant, instal dependensi tambahan dengan pip install -r requirements-dev.txt .
Untuk menginstal jiant dari sumber (alternatif untuk peneliti):
git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e
Untuk menginstal jiant dari PIP (disarankan jika Anda hanya ingin melatih/menggunakan model):
pip install jiant
Kami merekomendasikan agar Anda menginstal jiant di lingkungan virtual atau lingkungan Conda.
Untuk memeriksa jiant diinstal dengan benar, jalankan contoh sederhana.
Contoh berikut menyempurnakan model Roberta pada dataset MRPC.
Versi Python:
from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader
EXP_DIR = "/path/to/exp"
# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )
# Set up the arguments for the Simple API
args = run . RunConfiguration (
run_name = "simple" ,
exp_dir = EXP_DIR ,
data_dir = f" { EXP_DIR } /tasks" ,
hf_pretrained_model_name_or_path = "roberta-base" ,
tasks = "mrpc" ,
train_batch_size = 16 ,
num_train_epochs = 3
)
# Run!
run . run_simple ( args )Versi Bash:
EXP_DIR=/path/to/exp
python jiant/scripts/download_data/runscript.py
download
--tasks mrpc
--output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py
run
--run_name simple
--exp_dir ${EXP_DIR} /
--data_dir ${EXP_DIR} /tasks
--hf_pretrained_model_name_or_path roberta-base
--tasks mrpc
--train_batch_size 16
--num_train_epochs 3Contoh alur kerja pelatihan yang lebih kompleks ditemukan di sini.
Pedoman yang berkontribusi Proyek jiant dapat ditemukan di sini.
jiant v1.3.2 ? jiant v1.3.2 telah dipindahkan ke Jiant-V1-legacy untuk mendukung penelitian yang sedang berlangsung dengan perpustakaan. jiant v2.xx lebih modular dan dapat diskalakan daripada jiant v1.3.2 dan telah dirancang untuk mencerminkan kebutuhan komunitas penelitian NLP saat ini. Kami sangat merekomendasikan setiap proyek baru menggunakan jiant v2.xx
jiant 1.x telah digunakan di beberapa makalah. Untuk instruksi tentang cara mereproduksi makalah oleh penulis jiant yang merujuk pembaca ke situs ini untuk dokumentasi (termasuk Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.), Lihat Jiant-V1-Legacy Readme.
Jika Anda menggunakan jiant ≥ v2.0.0 dalam pekerjaan akademik, silakan kutipnya secara langsung:
@misc{phang2020jiant,
author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
howpublished = {url{http://jiant.info/}},
year = {2020}
}
Jika Anda menggunakan jiant ≤ v1.3.2 dalam pekerjaan akademik, silakan gunakan kutipan yang ditemukan di sini.
jiant dirilis di bawah lisensi MIT.