Unduh jiant - Unduh Kode Sumber jiant

jiant

Kode sumber lainnya

v2.2.0: Easy to add any H

Unduh

UPDATE : Pada 2021/10/17, proyek jiant tidak lagi dipertahankan secara aktif. Ini berarti tidak akan ada rencana untuk menambahkan model, tugas, atau fitur baru, atau memperbarui dukungan ke perpustakaan baru.

`jiant` adalah toolkit NLP

Toolkit pembelajaran multitask dan transfer untuk penelitian pemrosesan bahasa alami

Mengapa saya harus menggunakan jiant ?

jiant mendukung pembelajaran multitask
jiant mendukung pembelajaran transfer
jiant mendukung 50+ tugas pemahaman bahasa alami
jiant mendukung tolok ukur berikut:
- LEM
- Superglue
- Xtreme
jiant adalah perpustakaan penelitian dan pengguna didorong untuk memperluas, mengubah, dan berkontribusi agar sesuai dengan kebutuhan mereka!

Beberapa hal tambahan yang mungkin ingin Anda ketahui tentang jiant :

jiant adalah file konfigurasi yang didorong
jiant dibangun dengan pytorch
jiant terintegrasi dengan datasets untuk mengelola data tugas
jiant terintegrasi dengan transformers untuk mengelola model dan tokenizer.

Memulai

Mulailah dengan beberapa contoh sederhana
Pelajari lebih lanjut tentang jiant dengan membaca pemandu kami
Lihat daftar tugas yang didukung kami

Instalasi

Untuk mengimpor jiant dari sumber (direkomendasikan untuk peneliti):

git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install -r requirements.txt

# Add the following to your .bash_rc or .bash_profile 
export PYTHONPATH=/path/to/jiant: $PYTHONPATH

Jika Anda berencana untuk berkontribusi pada Jiant, instal dependensi tambahan dengan pip install -r requirements-dev.txt .

Untuk menginstal jiant dari sumber (alternatif untuk peneliti):

 git clone https://github.com/nyu-mll/jiant.git
cd jiant
pip install . -e

Untuk menginstal jiant dari PIP (disarankan jika Anda hanya ingin melatih/menggunakan model):

 pip install jiant

Kami merekomendasikan agar Anda menginstal jiant di lingkungan virtual atau lingkungan Conda.

Untuk memeriksa jiant diinstal dengan benar, jalankan contoh sederhana.

Pendahuluan Cepat

Contoh berikut menyempurnakan model Roberta pada dataset MRPC.

Versi Python:

 from jiant . proj . simple import runscript as run
import jiant . scripts . download_data . runscript as downloader

EXP_DIR = "/path/to/exp"

# Download the Data
downloader . download_data ([ "mrpc" ], f" { EXP_DIR } /tasks" )

# Set up the arguments for the Simple API
args = run . RunConfiguration (
   run_name = "simple" ,
   exp_dir = EXP_DIR ,
   data_dir = f" { EXP_DIR } /tasks" ,
   hf_pretrained_model_name_or_path = "roberta-base" ,
   tasks = "mrpc" ,
   train_batch_size = 16 ,
   num_train_epochs = 3
)

# Run!
run . run_simple ( args )

Versi Bash:

EXP_DIR=/path/to/exp

python jiant/scripts/download_data/runscript.py 
    download 
    --tasks mrpc 
    --output_path ${EXP_DIR} /tasks
python jiant/proj/simple/runscript.py 
    run 
    --run_name simple 
    --exp_dir ${EXP_DIR} / 
    --data_dir ${EXP_DIR} /tasks 
    --hf_pretrained_model_name_or_path roberta-base 
    --tasks mrpc 
    --train_batch_size 16 
    --num_train_epochs 3

Contoh alur kerja pelatihan yang lebih kompleks ditemukan di sini.

Berkontribusi

Pedoman yang berkontribusi Proyek jiant dapat ditemukan di sini.

Mencari `jiant v1.3.2` ?

jiant v1.3.2 telah dipindahkan ke Jiant-V1-legacy untuk mendukung penelitian yang sedang berlangsung dengan perpustakaan. jiant v2.xx lebih modular dan dapat diskalakan daripada jiant v1.3.2 dan telah dirancang untuk mencerminkan kebutuhan komunitas penelitian NLP saat ini. Kami sangat merekomendasikan setiap proyek baru menggunakan jiant v2.xx

jiant 1.x telah digunakan di beberapa makalah. Untuk instruksi tentang cara mereproduksi makalah oleh penulis jiant yang merujuk pembaca ke situs ini untuk dokumentasi (termasuk Tenney et al., Wang et al., Bowman et al., Kim et al., Warstadt et al.), Lihat Jiant-V1-Legacy Readme.

Kutipan

Jika Anda menggunakan jiant ≥ v2.0.0 dalam pekerjaan akademik, silakan kutipnya secara langsung:

 @misc{phang2020jiant,
    author = {Jason Phang and Phil Yeres and Jesse Swanson and Haokun Liu and Ian F. Tenney and Phu Mon Htut and Clara Vania and Alex Wang and Samuel R. Bowman},
    title = {texttt{jiant} 2.0: A software toolkit for research on general-purpose text understanding models},
    howpublished = {url{http://jiant.info/}},
    year = {2020}
}

Jika Anda menggunakan jiant ≤ v1.3.2 dalam pekerjaan akademik, silakan gunakan kutipan yang ditemukan di sini.

Ucapan Terima Kasih

Pekerjaan ini dimungkinkan sebagian oleh donasi untuk NYU dari Eric dan Wendy Schmidt yang dibuat oleh rekomendasi Program Futures Schmidt, dan oleh Dukungan dari Intuit Inc.
Kami berterima kasih atas dukungan NVIDIA Corporation dengan sumbangan Titan V GPU yang digunakan di NYU dalam karya ini.
Pengembang Jesse Swanson didukung oleh lingkungan sains data Moore-Sloan sebagai bagian dari Inisiatif Layanan Ilmu Data NYU.