transfer nlp Download - transfer nlp Sumber Code Unduh

transfer nlp

Kode sumber lainnya

Make PyTorch an optional dependency

Unduh

Selamat datang di perpustakaan transfer NLP, kerangka kerja yang dibangun di atas Pytorch untuk mempromosikan eksperimen yang dapat direproduksi dan transfer pembelajaran di NLP

Anda dapat memiliki ikhtisar API tingkat tinggi pada notebook Colab ini, yang menunjukkan cara menggunakan kerangka kerja pada beberapa contoh. Semua contoh berbasis DL pada notebook ini menyematkan sela pelatihan Tensorboard dalam sel!

Untuk contoh finetuning model pra-terlatih, kami menyediakan tutorial singkat yang dapat dieksekusi tentang Bertclassifier Finetuning di Colab Notebook ini

Siapkan lingkungan Anda

 mkvirtualenv transfernlp
workon transfernlp

git clone https://github.com/feedly/transfer-nlp.git
cd transfer-nlp
pip install -r requirements.txt

Untuk menggunakan transfer NLP sebagai perpustakaan:

 # to install the experiment builder only
pip install transfernlp
# to install Transfer NLP with PyTorch and Transfer Learning in NLP support
pip install transfernlp[torch]

atau

 pip install git+https://github.com/feedly/transfer-nlp.git

Untuk mendapatkan negara terbaru sebelum rilis baru.

Untuk menggunakan transfer NLP dengan contoh terkait:

 git clone https://github.com/feedly/transfer-nlp.git
pip install -r requirements.txt

Dokumentasi

Dokumentasi API dan gambaran umum perpustakaan dapat ditemukan di sini

Manajer Eksperimen yang Dapat Diproduksi

Inti perpustakaan terbuat dari pembangun percobaan: Anda mendefinisikan berbagai objek yang dibutuhkan percobaan Anda, dan loader konfigurasi membangunnya dengan cara yang baik. Untuk penelitian yang dapat direproduksi dan studi ablasi yang mudah, perpustakaan kemudian menegakkan penggunaan file konfigurasi untuk percobaan. Karena orang memiliki selera yang berbeda untuk apa yang merupakan file percobaan yang baik, perpustakaan memungkinkan untuk percobaan yang ditentukan dalam beberapa format:

Kamus Python
Json
Yaml
Toml

Di Transfer-NLP, file konfigurasi eksperimen berisi semua informasi yang diperlukan untuk mendefinisikan sepenuhnya percobaan. Di sinilah Anda akan memasukkan nama dari berbagai komponen yang akan digunakan percobaan Anda, bersama dengan hiperparameter yang ingin Anda gunakan. Transfer-NLP memanfaatkan inversi pola kontrol, yang memungkinkan Anda untuk mendefinisikan kelas / metode / fungsi apa pun yang Anda butuhkan, kelas ExperimentConfig akan membuat kamus dan membuat objek Anda sesuai.

Untuk menggunakan kelas Anda sendiri di dalam Transfer-NLP, Anda perlu mendaftarkannya menggunakan dekorator @register_plugin . Alih -alih menggunakan registri yang berbeda untuk setiap jenis komponen (model, loader data, vektoris, pengoptimal, ...), hanya satu registri yang digunakan di sini, untuk menegakkan kustomisasi total.

Jika Anda menggunakan transfer NLP sebagai ketergantungan dev saja, Anda mungkin ingin menggunakannya saja secara deklaratif, dan hubungi register_plugin() pada objek yang ingin Anda gunakan pada waktu berjalan eksperimen.

Berikut adalah contoh bagaimana Anda dapat mendefinisikan percobaan dalam file YAML:

 data_loader:
  _name: MyDataLoader
  data_parameter: foo
  data_vectorizer:
    _name: MyVectorizer
    vectorizer_parameter: bar

model:
  _name: MyModel
  model_hyper_param: 100
  data: $data_loader

trainer:
  _name: MyTrainer
  model: $model
  data: $data_loader
  loss:
    _name: PyTorchLoss
  tensorboard_logs: $HOME/path/to/tensorboard/logs
  metrics:
    accuracy:
      _name: Accuracy

Objek apa pun dapat didefinisikan melalui kelas, metode atau fungsi, diberikan parameter _name diikuti oleh parameternya sendiri. Eksperimen kemudian dimuat dan dipakai menggunakan ExperimentConfig(experiment=experiment_path_or_dict)

Beberapa pertimbangan:

Parameter default dapat dilewati dalam file percobaan.
Jika suatu objek digunakan di tempat yang berbeda, Anda dapat merujuknya menggunakan simbol $ , misalnya di sini objek trainer menggunakan data_loader yang dipakai di tempat lain. Tidak diperlukan pemesanan objek.
Untuk jalur, Anda mungkin ingin menggunakan variabel lingkungan sehingga mesin lain juga dapat menjalankan eksperimen Anda. Dalam contoh sebelumnya, Anda akan menjalankan EG ExperimentConfig(experiment=yaml_path, HOME=Path.home()) untuk membuat instantiate eksperimen dan mengganti $HOME dengan jalur rumah mesin Anda.
Instantiasi konfigurasi memungkinkan untuk pengaturan kompleks dengan dikt / daftar bersarang

Anda dapat melihat tes untuk contoh pengaturan percobaan yang dapat dibangun oleh config loader. Selain itu, kami memberikan eksperimen yang dapat dijalankan dalam experiments/ .

Transfer Pembelajaran di NLP: Pelatih Pytorch Fleksibel

Untuk eksperimen pembelajaran yang mendalam, kami menyediakan BaseIgniteTrainer di transfer_nlp.plugins.trainers.py . Pelatih dasar ini akan mengambil model dan beberapa data sebagai input, dan menjalankan pipa pelatihan utuh. Kami memanfaatkan perpustakaan Pytorch-Ignite untuk memantau acara selama pelatihan (mencatat beberapa metrik, memanipulasi tingkat pembelajaran, model pos pemeriksaan, dll ...). Log Tensorboard juga disertakan sebagai opsi, Anda harus menentukan jalur parameter sederhana tensorboard_logs dalam file konfigurasi. Kemudian jalankan saja tensorboard --logdir=path/to/logs di terminal dan Anda dapat memantau eksperimen Anda saat pelatihan! Tensorboard hadir dengan utilitas yang sangat bagus untuk melacak norma -norma bobot model Anda, histogram, distribusi, memvisualisasikan embeddings, dll jadi kami sangat menyarankan untuk menggunakannya.

Kami menyediakan kelas SingleTaskTrainer yang dapat Anda gunakan untuk pengaturan yang diawasi yang berurusan dengan satu tugas. Kami sedang mengerjakan kelas MultiTaskTrainer untuk menangani pengaturan multi -tugas, dan SingleTaskFineTuner untuk model finetuning model besar.

Menggunakan kasus

Berikut adalah beberapa kasus penggunaan untuk transfer NLP:

Anda memiliki semua kelas / metode / fungsi Anda siap. Transfer NLP memungkinkan cara yang bersih untuk memusatkan pemuatan dan melaksanakan eksperimen Anda
Anda memiliki semua kelas Anda tetapi Anda ingin membandingkan beberapa pengaturan konfigurasi: Kelas ExperimentRunner memungkinkan untuk menjalankan set eksperimen Anda secara berurutan, dan menghasilkan pelaporan yang dipersonalisasi (Anda hanya perlu mengimplementasikan metode report Anda di kelas ReporterABC khusus)
Anda ingin bereksperimen dengan melatih model pembelajaran yang mendalam tetapi Anda merasa kewalahan dengan semua kode boilerplate dalam proyek SOTA Github. Transfer NLP mendorong pemisahan objek penting sehingga Anda dapat fokus pada implementasi Module Pytorch dan membiarkan pelatih berurusan dengan bagian pelatihan (sambil tetap mengendalikan sebagian besar parameter pelatihan melalui file percobaan)
Anda ingin bereksperimen dengan strategi pelatihan yang lebih maju, tetapi Anda lebih tertarik pada ide daripada detail implementasi. Kami sedang berupaya meningkatkan pelatih canggih sehingga akan lebih mudah untuk mencoba ide-ide baru untuk pengaturan multi tugas, strategi penyempurnaan atau skema adaptasi model.

Integrasi kendur

Saat bereksperimen dengan model / data Anda sendiri, pelatihan mungkin memakan waktu. Untuk mendapatkan pemberitahuan ketika pelatihan Anda selesai atau macet, Anda dapat menggunakan knockknock perpustakaan sederhana oleh orang-orang di HuggingFace, yang menambahkan dekorator sederhana ke fungsi berjalan Anda untuk memberi tahu Anda melalui Slack, E-mail, dll.

Beberapa tujuan untuk dijangkau:

Sertakan contoh menggunakan model pra-terlatih canggih
Sertakan sifat linguistik ke model
Eksperimen dengan RL untuk tugas berurutan
Sertakan tugas menyelidik untuk mencoba memahami sifat -sifat yang dipelajari oleh model

Pengakuan

Perpustakaan telah terinspirasi oleh pembacaan "pemrosesan bahasa alami dengan Pytorch" oleh Delip Rao dan Brian McMahan. Eksperimen dalam experiments , blok bangunan kosa kata dan tetangga terdekat diambil atau diadaptasi dari kode yang disediakan dalam buku ini.

Memperluas

Informasi Tambahan

Versi Make PyTorch an optional dependency
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-19
ukuran 2.61MB
Berasal dari Github

Aplikasi Terkait

Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua