Unduh hmtl - Unduh Kode Sumber hmtl

hmtl

Kode sumber lainnya

1.0.0

Unduh

HMTL (model pembelajaran multi-tugas hierarkis)

***** Baru 20 November 2018: Demo web online tersedia *****

Kami merilis demo online (bersama dengan bobot terlatih) sehingga Anda dapat bermain sendiri dengan model. Kode untuk antarmuka web juga tersedia di folder demo .

Untuk mengunduh model pra-terlatih, silakan instal GIT LFS dan lakukan git lfs pull . Bobot model akan disimpan di folder Model_Dumps.

Pendekatan multi-tugas hierarkis untuk belajar embeddings dari tugas semantik
Victor Sanh, Thomas Wolf, Sebastian Ruder
Diterima di AAAI 2019

Arsitektur HMTL

Tentang

HMTL adalah model pembelajaran multi-tugas hierarkis yang menggabungkan satu set empat tugas semantik yang dipilih dengan cermat (yaitu recoginition entitas yang disebutkan, deteksi penyebutan entitas, ekstraksi relasi dan resolusi coreference). Model ini mencapai hasil canggih pada pengakuan entitas yang disebutkan, deteksi yang menyebutkan entitas dan ekstraksi hubungan. Menggunakan SentEval, kami menunjukkan bahwa saat kami bergerak dari bawah ke lapisan atas model, model cenderung mempelajari representasi semantik yang lebih kompleks.

Untuk perincian lebih lanjut tentang hasilnya, silakan merujuk ke makalah kami.

Kami merilis kode untuk pelatihan , fine tuning , dan mengevaluasi HMTL. Kami berharap kode ini akan berguna untuk membangun model multi-tugas Anda sendiri (hierarkis atau tidak). Kode ini ditulis dalam Python dan didukung oleh Pytorch .

Ketergantungan dan instalasi

Ketergantungan utamanya adalah:

Allennlp
Pytorch
Senteval (hanya untuk mengevaluasi embeddings)

Kode berfungsi dengan Python 3.6 . Versi dependensi yang stabil tercantum dalam requirements.txt .

Anda dapat dengan cepat mengatur lingkungan kerja dengan memanggil skrip ./script/machine_setup.sh . Ini menginstal Python 3.6, menciptakan lingkungan virtual yang bersih, dan menginstal semua dependensi yang diperlukan (tercantum dalam requirements.txt ). Harap beradaptasi skrip tergantung pada kebutuhan Anda.

Contoh penggunaan

Kami mendasarkan implementasi kami di Perpustakaan Allennlp. Untuk pengantar perpustakaan ini, Anda harus memeriksa tutorial ini.

Eksperimen didefinisikan dalam file konfigurasi JSON (lihat configs/*.json untuk contoh). File konfigurasi terutama menjelaskan dataset untuk dimuat, model yang akan dibuat bersama dengan semua hyper-parameter model.

Setelah Anda mengatur file konfigurasi Anda (dan kelas kustom yang ditentukan seperti DatasetReaders jika diperlukan), Anda dapat meluncurkan pelatihan dengan perintah dan argumen berikut:

python train.py --config_file_path configs/hmtl_coref_conll.json --serialization_dir my_first_training

Setelah pelatihan dimulai, Anda cukup mengikuti pelatihan di terminal atau membuka Tensorboard (pastikan Anda telah menginstal Tensorboard dan TensorFlow Dependecy sebelumnya):

tensorboard --logdir my_first_training/log

Mengevaluasi embeddings dengan senteval

Kami menggunakan SentEval untuk menilai sifat linguistik yang dipelajari oleh model. hmtl_senteval.py memberikan contoh bagaimana kita dapat membuat antarmuka antara SentEval dan HMTL. Ini mengevaluasi sifat -sifat linguistik yang dipelajari oleh setiap lapisan Hiarchy (kata embeddings dan encoder kata berbasis bersama).

Data

Untuk mengunduh embeddings pra-terlatih yang kami gunakan di HMTL, Anda dapat meluncurkan skrip ./script/data_setup.sh .

Kami tidak melampirkan kumpulan data yang digunakan untuk melatih HMTL karena alasan lisensi, tetapi kami mengundang Anda untuk mengumpulkannya sendiri: Ontonotes 5.0, Conll2003, dan ACE2005. File konfigurasi mengharapkan dataset ditempatkan di data/ folder.

Referensi

Harap pertimbangkan mengutip makalah berikut jika Anda menemukan repositori ini bermanfaat.

 @article{sanh2018hmtl,
  title={A Hierarchical Multi-task Approach for Learning Embeddings from Semantic Tasks},
  author={Sanh, Victor and Wolf, Thomas and Ruder, Sebastian},
  journal={arXiv preprint arXiv:1811.06031},
  year={2018}
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-16
ukuran 1.12MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua