Unduh bi att flow - Unduh Kode Sumber bi att flow

bi att flow

Kode sumber lainnya

1.0.0

Unduh

Aliran perhatian dua arah untuk pemahaman mesin

Ini implementasi asli dari aliran perhatian dua arah untuk pemahaman mesin.
Lembar kerja codalab untuk pengajuan papan peringkat pasukan tersedia di sini.
Untuk versi TensorFlow v1.2 yang kompatibel, lihat cabang dev.
Silakan hubungi Minjoon SEO (@seominjoon) untuk pertanyaan dan saran.

0. Persyaratan

Umum

Python (diverifikasi pada 3.5.2. Masalah telah dilaporkan dengan Python 2!)
unzip, wget (hanya untuk menjalankan download.sh )

Paket Python

TensorFlow (Perpustakaan Pembelajaran yang Dalam, hanya berfungsi pada R0.11)
NLTK (Alat NLP, diverifikasi pada 3.2.1)
TQDM (bilah kemajuan, diverifikasi pada 4.7.4)
jinja2 (untuk visa; jika Anda hanya melatih dan menguji, tidak diperlukan)

1. Pra-pemrosesan

Pertama, siapkan data. Donwload Squad Data and Glove dan NLTK Corpus (~ 850 MB, ini akan mengunduh file ke $HOME/data ):

 chmod +x download.sh; ./download.sh

Kedua, preprocess stanford qa dataset (bersama dengan vektor sarung tangan) dan menyimpannya dalam $PWD/data/squad (~ 5 menit):

 python -m squad.prepro

2. Pelatihan

Model ini memiliki parameter ~ 2,5m. Model ini dilatih dengan Nvidia Titan X (Pascal Architecture, 2016). Model ini membutuhkan setidaknya 12GB RAM GPU. Jika RAM GPU Anda lebih kecil dari 12GB, Anda dapat mengurangi ukuran batch (kinerja mungkin menurun), atau Anda dapat menggunakan multi GPU (lihat di bawah). Pelatihan itu menyatu pada langkah ~ 18k, dan butuh ~ 4s per langkah (yaitu ~ 20 jam).

Sebelum pelatihan, disarankan untuk terlebih dahulu mencoba kode berikut untuk memverifikasi semuanya baik -baik saja dan memori sudah cukup:

 python -m basic.cli --mode train --noload --debug

Kemudian untuk melatih sepenuhnya, lari:

 python -m basic.cli --mode train --noload

Anda dapat mempercepat proses pelatihan dengan bendera optimasi:

 python -m basic.cli --mode train --noload --len_opt --cluster

Anda masih bisa menghilangkannya, tetapi pelatihan akan jauh lebih lambat.

Perhatikan bahwa selama pelatihan, skor EM dan F1 dari evaluasi sesekali tidak sama dengan skor dari skrip evaluasi pasukan resmi. Skor yang dicetak tidak resmi (skema penilaian kami sedikit lebih keras). Untuk mendapatkan nomor resmi, gunakan evaluator resmi (disalin dalam folder squad , squad/evaluate-v1.1.py ). Untuk informasi lebih lanjut lihat 3. Test.

3. Tes

Untuk menguji, jalankan:

 python -m basic.cli

Demikian pula dengan pelatihan, Anda dapat memberikan bendera optimasi untuk mempercepat tes (5 menit pada data dev):

 python -m basic.cli --len_opt --cluster

Perintah ini memuat model yang paling baru disimpan selama pelatihan dan mulai menguji pada data uji. Setelah proses berakhir, ia mencetak skor F1 dan EM, dan juga mengeluarkan file JSON ( $PWD/out/basic/00/answer/test-####.json , di mana #### adalah langkah#yang disimpan model). Perhatikan bahwa skor yang dicetak tidak resmi (skema penilaian kami sedikit lebih keras). Untuk mendapatkan nomor resmi, gunakan evaluator resmi (disalin dalam folder squad ) dan file output JSON:

 python squad/evaluate-v1.1.py $HOME/data/squad/dev-v1.1.json out/basic/00/answer/test-####.json

3.1 Memuat dari bobot pra-terlatih

Alih-alih melatih modelnya sendiri, Anda dapat memilih untuk menggunakan bobot pra-terlatih yang digunakan untuk penyerahan papan peringkat pasukan. Lihat lembar kerja ini di Codalab untuk mereproduksi hasilnya. Jika Anda tidak terbiasa dengan Codalab, ikuti langkah -langkah sederhana ini (mengingat bahwa Anda bertemu semua prereq di atas):

Unduh save.zip dari lembar kerja dan unzip di direktori saat ini.
Salin glove.6B.100d.txt dari folder data Glove Anda ( $HOME/data/glove/ ) ke direktori saat ini.
Untuk mereproduksi model tunggal:

 basic/run_single.sh $HOME/data/squad/dev-v1.1.json single.json

Ini menulis jawaban untuk single.json di direktori saat ini. Anda kemudian dapat menggunakan evaluator resmi untuk mendapatkan skor EM dan F1. Jika Anda ingin menjalankan pada GPU (~ 5 menit), ubah nilai bendera Batch_Size dalam file shell ke angka yang lebih tinggi (60 untuk RAM GPU 12GB). 4. Demikian pula, untuk mereproduksi metode ensemble:

 basic/run_ensemble.sh $HOME/data/squad/dev-v1.1.json ensemble.json

Jika Anda ingin menjalankan di GPU, Anda harus menjalankan skrip secara berurutan dengan menghapus '&' di forloop, atau Anda perlu menentukan GPU yang berbeda untuk setiap menjalankan loop untuk.

Hasil

Data dev

Perhatikan skor ini berasal dari evaluator resmi (disalin dalam folder squad , squad/evaluate-v1.1.py ). Untuk informasi lebih lanjut lihat 3. Test. Skor muncul selama pelatihan bisa lebih rendah dari skor dari evaluator resmi.

	Em (%)	F1 (%)
lajang	67.7	77.3
ansambel	72.6	80.7

Data uji

	Em (%)	F1 (%)
lajang	68.0	77.3
ansambel	73.3	81.1

Lihat makalah kami untuk detail lebih lanjut. Lihat papan peringkat pasukan untuk dibandingkan dengan model lain.

Pelatihan & Pengujian Multi-GPU

Model kami mendukung pelatihan multi-GPU. Kami mengikuti paradigma paralelisasi yang dijelaskan dalam tutorial TensorFlow. Singkatnya, jika Anda ingin menggunakan ukuran batch 60 (default) tetapi jika Anda memiliki 3 GPU dengan 4GB RAM, maka Anda menginisialisasi setiap GPU dengan ukuran batch 20, dan gabungkan gradien pada CPU. Ini dapat dengan mudah dilakukan dengan menjalankan:

 python -m basic.cli --mode train --noload --num_gpus 3 --batch_size 20

Demikian pula, Anda dapat mempercepat pengujian dengan:

 python -m basic.cli --num_gpus 3 --batch_size 20

Demo

Untuk saat ini, silakan merujuk ke cabang demo dari repositori ini.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-17
ukuran 136.66KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Versi seluler Aliran Warna 3D

2023-10-23
MENGALIR

2023-07-14
Pengalaman Arus

2022-07-26

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua