pytorch question answering Download - pytorch question answering Kode Sumber Unduh

pytorch question answering

Kode sumber lainnya

1.0.0

Unduh

Pertanyaan Pytorch menjawab

Repositori ini berisi implementasi dari beberapa makalah terpenting untuk menjawab pertanyaan. Implementasinya dalam bentuk tutorial dan kira -kira anotasi dari makalah tersebut. Repositori ini mungkin bermanfaat bagi mereka yang mengetahui dasar -dasar pembelajaran mendalam dan NLP, ingin memulai dengan membaca makalah yang sedikit kompleks dan melihat bagaimana mereka diimplementasikan. Repositori ini juga mengasumsikan beberapa keakraban dengan dasar -dasar Pytorch, meskipun saya telah mencoba yang terbaik untuk memecah semuanya secara sederhana.

Pertanyaan menjawab

Menjawab pertanyaan adalah tugas penting berdasarkan kecerdasan sistem NLP dan AI secara umum dapat dinilai. Sistem QA diberikan paragraf pendek atau konteks tentang beberapa topik dan ditanya beberapa pertanyaan berdasarkan bagian tersebut. Jawaban atas pertanyaan -pertanyaan ini adalah rentang konteks, yaitu mereka tersedia secara langsung dalam bagian tersebut. Untuk melatih model seperti itu, kami menggunakan dataset pasukan.

Memulai

Buku catatan bernama "Pipa preprocessing NLP untuk QA" berisi semua kode preprocessing yang telah saya tulis. Kode preprocessing tidak menggunakan perpustakaan tingkat tinggi dan saya telah menulis semua fungsi dari awal. Ini hanya menggunakan spacy untuk tokenisasi. Fungsi yang diimplementasikan di sini umum untuk banyak tugas NLP dan karenanya mungkin berguna bagi seseorang yang baru memulai. Misalnya: Membuat kosa kata, matriks berat untuk embeddings pretrained, dataset/datasoaders dll. Di belakang, menggunakan beberapa perpustakaan tingkat tinggi seperti TorchText akan menjadi ide yang lebih baik dan saya saat ini sedang mengerjakan hal yang sama.

Pendekatan berbasis tensor

Semua buku catatan didasarkan pada pendekatan ini. Pada akhirnya, membangun jaring saraf adalah tentang bekerja dengan tensor. Mengetahui bentuk dan isi setiap tensor adalah sesuatu yang saya temukan sangat berguna saat belajar. Oleh karena itu, setelah setiap baris kode, saya telah mengomentari bentuk tensor dan perubahan yang terjadi karena transformasi dalam kode. Ini membuat proses memahami apa yang terjadi di jaring saraf lebih intuitif.

Lingkungan pelatihan

Saya tidak memiliki akses tak terbatas ke GPU yang lebih cepat. Model -model di bawah ini telah dilatih dengan menyewa GPU di Vast.ai. Saya menggunakan GTX 1080 Ti untuk sebagian besar percobaan saya.

Dokumen

1. DRQA

Dalam buku catatan pertama, kami menerapkan model yang relatif sederhana yang melibatkan LSTM multi-lapisan dan perhatian bilinear. Detail dan intuisi setiap lapisan/komponen dijelaskan sebelum melompat ke kode. Model ini sangat mirip dengan yang dibahas dalam makalah ini dan juga memiliki penulis pertama yang sama: Danqi Chen. Model kedua juga dikenal sebagai "pembaca Stanfor yang penuh perhatian". Model yang diimplementasikan dalam buku catatan sedikit canggih dari ini. Hasil pada set dev yang diperoleh adalah:

Zaman	Em	F1
5	56.4	68.2

Saya akan melatih ini lebih banyak untuk meningkatkan hasil dan akan segera memperbaruinya.

2. Aliran perhatian dua arah (BIDAF)

Selanjutnya, kami beralih ke kertas yang sedikit lebih kompleks. Makalah ini meningkatkan hasil yang diperoleh dari makalah sebelumnya. Model yang diimplementasikan di sini tidak seperti yang sebelumnya adalah arsitektur hierarkis multi-tahap yang mewakili konteks dan kueri di berbagai tingkat granularitas. Makalah ini juga melibatkan kekambuhan karena secara luas menggunakan LSTM dan mekanisme perhatian tanpa memori yang bersifat dua arah. Buku catatan ini membahas secara rinci tentang beberapa teknik NLP penting seperti embeddings karakter , jaringan jalan raya . Hasil di set dev:

Zaman	Em	F1
5	60.4	70.1

3. Qanet

Akhirnya, kami menjauh dari kekambuhan dan hanya menggunakan perhatian dan konvolusi diri. Makalah ini menarik inspirasi dari "perhatian adalah yang Anda butuhkan". Motivasi utama di balik desain model adalah: Convolution menangkap struktur lokal teks, sementara perhatian diri mempelajari interaksi global antara setiap pasangan kata. Tutorial ini menjelaskan topik-topik seperti perhatian diri , dan konvolusi yang dapat dipisahkan secara mendalam . Hasil di set dev:

Zaman	Em	F1
3	*	36.6

Saya saat ini melatih model ini. Saat ini saya kekurangan waktu dan saya tidak memiliki akses ke GPU yang lebih cepat. Melatih ini untuk 1 zaman membutuhkan waktu sekitar 1 jam di GTX 1080 Ti.

Kontribusi

Saya bukan ahli. Motif utama saya di balik proyek ini adalah belajar tentang domain NLP. Jika Anda menemukan kesalahan konseptual atau konyol, silakan buat masalah dan saya akan mencoba yang terbaik untuk memperbaikinya dengan cepat. Kontribusi lain juga diterima. Jika Anda melatih model apa pun dan mendapatkan hasil yang lebih baik, silakan buat PR. Jika Anda tertarik untuk menerapkan lebih banyak makalah di domain ini dan ingin menambahkannya ke repositori ini, saya akan dengan senang hati membantu. Meskipun saat ini saya kekurangan waktu, saya akan secara aktif mempertahankan repositori ini.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-17
ukuran 12.18MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua