Ketika saya ingin mendapatkan ringkasan dari Neural Network, saya mencoba banyak cara untuk menghasilkan ringkasan abstrak, tetapi hasilnya tidak baik. Ketika saya mendengar Piala Byte 2018, saya menemukan beberapa informasi tentang hal itu, dan solusi juara menarik saya, tetapi saya menemukan beberapa situs web, seperti GitHub Gitlab, saya tidak menemukan kode resmi, jadi saya memutuskan untuk mengimplementasikannya.
Model saya didasarkan pada perhatian adalah semua yang Anda butuhkan dan sampai ke poin: Ringkasan dengan jaringan pointer-generator

python train.py
Periksa hparams.py untuk melihat parameter mana yang mungkin. Misalnya,
python train.py --logdir myLog --batch_size 32 --train myTrain --eval myEval
Kode saya juga meningkatkan multi GPU untuk melatih model ini, jika Anda memiliki lebih dari satu GPU, jalankan saja seperti ini
python train.py --logdir myLog --batch_size 32 --train myTrain --eval myEval --gpu_nums=myGPUNums
| nama | jenis | Detail |
|---|---|---|
| vocab_size | int | Ukuran Vocab |
| kereta | str | DATASET TERBAIKI DIR |
| evaluasi | str | Eval Dataset Dir |
| tes | str | Data untuk menghitung skor Rouge |
| Vocab | str | Jalur file kosa kata |
| Batch_Size | int | Ukuran Batch Kereta |
| eval_batch_size | int | Ukuran Batch Eval |
| lr | mengambang | tingkat pembelajaran |
| warmup_steps | int | Langkah Pemanasan dengan tingkat pembelajaran |
| logdir | str | Direktori Log |
| num_epochs | int | jumlah zaman kereta api |
| Evaldir | str | Evaluasi Dir |
| d_model | int | Dimensi tersembunyi encoder/decoder |
| d_ff | int | Dimensi tersembunyi dari lapisan feedforward |
| num_blocks | int | Jumlah blok encoder/decoder |
| num_heads | int | Jumlah Kepala Perhatian |
| Maxlen1 | int | Panjang maksimum urutan sumber |
| Maxlen2 | int | Panjang maksimum urutan target |
| dropout_rate | mengambang | tingkat putus sekolah |
| beam_size | int | Ukuran balok untuk decode |
| gpu_nums | int | Jumlah GPU, yang dapat memungkinkan berapa banyak GPU untuk melatih model ini, default 1 |
Jangan ubah hiper-parameter transformer util Anda memiliki solusi yang baik, itu akan membiarkan kerugian tidak bisa turun! Jika Anda memiliki solusi yang bagus, saya harap Anda bisa memberi tahu saya.

