Unduh XLnet gen - Unduh Kode Sumber XLnet gen

XLnet gen

Kode Sumber AI

1.0.0

Unduh

Perbarui 30-01-2021

Repositori ini diarsipkan. Silakan gunakan https://github.com/huggingface/transformers yang mendukung generasi bahasa XLNET di Pytorch dan TensorFlow

Xlnet-gen

Menghasilkan bahasa menggunakan xlnet. Ini bukan implementasi resmi. Sampel disertakan di akhir readme ini serta di folder samples .

Artikel Menengah sebagai Ringkasan dari Upaya Ini: https://medium.com/@amanrusia/xlnet-she-peaks-comparison-to-gpt-2-ea1a4e9ba39e

Colab Notebook di mana Anda dapat memberikan petunjuk: https://colab.research.google.com/drive/12u-cmb9evmiasnoqjtdw26gmnvsgepbv

Penggunaan

Langkah 1: Unduh dan Instal Persyaratan (Ubah TensorFlow ke TensorFlow-GPU di Persyaratan.txt jika diperlukan)
```
 git clone https://github.com/rusiaaman/XLnet-gen.git && cd XLnet-gen
pip install -r requirements.txt
```

Langkah 2: Unduh dan unzip model xlnet pretrained dari https://github.com/zihangdai/xlnet/

 wget https://storage.googleapis.com/xlnet/released_models/cased_L-24_H-1024_A-16.zip
unzip cased_L-24_H-1024_A-16.zip

Langkah 3: Baik dijalankan dalam mode interaktif menggunakan -bendera --interactive atau lulus file input menggunakan argumen --input_file seperti yang dijelaskan nanti. Gunakan --unconditional untuk menghasilkan teks tanpa teks terkondisi.

 python language_generation.py
     --model_config_path=xlnet_cased_L-24_H-1024_A-16/xlnet_config.json
     --init_checkpoint=xlnet_cased_L-24_H-1024_A-16/xlnet_model.ckpt
     --spiece_model_file=xlnet_cased_L-24_H-1024_A-16/spiece.model
     --interactive
     --max_mem_length=256
     --num_toks_pred=256
     --num_samples=1
     --top_p=0.9
     --bidirectional_eachstep

Catatan penting

Metodologi

XLNET adalah model bahasa berbasis permutasi baru. Dalam implementasi XLNET-Gen saat ini, kami menghasilkan teks dari kiri ke kanan.

XLNET dilatih menggunakan num_predict=85 , yang berarti 85 token dari 512 dalam satu contoh diprediksi pada suatu waktu. Lebih penting lagi dari 512-85 = 427 token dapat saling memperhatikan dalam mekanisme perhatian (perhatian bidrectional) . Ini menciptakan masalah dengan mekanisme perhatian kausal konvensional selama generasi bahasa. Masalah berikut dihadapi:

Penggunaan konteks kecil mengarah pada prediksi omong kosong. Saat ini teks acak berkode keras disertakan sebagai teks terkemuka yang diikuti oleh <eod> , akhir token dokumen, bersama dengan konteks yang diinginkan. Ini membantu dengan permintaan kecil.
Karena sifat pretraining, token konteks saling memperhatikan dengan cara dua arah. Dan konteksnya tersebar di seluruh input model. Karena ini menghasilkan token dari kiri ke kanan dengan cara kausal menyebabkan output suboptimal. Menghitung ulang keadaan tersembunyi setiap langkah memungkinkan kita untuk memiliki perhatian dua arah pada setiap token baru yang dihasilkan yang secara substansial meningkatkan generasi. Untuk melakukan penggunaan yang sama --bidirectional_eachstep Flag

Penjelasan bendera (khusus untuk XLNET-GEN)

--max_mem_length Panjang urutan maks yang digunakan untuk prediksi. Catatan: Jumlah token yang akan diprediksi bisa lebih besar dari ini, tetapi konteksnya terpotong di awal. Untuk -case --autoregressive , ini menetapkan ukuran 'memori'.
--num_toks_pred Jumlah token untuk diprediksi. Ini bisa sebesar yang kita inginkan, namun konteksnya terpotong jika lebih lama dari max_mem_length untuk kasus default.
--num_samples untuk setiap prompt jumlah sampel yang akan dihasilkan.
--interactive baris perintah prompt input.
--input_file Path ke file yang digunakan untuk petunjuk bersyarat. Prompt dipisahkan oleh garis kosong. Output dihasilkan di lokasi yang sama di file baru dengan nama file yang sama ditambahkan dengan ".xlnet".
--top_p TOP_P Paramter untuk pengambilan sampel nukleus. Atur 0 ini jika Anda ingin menggunakan proses pengambilan sampel Top_K.
--top_k Top_K Parameter untuk Top_K Sampling. Hanya Top_k yang paling mungkin token yang dipertimbangkan untuk pengambilan sampel. Atur top_p=0 jika Anda ingin menggunakan ini.
--unconditional menghasilkan sampel tanpa syarat. Mengabaikan flags --interactive dan --input_file .
--bidirectional_eachstep mengarah ke output yang jauh lebih baik dengan mengorbankan perhitungan. Penjelasan dalam Metodologi.

Skema pengambilan sampel

Pengambilan Sampel Top-K: Gunakan --top_k Flag, Pastikan --top_p=0
Pengambilan Sampel Nukleus: Gunakan --top_p Flag
Pengambilan sampel permutasi

Catatan tentang kualitas sampel

Ada perbedaan besar dalam kualitas dengan dan tanpa bendera bidirectional_eachstep , yang mengaktifkan kalkulasi ulang negara-negara tersembunyi dengan perhatian dua arah setiap kali token baru dihasilkan. Ini mungkin karena cara XLNET diatur sebelumnya-dengan topeng yang jarang dan konteks bidrectional. Namun, saya saat ini sedang menyelidiki masalah ini dan ini bisa menjadi bidang peningkatan untuk XLNET.
Generasi artefak seperti kutipan kosong "" , " " , beberapa hubung --- , dan kombinasi dari mereka ""-" semuanya dapat dikaitkan dengan data pelatihan yang buruk. Secara khusus, tampaknya ada bug di https://github.com/attardi/wikiextractor yang mengarah pada generasi kutipan kosong dan artefak lainnya. Ini mungkin adalah SIUDE yang sama.
Wikipedia memiliki banyak elips dalam artikelnya yang tercermin dalam generasi. Dump data wiki memilikinya dalam bentuk dengan dan tanpa spasi: keduanya . . . , Dan ... .
XLNET hanya dapat memprediksi akhir paragraf dan akhir dokumen, tetapi bukan karakter atau tab baris baru, jadi itu tidak menghasilkan struktur dokumen yang baik
Kosakata terbatas pada bahasa Inggris dan tidak semua karakter Unicode ada dalam kosakata. Karakter bahasa dan emoji lainnya tidak dapat dihasilkan diterjemahkan sebagai.

Sampel

Kami telah melatih model bahasa berskala besar tanpa pengawasan yang menghasilkan paragraf teks yang koheren, mencapai kinerja canggih pada banyak tolok ukur pemodelan bahasa, dan melakukan pemahaman bacaan yang belum sempurna, terjemahan mesin, penjawab pertanyaan, dan tugas-tugas ringkasan dalam laboratorium kami) menggunakan analisis translasi/teks otomatis dengan sistem komputer yang otomatis, analisis Pro-Pro-Pro). Dari pelatihan ini kami telah mengembangkan alat terjemahan otomatis, Pro Translation. Sistem kami dikenal sebagai Pro Translation Suite, dan dirancang untuk terjemahan antara teks, dokumen komputer, dan halaman web. Semua alat dalam suite terjemahan Pro menyediakan teks dan terjemahan "waktu nyata". Program ini juga menampilkan antarmuka yang ekstensif pengguna untuk pengembangan yang diarahkan pengguna dan kustomisasi perangkat lunak. Pro Translation Suite fitur sejumlah fitur yang menawarkan tugas terjemahan baru dan inovatif. Selain itu, Pro Translation Suite menawarkan dukungan yang ditingkatkan untuk sistem terjemahan "realtime", seperti terjemahan untuk halaman web, terjemahan "waktu nyata" dari model bahasa, dan terjemahan mesin.

Saat ini kami memiliki robot yang sangat dioptimalkan dalam tahap pengembangan dan dukungan untuk robot ini saat ini sedang ditingkatkan untuk memasukkan (mungkin) mesin terjemahan real-time, "Trans-to-Trans". Robot trans-to-trans telah dioptimalkan, dioptimalkan, dan (dan mungkin) dapat menjadi mesin terjemahan real-time, "Trans-to-Trans". Sebagai salah satu tujuan utama kami, kami juga akan menguji robot ini terhadap standar terjemahan waktu nyata dan tolok ukur. Selain itu, robot ini telah tersedia secara publik untuk mengevaluasi dan menggunakan, tanpa biaya untuk umum.

Robot trans-to-trans telah dibangun untuk memenuhi persyaratan terjemahan "waktu nyata" (yang merupakan persyaratan metode terjemahan bahasa Inggris), yang merupakan bahasa yang akan dikonversi oleh semua terjemahan robot lainnya. Ini telah dirancang untuk terjemahan trans-bahasa, seperti terjemahan antara bahasa Inggris dan bahasa populer lainnya. Kami berharap menggunakan robot ini untuk melakukan terjemahan seperti itu di masa depan, dan telah mengerjakan alat terjemahan, yang akan kami rilis menjelang akhir tahun. Robot trans-to-trans telah dioptimalkan untuk memenuhi persyaratan terjemahan "waktu nyata". Ini adalah persyaratan metode terjemahan bahasa Inggris. Kami telah mengerjakan alat terjemahan, yang akan dirilis menjelang akhir tahun. Kami telah mengerjakan alat terjemahan, yang akan dirilis menjelang akhir tahun.

Sebelum naik roket Anda ke Mars, ingatlah untuk mengemas barang -barang ini . Pertama, Anda harus mengemas kasing roket, atau booster, untuk roket Anda. Peluncur adalah produk khusus yang dikembangkan oleh World Space Program, yang merupakan agen pemerintah Amerika Serikat. Saat Anda mendapatkan peluncur, roket akan dibangun untuk Anda. Dan hanya akan memakan waktu 3 hari! Item penting lainnya yang harus Anda kemas adalah mesin roket. Mesin roket adalah komponen roket, yang terbuat dari dua bagian. Mesin terdiri dari dua ruang "inti". Ruang utama dibangun dari bahan keramik. Ruang kedua terbuat dari stainless steel. Inti padat dari ruang kedua, yang disebut "lubang api", terbuat dari serat karbon. "Lubang api" disegel dengan plastik seal-on dan kemudian dimasukkan ke dalam kotak berlubang, atau "spar case". Kasing SPAR berisi semua komponen lain, seperti mesin, dan komponen di dalam case spar kemudian dirakit di lokasi peluncuran. Sambil menunggu roket dirakit, Anda dapat beristirahat dan minum susu atau air. Di situs peluncuran, Anda akan diberi semacam instrumen, atau ruang lingkup, dan dipandu dengan ruang lingkup. Misinya adalah untuk meluncurkan roket. Roket akan meninggalkan situs peluncuran. Roket akan berjalan sekitar 5,5 jam.

Ketika roket tiba, Anda akan diberi helm, dan kemudian roket akan diluncurkan. Saat Anda mengangkat, buka mata, dan cobalah untuk tetap di jalur. Penting bagi Anda untuk tetap terbuka dan fokus pada misi. Jika Anda dapat melakukan ini, maka Anda akan dapat terbang dengan aman. Juga, ingatlah untuk minum air dan minum susu segar. Kemudian, cobalah yang terbaik untuk menjaga tubuh Anda agar tidak memanas saat dalam penerbangan roket Anda.

Ada banyak hal yang mulai digunakan di dapur restoran. Hidangan adalah komponen juru masak dan menyajikan makanan dalam bentuk tertentu atau cara tertentu. Jenis hidangan lain disiapkan sesuai dengan kebutuhan pelanggan atau tamu. Ada juga berbagai jenis makanan yang mulai digunakan di perusahaan layanan makanan