Menghasilkan Konten Template Seperti Tentang Kami, Berita Artikal, Judul Berita, Deskripsi Produk dan dll. Menggunakan Model Bahasa Pretrain GPT-3
Konsep dan teknik utama yang mendasar menggunakan API OpenAI untuk tugas apa pun termasuk:
API OpenAI dapat diterapkan pada hampir semua tugas yang melibatkan pemahaman atau menghasilkan bahasa atau kode alami.
GPT-3 atau generasi ketiga dari transformator pra-terlatih generatif, adalah model pembelajaran mesin jaringan saraf yang dilatih menggunakan data internet untuk menghasilkan jenis teks apa pun. Dibutuhkan sejumlah kecil teks input untuk menghasilkan volume besar teks yang dihasilkan mesin yang relevan dan canggih.
Jaringan saraf dalam pembelajaran GPT-3 adalah model dengan lebih dari 175 miliar parameter pembelajaran mesin. Akibatnya GPT-3 lebih baik daripada model sebelumnya untuk memproduksi teks yang cukup meyakinkan agar tampak seperti manusia yang bisa menulisnya.
Titik akhir completions adalah inti dari API Openai dan menyediakan antarmuka sederhana yang sangat fleksibel dan kuat.
Anda memasukkan beberapa teks sebagai prompt, dan API akan mengembalikan penyelesaian teks yang berupaya mencocokkan instruksi atau konteks apa pun yang kami berikan.
Anda dapat menganggap ini sebagai pelengkapan otomatis yang sangat canggih - model memproses prompt teks Anda dan mencoba memprediksi apa yang paling mungkin terjadi selanjutnya. Merancang prompt pada dasarnya adalah bagaimana kita "memprogram" model.
Dalam banyak kasus, sangat membantu untuk menunjukkan dan memberi tahu model apa yang Anda inginkan. Menambahkan contoh ke prompt dapat membantu mengomunikasikan pola atau nuansa.
Pemrosesan bahasa alami termasuk sebagai salah satu komponen utamanya generasi langauge alami. yang fokus pada menghasilkan teks alami langauge manusia. Namun, menghasilkan konten yang dapat dimengerti manusia adalah tantangan bagi mesin yang tidak benar -benar mengetahui kompleksitas dan nuansa bahasa. Menggunakan teks di internet, GPT-3 dilatih untuk menghasilkan teks manusia yang realistis.
GPT-3 telah digunakan untuk membuat artikel, puisi, cerita, laporan berita, dan dialog hanya menggunakan sejumlah kecil teks input yang dapat digunakan untuk menghasilkan salinan berkualitas dalam jumlah besar.
GPT-3 juga digunakan untuk tugas-tugas percakapan otomatis, menanggapi teks apa pun yang diketik seseorang ke dalam komputer dengan sepotong teks baru yang sesuai dengan konteksnya. GPT-3 dapat membuat apa pun dengan struktur teks, dan bukan hanya teks bahasa manusia. Ini juga dapat secara otomatis menghasilkan peringkasan teks dan bahkan kode pemrograman.
GPT-3 adalah model prediksi bahasa. Ini berarti bahwa ia memiliki model pembelajaran mesin jaringan saraf yang dapat mengambil teks input sebagai input dan mengubahnya menjadi apa yang memprediksi hasil yang paling berguna. Ini dicapai dengan melatih sistem pada badan teks internet yang luas untuk melihat pola. Lebih khusus lagi, GPT-3 adalah versi ketiga dari model yang difokuskan pada pembuatan teks berdasarkan pra-terlatih pada sejumlah besar teks.
Ada tiga pedoman dasar untuk membuat petunjuk:
Show and tell : jelaskan apa yang Anda inginkan baik melalui instruksi, contoh, atau kombinasi keduanya. Jika Anda ingin model memberi peringkat daftar item dalam urutan abjad atau untuk mengklasifikasikan paragraf berdasarkan sentimen, tunjukkan itulah yang Anda inginkan.Provide quality data : Jika Anda mencoba membangun classifier atau mendapatkan model untuk mengikuti pola, pastikan ada cukup banyak contoh. Model ini biasanya cukup pintar untuk melihat melalui kesalahan ejaan dasar dan memberi Anda respons, tetapi juga dapat menganggap ini disengaja, dan dapat mempengaruhi respons.Check your settings : Pengaturan suhu dan top_p mengontrol seberapa deterministik model dalam menghasilkan respons. prompt : Prompt untuk menghasilkan kompisi untuk, dikodekan sebagai string, array string, array token, atau array array token. <|endoftext|> adalah pemisahan dokumen yang dilihat model selama pelatihan, jadi jika prompt tidak ditentukan, model akan menghasilkan seolah -olah dari awal dokumen baru.engine : Text-DavIn-001 adalah model GPT-3 yang paling cakap. Dapat melakukan tugas apa pun yang dapat dilakukan oleh model lain, seringkali dengan konteks yang lebih sedikit. Selain menanggapi prompt, juga mendukung penyisipan penyelesaian dalam teks.temperature : Suhu berarti suhu pengambilan sampel untuk digunakan. Nilai yang lebih tinggi berarti model akan mengambil lebih banyak risiko, kita dapat menggunakan 0,9 untuk aplikasi yang lebih kreatif, dan 0 untuk yang dengan jawaban yang jelas.max_tokens : Jumlah maksimum token untuk menghasilkan dalam komprisi. Sebagian besar model memiliki panjang konteks 2048.top_p : Alternatif untuk pengambilan sampel dengan suhu, yang disebut pengambilan sampel nukleus. di mana model mempertimbangkan hasil token dengan massa probabilitas top_p, jadi 0,1 berarti hanya token yang terdiri dari 10% massa probabilitas teratas yang dipertimbangkanfrequency_penalty : Nilai positif menghukum token baru berdasarkan frekuensi yang ada dalam teks sejauh ini, mengurangi kemungkinan model untuk mengulangi garis yang sama.presence_penalty : Nilai positif menghukum token baru berdasarkan apakah mereka muncul dalam teks sejauh ini, meningkatkan kemungkinan model untuk berbicara tentang topik baru. Jika Anda tidak memiliki pip di sistem Anda, Anda dapat mengunduhnya dengan bantuan perintah ini:
sudo apt-get install python3-pip
Anda dapat membuat lingkungan virtual dengan Anaconda jika Anda memilikinya di sistem Anda, membuat virtualEnv dengan perintah di bawah ini:
conda create -n yourenvname python==x.x
conda activate yourenvname
Atau Anda dapat menginstal VirtualWrapper dengan perintah di bawah ini:
sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv
Dan setelah instalasi menciptakan lingkungan virtual:
cd/your/path && mkvirtualenv --python=python3 yourenvname
Instal paket yang diperlukan dari persyaratan.txt untuk menjalankan proyek ini:
pip install -r requirements.txt
Untuk menjalankan proyek ini, hal yang paling penting adalah memiliki kunci API rahasia dari OpenAi yang memungkinkan model untuk menghasilkan konten. Jika Anda memiliki kunci API rahasia, Anda harus mengaturnya sebagai variabel lingkungan Anda dengan nama OPENAI_API_KEY dan membacanya menggunakan paket python-dotenv .