การสร้างเนื้อหาเทมเพลตเช่นเกี่ยวกับเราข่าวสารข่าวชื่อข่าวคำอธิบายผลิตภัณฑ์และอื่น ๆ
แนวคิดและเทคนิคสำคัญที่เป็นพื้นฐานในการใช้ OpenAI API สำหรับงานใด ๆ รวมถึง:
OpenAI API สามารถนำไปใช้กับงานใด ๆ ที่เกี่ยวข้องกับการทำความเข้าใจหรือสร้างภาษาหรือรหัสธรรมชาติ
GPT-3 หรือหม้อแปลงรุ่นที่สามที่ผ่านการฝึกอบรมมาก่อนเป็นรูปแบบการเรียนรู้ของเครื่องประสาทเครือข่ายที่ผ่านการฝึกอบรมโดยใช้ข้อมูลอินเทอร์เน็ตเพื่อสร้างข้อความทุกประเภท มันต้องใช้ข้อความอินพุตจำนวนเล็กน้อยเพื่อสร้างข้อความจำนวนมากของข้อความที่สร้างขึ้นด้วยเครื่องจักรที่เกี่ยวข้องและซับซ้อน
เครือข่ายประสาทการเรียนรู้เชิงลึกของ GPT-3 เป็นแบบจำลองที่มีพารามิเตอร์การเรียนรู้ของเครื่องมากกว่า 175 พันล้าน เป็นผลให้ GPT-3 ดีกว่ารุ่นก่อนหน้าสำหรับการผลิตข้อความที่น่าเชื่อถือมากพอที่จะดูเหมือนว่ามนุษย์สามารถเขียนได้
จุดสิ้นสุด completions เป็นแกนกลางของ OpenAI API และให้อินเทอร์เฟซอย่างง่ายที่ยืดหยุ่นและทรงพลังอย่างมาก
คุณป้อนข้อความบางส่วนเป็นพรอมต์และ API จะส่งคืนข้อความที่เสร็จสิ้นซึ่งพยายามจับคู่คำแนะนำหรือบริบทใด ๆ ที่เราให้ไว้
คุณสามารถคิดได้ว่านี่เป็นการเติมข้อความอัตโนมัติขั้นสูง - โมเดลประมวลผลข้อความของคุณและพยายามทำนายสิ่งที่น่าจะเกิดขึ้นต่อไป การออกแบบพรอมต์นั้นเป็นวิธีที่เรา "โปรแกรม" โมเดล
ในหลายกรณีมันเป็นประโยชน์สำหรับทั้งการแสดงและบอกนางแบบว่าคุณต้องการอะไร การเพิ่มตัวอย่างลงในพรอมต์สามารถช่วยสื่อสารรูปแบบหรือความแตกต่าง
การประมวลผลภาษาธรรมชาติรวมถึงหนึ่งในองค์ประกอบที่สำคัญในการสร้าง Langauge ธรรมชาติ ซึ่งมุ่งเน้นไปที่การสร้างข้อความธรรมชาติของมนุษย์ langauge อย่างไรก็ตามการสร้างเนื้อหาที่เข้าใจได้ของมนุษย์เป็นสิ่งที่ท้าทายสำหรับเครื่องจักรที่ไม่ทราบความซับซ้อนและความแตกต่างของภาษา การใช้ข้อความบนอินเทอร์เน็ต GPT-3 ได้รับการฝึกฝนให้สร้างข้อความมนุษย์ที่สมจริง
GPT-3 ถูกนำมาใช้เพื่อสร้างบทความบทกวีเรื่องราวรายงานข่าวและบทสนทนาโดยใช้ข้อความอินพุตเพียงเล็กน้อยที่สามารถใช้ในการสร้างสำเนาคุณภาพจำนวนมาก
GPT-3 ยังใช้สำหรับงานการสนทนาอัตโนมัติซึ่งตอบสนองต่อข้อความใด ๆ ที่บุคคลประเภทลงในคอมพิวเตอร์ด้วยข้อความใหม่ที่เหมาะสมกับบริบท GPT-3 สามารถสร้างอะไรก็ได้ด้วยโครงสร้างข้อความไม่ใช่แค่ข้อความภาษามนุษย์ นอกจากนี้ยังสามารถสร้างการสรุปข้อความโดยอัตโนมัติและแม้แต่รหัสการเขียนโปรแกรม
GPT-3 เป็นรูปแบบการทำนายภาษา ซึ่งหมายความว่ามันมีรูปแบบการเรียนรู้ของ Neural Network Machine ที่สามารถใช้ข้อความอินพุตเป็นอินพุตและแปลงเป็นสิ่งที่คาดการณ์ผลลัพธ์ที่เป็นประโยชน์ที่สุดคือ สิ่งนี้สามารถทำได้โดยการฝึกอบรมระบบบนข้อความอินเทอร์เน็ตที่กว้างใหญ่เพื่อดูรูปแบบ โดยเฉพาะอย่างยิ่ง GPT-3 เป็นรุ่นที่สามของโมเดลที่มุ่งเน้นการสร้างข้อความตามการฝึกอบรมล่วงหน้าบนข้อความจำนวนมาก
มีสามแนวทางพื้นฐานในการสร้างพรอมต์:
Show and tell : ทำให้ชัดเจนว่าคุณต้องการอะไรทั้งผ่านคำแนะนำตัวอย่างหรือการรวมกันของทั้งสอง หากคุณต้องการให้โมเดลจัดอันดับรายการของรายการตามลำดับตัวอักษรหรือจัดประเภทย่อหน้าตามความเชื่อมั่นแสดงว่านั่นคือสิ่งที่คุณต้องการProvide quality data : หากคุณกำลังพยายามสร้างตัวจําแนกหรือรับแบบจำลองเพื่อทำตามรูปแบบตรวจสอบให้แน่ใจว่ามีตัวอย่างเพียงพอ แบบจำลองมักจะฉลาดพอที่จะเห็นผ่านข้อผิดพลาดในการสะกดคำพื้นฐานและให้คำตอบกับคุณ แต่อาจถือว่านี่เป็นความตั้งใจและอาจส่งผลกระทบต่อการตอบสนองCheck your settings : การตั้งค่าอุณหภูมิและ top_p ควบคุมวิธีการกำหนดแบบจำลองในการตอบสนองการตอบสนอง prompt : พรอมต์เพื่อสร้างการร้องเรียนสำหรับเข้ารหัสเป็นสตริงอาร์เรย์ของสตริงอาร์เรย์ของโทเค็นหรืออาร์เรย์อาร์เรย์โทเค็น <|endoftext|> เป็นตัวแยกเอกสารที่โมเดลเห็นในระหว่างการฝึกอบรมดังนั้นหากไม่ได้ระบุพรอมต์โมเดลจะสร้างราวกับว่ามาจากจุดเริ่มต้นของเอกสารใหม่engine : Text-Davinci-001 เป็นรุ่น GPT-3 ที่มีความสามารถมากที่สุด สามารถทำงานใด ๆ ที่โมเดลอื่น ๆ สามารถทำได้มักจะมีบริบทน้อยลง นอกเหนือจากการตอบสนองต่อพรอมต์แล้วยังรองรับการแทรกความสมบูรณ์ภายในข้อความtemperature : อุณหภูมิหมายถึงอุณหภูมิการสุ่มตัวอย่างที่จะใช้ ค่าที่สูงขึ้นหมายถึงโมเดลจะมีความเสี่ยงมากขึ้นเราสามารถใช้ 0.9 สำหรับแอปพลิเคชันที่สร้างสรรค์มากขึ้นและ 0 สำหรับคำตอบที่กำหนดไว้อย่างดีmax_tokens : จำนวนโทเค็นสูงสุดที่จะสร้างในการร้องเรียน รุ่นส่วนใหญ่มีความยาวบริบทของ 2048top_p : ทางเลือกในการสุ่มตัวอย่างที่มีอุณหภูมิเรียกว่าการสุ่มตัวอย่างนิวเคลียส ในกรณีที่โมเดลพิจารณาผลลัพธ์ของโทเค็นที่มีมวลความน่าจะเป็น top_p ดังนั้น 0.1 หมายถึงเฉพาะโทเค็นที่ประกอบด้วยมวลความน่าจะเป็น 10% สูงสุดเท่านั้นfrequency_penalty : ค่าบวกลงโทษโทเค็นใหม่ตามความถี่ที่มีอยู่ในข้อความจนถึงขณะนี้ลดโอกาสของโมเดลในการทำซ้ำบรรทัดเดียวกันpresence_penalty : ค่าบวกลงโทษโทเค็นใหม่โดยพิจารณาจากว่าพวกเขาปรากฏในข้อความจนถึงขณะนี้เพิ่มโอกาสในการพูดคุยเกี่ยวกับหัวข้อใหม่หรือไม่ หากคุณไม่มี pip ในระบบของคุณคุณสามารถดาวน์โหลดได้ด้วยความช่วยเหลือของคำสั่งนี้:
sudo apt-get install python3-pip
คุณสามารถสร้างสภาพแวดล้อมเสมือนจริงด้วย Anaconda หากคุณมีอยู่ในระบบของคุณให้สร้าง VirtualEnV ด้วยคำสั่งด้านล่าง:
conda create -n yourenvname python==x.x
conda activate yourenvname
หรือคุณสามารถติดตั้ง VirtualWrapper ด้วยคำสั่งด้านล่าง:
sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv
และหลังจากการติดตั้งสร้างสภาพแวดล้อมเสมือนจริง:
cd/your/path && mkvirtualenv --python=python3 yourenvname
ติดตั้งแพ็คเกจที่ต้องการจากข้อกำหนด TXT เพื่อเรียกใช้โครงการนี้:
pip install -r requirements.txt
ในการเรียกใช้โครงการนี้สิ่งที่สำคัญที่สุดคือการมีคีย์ API ลับจาก OpenAI ที่ช่วยให้โมเดลสามารถสร้างเนื้อหาได้ หากคุณมีคีย์ API ลับคุณควรตั้งค่าเป็นตัวแปรสภาพแวดล้อมของคุณภายใต้ชื่อ tha ของ OPENAI_API_KEY และอ่านโดยใช้แพ็คเกจ python-dotenv