ที่เก็บนี้มีทรัพยากรทั้งหมดสำหรับการประชุมเชิงปฏิบัติการการเรียนรู้ของเครื่องจักรที่ใช้แล้วพบกับตัวเองประดิษฐ์ของคุณ: สร้างข้อความที่ฟังดูเหมือนคุณ
ในการประชุมเชิงปฏิบัติการนี้ผู้เข้าร่วมจะได้รับมอบหมายให้ดาวน์โหลดบันทึกการแชทของตัวเองและสร้างบอทแชทที่สร้างข้อความคล้ายกับการเขียนของพวกเขา เพื่อเป็นทางเลือกในการใช้บันทึกการแชทเราได้จัดเตรียมชุดข้อมูลการสนทนาอื่น ๆ (และชุดข้อมูลที่ไม่ใช่การแปลง) ในที่เก็บนี้
อย่าลังเลที่จะเข้าร่วม Gitter ของเราในระหว่างการประชุมเชิงปฏิบัติการ:
ค้นหาสไลด์เวิร์กช็อปที่นี่
การประชุมเชิงปฏิบัติการแบ่งออกเป็น 3 งาน คุณสามารถเรียกใช้งานแต่ละงานในพื้นที่ (โดยการโคลนที่เก็บนี้) หรือโดยเรียกใช้สมุดบันทึก colab (ดูลิงก์ด้านล่าง) หากคุณทำงานในเครื่องตรวจสอบให้แน่ใจว่าคุณสามารถเข้าถึง GPU ได้และคุณกำลังใช้ Python 3.6+ (ตรวจสอบให้แน่ใจว่าคุณมีพื้นที่เก็บข้อมูลที่เพียงพอ) คำแนะนำโดยละเอียดเพิ่มเติมมีให้ในโฟลเดอร์ย่อยที่แตกต่างกัน
ปรับแต่ง GPT-2 บนชุดข้อมูลต่าง ๆ (รวมถึงทวีต, บทกวี, รหัสการเขียนโปรแกรม, หมากรุก, เพลงและอื่น ๆ !) ขอบคุณ @manueth สำหรับการรวบรวมชุดข้อมูล!
➡อ่านเพิ่มเติม
เราใช้วิธีการถ่ายโอนสไตล์เดียวกันเพื่อฝึกอบรมรูปแบบการสนทนาจากบันทึกการแชทของเรา คุณสามารถใช้คาทอลิกเพื่อแยกวิเคราะห์บันทึกการแชทของคุณเองหรือคุณสามารถใช้แหล่งข้อมูลที่ให้ไว้ได้ ขอบคุณ @masterscrat สำหรับการรวบรวมชุดข้อมูลการสนทนา!
➡อ่านเพิ่มเติม
เราขยายวิธีการในภารกิจ 2 โดยการแนะนำการเรียนรู้แบบหลายงานปรับปรุงการประมวลผลข้อมูลล่วงหน้าและเพิ่มประเภทโทเค็น
➡อ่านเพิ่มเติม