การเรียนรู้อย่างลึกซึ้งสำหรับหลักสูตร NLP Crash ที่ Abbyy
หนังสือเรียนที่แนะนำ: วิธีการเครือข่ายประสาทในการประมวลผลภาษาธรรมชาติโดย Yoav Goldberg
ฉันค่อยๆอัปเดตและแปลสมุดบันทึกในขณะนี้ ติดต่อกัน
การวิเคราะห์ความเชื่อมั่นเกี่ยวกับชุดข้อมูลการทบทวนภาพยนตร์ IMDB: ภาพรวมสั้น ๆ ของการเรียนรู้ของเครื่องคลาสสิกสำหรับ NLP + ช่วงเวลาสั้น ๆ ที่ไม่น่าเชื่อถือถึง Keras
เวอร์ชั่นรัสเซีย:
อัปเดตเวอร์ชันภาษาอังกฤษ:
พบกับคำที่ฝังอยู่: วิธีการที่ไม่ได้รับการดูแลเพื่อจับความสัมพันธ์ที่สนุกสนานระหว่างคำ
วลีมีความคล้ายคลึงกันกับคำที่ฝังคำว่าการแปลด้วยเครื่องจักร + คำที่ใช้คำโดยไม่มีข้อมูลแบบขนาน (พร้อม Muse Word Embeddings)
เวอร์ชั่นรัสเซีย:
อัปเดตเวอร์ชันภาษาอังกฤษ:
บทนำสู่ Pytorch การใช้การถดถอยเชิงเส้น PET บน Numpy และ pytorch บริสุทธิ์ การใช้งานของ CBOW, skip-gram, การสุ่มตัวอย่างเชิงลบและโมเดล Word2VEC ที่มีโครงสร้าง
เวอร์ชั่นรัสเซีย:
อัปเดตเวอร์ชันภาษาอังกฤษ:
ความรู้เบื้องต้นเกี่ยวกับเครือข่าย Convolutional ความสัมพันธ์ระหว่างการโน้มน้าวใจและ N-GRAMS เครื่องตรวจจับนามสกุลอย่างง่ายเกี่ยวกับการสร้างภาพลักษณ์ระดับตัวละคร + การสร้างภาพข้อมูลที่สนุกสนาน
เวอร์ชั่นรัสเซีย:
อัปเดตเวอร์ชันภาษาอังกฤษ:
RNNS สำหรับการจำแนกประเภทข้อความ การใช้งาน RNN ง่าย ๆ + การทดสอบการท่องจำ เครื่องตรวจจับนามสกุลในการตั้งค่าหลายภาษา: ตัวจําแนก LSTM ระดับอักขระ
เวอร์ชั่นรัสเซีย:
อัปเดตเวอร์ชันภาษาอังกฤษ:
RNNS สำหรับการติดฉลากลำดับ การใช้งาน Tagger ส่วนหนึ่งตามคำสั่งของคำและการฝังคำระดับอักขระ
เวอร์ชั่นรัสเซีย:
รูปแบบภาษาระดับตัวละครสำหรับการสร้างทวีตโทรลล์รัสเซีย: โมเดลหน้าต่างคงที่ผ่านทาง Convolutions และ RNN แบบจำลอง
รูปแบบภาษาแบบมีเงื่อนไขอย่างง่าย: การสร้างนามสกุลที่ให้ภาษาต้นฉบับ
และความท้าทายการจำแนกความคิดเห็นที่เป็นพิษ - เพื่อใช้ทักษะของคุณกับปัญหาในโลกแห่งความจริง
เวอร์ชั่นรัสเซีย:
แบบจำลองภาษาระดับคำสำหรับการสร้างบทกวี ตัวอย่างสัตว์เลี้ยงของการเรียนรู้การถ่ายโอนและการเรียนรู้แบบหลายงานที่ใช้กับแบบจำลองภาษา
เวอร์ชั่นรัสเซีย:
SEQ2SEQ สำหรับการแปลของเครื่องและคำบรรยายภาพ การเข้ารหัส Byte-Pair, การค้นหาลำแสงและสิ่งที่เป็นประโยชน์อื่น ๆ สำหรับการแปลเครื่อง
เวอร์ชั่นรัสเซีย:
SEQ2SEQ พร้อมให้ความสนใจกับการแปลของเครื่องและคำบรรยายภาพ
เวอร์ชั่นรัสเซีย:
การใช้แบบจำลองหม้อแปลงสำหรับการสรุปข้อความ การอภิปรายของเครือข่ายผู้สร้างตัวชี้สำหรับการสรุปข้อความ
เวอร์ชั่นรัสเซีย:
ระบบการสนทนาที่มุ่งเน้นเป้าหมาย การใช้งานของโมเดลหลายงาน: Intent Classifier และ Token Tagger สำหรับ Dialogue Manager
เวอร์ชั่นรัสเซีย:
ระบบการสนทนาการสนทนาทั่วไปและ DSSMS การใช้รูปแบบการตอบคำถามบนชุดข้อมูลทีมและโมเดล Chit-Chat บนชุดข้อมูล OpenSubtitles
เวอร์ชั่นรัสเซีย:
แบบจำลองที่ได้รับการฝึกฝนสำหรับงานต่าง ๆ : ตัวเข้ารหัสประโยคสากลสำหรับความคล้ายคลึงกันของประโยค, Elmo สำหรับการติดแท็กลำดับ (ด้วย CRF เล็กน้อย), เบิร์ตสำหรับพวงหรีด - การให้เหตุผลเกี่ยวกับความต่อเนื่องที่เป็นไปได้
เวอร์ชั่นรัสเซีย:
สรุป NLP - บทสรุปของสิ่งดีๆที่ปรากฏและไม่ได้อยู่ในหลักสูตร