NLP ทำได้ง่าย
หมายเหตุรหัสง่าย ๆ สำหรับการอธิบายการสร้าง NLP
- เทคนิคการแบ่งส่วนคำย่อย
- ลองเปรียบเทียบโทเคนิเซอร์ต่าง ๆ เช่น NLTK, BPE, ประโยคและ Bert Tokenizer
- การถอดรหัสลำแสง
- การถอดรหัสลำแสงเป็นสิ่งจำเป็นสำหรับงาน SEQ2SEQ แต่มันซับซ้อนมากที่จะนำไปใช้ นี่คือผู้สมัครที่ค่อนข้างง่าย
- วิธีรับเวกเตอร์สุดท้ายที่ซ่อนอยู่ของ RNNs อย่างถูกต้อง
- เราจะดูวิธีที่จะได้รับสถานะสุดท้ายของ RNNs ใน Tensorflow และ Pytorch
- เทมเพลต tensorflow seq2seq ตามงาน G2P
- เราจะเขียนเทมเพลตง่ายๆสำหรับ SEQ2SEQ โดยใช้ TensorFlow สำหรับการสาธิตเราโจมตีงาน G2P G2P เป็นหน้าที่ของการแปลงกราฟ (การสะกดคำ) เป็นหน่วยเสียง (การออกเสียง) มันเป็นแหล่งที่ดีมากสำหรับจุดประสงค์นี้เพราะมันง่ายพอที่คุณจะวิ่งได้
- เทมเพลต Pytorch SEQ2SEQ ตามงาน G2P
- เราจะเขียนเทมเพลตง่ายๆสำหรับ SEQ2SEQ โดยใช้ Pytorch สำหรับการสาธิตเราโจมตีงาน G2P G2P เป็นหน้าที่ของการแปลงกราฟ (การสะกดคำ) เป็นหน่วยเสียง (การออกเสียง) มันเป็นแหล่งที่ดีมากสำหรับจุดประสงค์นี้เพราะมันง่ายพอที่คุณจะวิ่งได้
- [กลไกความสนใจ] (ทำงานอยู่ระหว่างดำเนินการ)
- pos-tagging ด้วยการปรับแต่งเบิร์ต
- เบิร์ตเป็นที่รู้จักกันดีในการติดแท็กลำดับเช่นการจดจำเอนทิตีที่มีชื่อ มาดูกันว่ามันเป็นเรื่องจริงสำหรับการติดแท็ก
- ออกกลางคันในอีกไม่กี่นาที
- การออกกลางคันเป็นเทคนิคการทำให้เป็นมาตรฐานที่ได้รับความนิยมมากที่สุดในการเรียนรู้อย่างลึกซึ้ง มาตรวจสอบอีกครั้งว่ามันทำงานอย่างไร
- ngram lm กับ rnnlm (WIP)
- การเพิ่มข้อมูลสำหรับคู่คำถาม Quora
- มาดูกันว่ามันมีประสิทธิภาพในการเพิ่มข้อมูลการฝึกอบรมในงานของ Quora คำถามคู่หรือไม่