
- สำหรับงาน วิทยาศาสตร์ข้อมูล เต็มรูปแบบวัสดุ ฯลฯ โปรดตรวจสอบที่เก็บข้อมูลวิทยาศาสตร์
- สำหรับอัลกอริทึม การเรียนรู้ของเครื่อง โปรดตรวจสอบที่เก็บการเรียนรู้ของเครื่อง
- สำหรับอัลกอริทึม การเรียนรู้อย่างลึกซึ้ง โปรดตรวจสอบที่เก็บข้อมูลการเรียนรู้อย่างลึกซึ้ง
- สำหรับ วิสัยทัศน์คอมพิวเตอร์ โปรดตรวจสอบที่เก็บคอมพิวเตอร์วิสัยทัศน์
โฟลเดอร์ที่มีวัสดุทั้งหมดสำหรับงานเฉพาะ/โดเมน
เทคนิค NLP ที่ทันสมัยจากเครือข่ายประสาทที่เกิดขึ้นซ้ำและการฝังคำไปจนถึงหม้อแปลงและความต้องการตนเอง ครอบคลุมหัวข้อที่ใช้เช่นการตอบคำถามและการสร้างข้อความ
นี่คือส่วนขยายของหลักสูตรการประมวลผลภาษาธรรมชาติ (ML สำหรับ) ที่สอนได้ที่ Yandex School of Data Analysis (YSDA) สำหรับตอนนี้มีเพียงบางส่วนของหัวข้อที่น่าจะครอบคลุมที่นี่
หลักสูตรนี้จะครอบคลุมเทคโนโลยีเครื่องมือค้นหาซึ่งมีบทบาทสำคัญในแอปพลิเคชันการขุดข้อมูลใด ๆ ที่เกี่ยวข้องกับข้อมูลข้อความด้วยเหตุผลสองประการ ครั้งแรกในขณะที่ข้อมูลดิบอาจมีขนาดใหญ่สำหรับปัญหาใด ๆ แต่มักจะเป็นชุดย่อยที่ค่อนข้างเล็กของข้อมูลที่เกี่ยวข้องและเครื่องมือค้นหาเป็นเครื่องมือสำคัญสำหรับการค้นพบข้อมูลข้อความที่เกี่ยวข้องขนาดเล็กในการรวบรวมข้อความขนาดใหญ่อย่างรวดเร็ว ประการที่สองเครื่องมือค้นหามีความจำเป็นเพื่อช่วยให้นักวิเคราะห์ตีความรูปแบบใด ๆ ที่ค้นพบในข้อมูลโดยอนุญาตให้พวกเขาตรวจสอบข้อมูลข้อความต้นฉบับที่เกี่ยวข้องเพื่อให้เข้าใจถึงรูปแบบที่ค้นพบใด ๆ คุณจะได้เรียนรู้แนวคิดพื้นฐานหลักการและเทคนิคสำคัญในการดึงข้อความซึ่งเป็นวิทยาศาสตร์พื้นฐานของเครื่องมือค้นหา
ที่เก็บอย่างเป็นทางการสำหรับ 'การประมวลผลภาษาธรรมชาติที่ใช้งานได้จริง' โดย O'Reilly Media
มีให้บริการเป็นหนังสือ: NLP ใน Python - GuickStart Guide
| ชื่อ | คำอธิบาย |
|---|---|
| ACL | ที่ Vimeo |
| [Stanford CS224N: การประมวลผลภาษาธรรมชาติด้วยการเรียนรู้อย่างลึกซึ้ง | ฤดูหนาว 2021] (https://www.youtube.com/playlist?list=ploromvodv4rosh4v6133s9lfprhjembmj) |
| การประมวลผลภาษาธรรมชาติ (NLP) เป็นศูนย์เป็นฮีโร่ | โดย tensorflow |
| Zero to Hero: NLP กับ Tensorflow และ Keras (GDG Sofia Meetup) | |
| การประมวลผลภาษาธรรมชาติ | เนื้อหานี้ขึ้นอยู่กับคลาสการเรียนรู้ของ Machine Learning University (MLU) คลาสการประมวลผลภาษาธรรมชาติ สไลด์สมุดบันทึกและชุดข้อมูลมีอยู่ใน GitHub |
ฉันเป็นนักวิทยาศาสตร์การวิจัยที่ Google ฉันบล็อกเกี่ยวกับการประมวลผลภาษาธรรมชาติและการเรียนรู้ของเครื่อง
รายการบล็อกวิศวกรรมที่รวบรวมไว้
การไล่ระดับสีเป็นองค์กรที่มีภารกิจในการทำให้ทุกคนเรียนรู้เกี่ยวกับ AI และอำนวยความสะดวกในการอภิปรายภายในชุมชน AI เราก่อตั้งขึ้นในปี 2560 โดยกลุ่มนักเรียนและนักวิจัยที่ห้องปฏิบัติการ Stanford AI
| ชื่อ | คำอธิบาย |
|---|---|
| ตัวอย่างการเรียนรู้ลึกของ NVIDIA สำหรับแกนเทนเซอร์ - การประมวลผลภาษาธรรมชาติ | ตัวอย่างการเรียนรู้ลึก |
| การประมวลผลภาษาธรรมชาติด้วยหม้อแปลงไฟฟ้า | สมุดบันทึกและวัสดุสำหรับหนังสือ O'Reilly "การประมวลผลภาษาธรรมชาติด้วย Transformers" |
| การอ้างอิง NLP ที่ยอดเยี่ยม | รายการทรัพยากรที่ได้รับการดูแลจากการกลั่นความรู้ระบบแนะนำโดยเฉพาะการประมวลผลภาษาธรรมชาติ (NLP) |
| NLP - บทช่วยสอน | |
| บทช่วยสอนภาษาธรรมชาติ | |
| NLP กับ Python | Scikit-Learn, NLTK, Spacy, Gensim, TextBlob และอีกมากมาย ... |
| NLP และ Data Science GitHub สปอตไลท์สปอตไลท์ | สปอตไลท์รายวันของที่เก็บข้อมูล NLP และวิทยาศาสตร์ข้อมูล GitHub |
| NLP 101: แหล่งเก็บทรัพยากรสำหรับการเรียนรู้เชิงลึกและการประมวลผลภาษาธรรมชาติ | เอกสารนี้ถูกร่างขึ้นสำหรับผู้ที่มีความกระตือรือร้นในการเรียนรู้อย่างลึกซึ้งในการประมวลผลภาษาธรรมชาติ หากมีคำแนะนำหรือคำแนะนำที่ดีฉันจะพยายามเพิ่มเพิ่มเติม |
| NLP-Progress | ที่เก็บเพื่อติดตามความคืบหน้าในการประมวลผลภาษาธรรมชาติ (NLP) รวมถึงชุดข้อมูลและสถานะปัจจุบันของงานศิลปะสำหรับงาน NLP ที่พบบ่อยที่สุด |
| กอดใบหน้า | repo สาธารณะสำหรับโพสต์บล็อก HF |
| Allennlp | ห้องสมุดวิจัย NLP โอเพนซอร์ซสร้างขึ้นบน Pytorch allenai.org |
ไลบรารี NLP เฟรมเวิร์กโมดูล
| ชื่อ | คำอธิบาย |
|---|---|
| ชุดเครื่องมือภาษาธรรมชาติ (NLTK) | NLTK - ชุดเครื่องมือภาษาธรรมชาติ - เป็นชุดของโมดูล Python โอเพนซอร์สชุดข้อมูลและแบบฝึกหัดที่สนับสนุนการวิจัยและพัฒนาในการประมวลผลภาษาธรรมชาติ |
| ความสามารถ |
เฟรมเวิร์กที่ง่ายมากสำหรับการประมวลผลภาษาธรรมชาติที่ทันสมัย (NLP) ไหวพริบคือ: |
| ความรู้ | textacy เป็นไลบรารี Python สำหรับการดำเนินงานการประมวลผลภาษาธรรมชาติ (NLP) ที่หลากหลายซึ่งสร้างขึ้นบนห้องสมุด Spacy ที่มีประสิทธิภาพสูง ด้วยปัจจัยพื้นฐาน --- โทเค็นการติดแท็กส่วนหนึ่งของคำพูดการแยกวิเคราะห์การพึ่งพา ฯลฯ --- มอบหมายไปยังห้องสมุดอื่น textacy จะมุ่งเน้นไปที่งานที่มาก่อนและตามหลัง |
| Allennlp | ห้องสมุดการวิจัย NLP สร้างขึ้นบน Pytorch เพื่อพัฒนารูปแบบการเรียนรู้ที่ลึกล้ำที่ทันสมัยในงานทางภาษาที่หลากหลาย |
| nlpgym | NLPGYM เป็นชุดเครื่องมือในการเชื่อมช่องว่างระหว่างการใช้งานของ RL และ NLP สิ่งนี้มีจุดมุ่งหมายเพื่ออำนวยความสะดวกในการวิจัยและการเปรียบเทียบการประยุกต์ใช้ DRL ในงานการประมวลผลภาษาธรรมชาติ ชุดเครื่องมือให้สภาพแวดล้อมแบบโต้ตอบสำหรับงาน NLP มาตรฐานเช่นการติดแท็กลำดับการตอบคำถามและการจำแนกลำดับ |
| เครื่องถ่อมตัว |
| ชื่อ | คำอธิบาย |
|---|---|
| NLP-tutorial | การสอนการประมวลผลภาษาธรรมชาติสำหรับนักวิจัยการเรียนรู้อย่างลึกซึ้ง |
| การประมวลผลภาษาธรรมชาติในการสอน Python | การเปรียบเทียบนักแสดงตลกยืนขึ้นโดยใช้การประมวลผลภาษาธรรมชาติ |
- 100 เอกสาร NLP ที่ต้องอ่าน
- Sci-Hub (เอกสาร)
- ตารางการสัมมนา Stanford, NLP
- CS224N: การประมวลผลภาษาธรรมชาติด้วยการเรียนรู้อย่างลึกซึ้ง
- CIS 700-008 - นิยายอินเทอร์แอคทีฟและการสร้างข้อความ
- Harvard NLP
- หม้อแปลงภาพประกอบ
ดำเนินการเครือข่ายระบบประสาทความสนใจแบบสองทิศทางเป็นพื้นฐานของทีมปรับปรุงการใช้งานแบบจำลองของ Chris Chute เพิ่มอินพุตตัวอักษรคำตามที่อธิบายไว้ในกระดาษต้นฉบับและปรับปรุงรหัสของ Gauthierdmns