
[Rubyml | Rubydatascience | Rubyinterop]
NLP ที่ยอดเยี่ยมพร้อมทับทิม 
ทรัพยากรที่มีประโยชน์สำหรับการประมวลผลข้อความในทับทิม
รายการที่รวบรวมไว้นี้ประกอบด้วยทรัพยากร ที่ยอดเยี่ยม ห้องสมุดแหล่งข้อมูลเกี่ยวกับการประมวลผลการคำนวณข้อความในภาษามนุษย์ด้วยภาษาการเขียนโปรแกรมทับทิม ฟิลด์นั้นมักจะเรียกว่า NLP, ภาษาศาสตร์เชิงคำนวณ, HLT (เทคโนโลยีภาษามนุษย์) และสามารถนำมาใช้ร่วมกับปัญญาประดิษฐ์การเรียนรู้ของเครื่องจักรการดึงข้อมูลการขุดข้อความการสกัดความรู้และสาขาอื่น ๆ ที่เกี่ยวข้อง
รายการนี้มาจากการทำงานแบบวันต่อวันของเราในรูปแบบภาษาและเครื่องมือ NLP อ่านว่าทำไมรายการนี้ยอดเยี่ยม คำถามที่พบบ่อยของเราอธิบายถึงการตัดสินใจที่สำคัญและคำตอบที่เป็นประโยชน์ที่คุณอาจสนใจ
ยินดีต้อนรับทุกการบริจาค! เพิ่มลิงก์ผ่านคำขอดึงหรือสร้างปัญหาเพื่อเริ่มการสนทนา
ติดตามเราบน Twitter และโปรดกระจายคำโดยใช้แท็กแฮช #RubyNLP !
สารบัญ
- บทเรียน
- งานย่อยท่อ NLP
- การสร้างท่อส่ง
- เครื่องยนต์อเนกประสงค์
- การระบุภาษา
- การแบ่งส่วน
- การประมวลผลคำศัพท์
- ที่เกิด
- การทำให้เป็นโรคจิต
- สถิติคำศัพท์: ประเภทการนับและโทเค็น
- การกรองหยุดคำ
- การประมวลผลระดับวลี
- การประมวลผลทางไวยากรณ์
- การแยกวิเคราะห์เขตเลือกตั้ง
- การวิเคราะห์ความหมาย
- การวิเคราะห์เชิงปฏิบัติ
- งานระดับสูง
- การสะกดคำและการแก้ไขข้อผิดพลาด
- การจัดตำแหน่งข้อความ
- การแปลเครื่องจักร
- การวิเคราะห์ความเชื่อมั่น
- ตัวเลขวันที่และการแยกวิเคราะห์เวลา
- การจดจำเอนทิตีชื่อ
- ข้อความถึงข้อความเป็นข้อความ
- ตัวแทนโต้ตอบผู้ช่วยและ chatbots
- ทรัพยากรภาษาศาสตร์
- ห้องสมุดการเรียนรู้ของเครื่อง
- การสร้างภาพข้อมูล
- การจดจำตัวละครแบบออพติคอล
- การสกัดข้อความ
- การค้นหาข้อความแบบเต็มการดึงข้อมูลการจัดทำดัชนี
- การจัดการสตริงที่รับรู้ภาษา
- บทความโพสต์การพูดคุยและการนำเสนอ
- โครงการและรหัสตัวอย่าง
- หนังสือ
- ชุมชน
- ต้องการความช่วยเหลือจากคุณ!
- ทรัพยากรที่เกี่ยวข้อง
- ใบอนุญาต
บทเรียน
โปรดช่วยเรากรอกส่วนนี้! -
งานย่อยท่อ NLP
ท่อ NLP เริ่มต้นด้วยข้อความธรรมดา
การสร้างท่อส่ง
- Composable_operations - กรอบการกำหนดสำหรับการดำเนินงานท่อ
- Ruby -Spark - ประกายไฟกับ DSL ที่เข้าใจง่าย
- Phobos - ไคลเอนต์ทับทิมที่เรียบง่ายสำหรับ Apache Kafka
- ขนาน - หัวหน้างานสำหรับการดำเนินการแบบขนานในหลายซีพียูหรือในหลายเธรด
- PWRAKE - ส่วนขยาย Rake เพื่อทำงานในท้องถิ่นและงานระยะไกลในแบบคู่ขนาน
เครื่องยนต์อเนกประสงค์
- Open -NLP - การผูกทับทิมสำหรับชุดเครื่องมือ OpenNLP
- Stanford-Core-NLP-การผูกทับทิมสำหรับเครื่องมือ Stanford Corenlp
- การรักษา - กรอบการประมวลผลภาษาธรรมชาติสำหรับทับทิม (เช่น NLTK สำหรับ Python)
- NLP_TOOLZ - Wrapper ผ่านคลาส OpenNLP และตัวแยกวิเคราะห์ Berkeley ดั้งเดิม
- Open_NLP - การผูก JRuby สำหรับชุดเครื่องมือ OpenNLP
- Ruby-spacy-โมดูล wrapper สำหรับ Library NLP Spacy ผ่าน Pycall
API แบบออนไลน์
- Alchemyapi_ruby - มรดก Ruby SDK สำหรับ Alchemyapi/Bluemix
- Wit -Ruby - Ruby Client Library สำหรับแพลตฟอร์มการทำความเข้าใจภาษา Wit.ai
- WLAPI - ห้องสมุดไคลเอนต์ Ruby สำหรับ Wortschatz Leipzig Web Services
- Monkeylearn -Ruby - การวิเคราะห์ความเชื่อมั่น, การสร้างแบบจำลองหัวข้อ, การตรวจจับภาษา, การรับรู้เอนทิตีผ่านไคลเอนต์เว็บ API ที่ใช้ทับทิม
- Google-Cloud-Language-API บริการภาษาธรรมชาติของ Google สำหรับ Ruby
การระบุภาษา
การระบุภาษาเป็นหนึ่งในขั้นตอนสำคัญแรกในทุกท่อ NLP
- Scylla - การจัดหมวดหมู่และการระบุภาษา
การแบ่งส่วน
เครื่องมือสำหรับโทเค็นการตรวจจับขอบเขตและประโยคประโยคและความไม่ลงรอยกัน
- Tokenizer - Tokenizer หลายภาษา [การสอน]
- Pragmatic_tokenizer - tokenizer หลายภาษาเพื่อแยกสตริงออกเป็นโทเค็น
- NLP -Pure - อัลกอริทึมการประมวลผลภาษาธรรมชาติที่ใช้ในทับทิมบริสุทธิ์ด้วยการพึ่งพาน้อยที่สุด
- Textoken - ไลบรารี Tokenization ข้อความที่ง่ายและปรับแต่งได้
- Pragmatic_segmenter - คำศัพท์ disambiguation กับคุกกี้จำนวนมาก
- Punkt -segmenter - การใช้ทับทิมบริสุทธิ์ของ Punkt segmenter
- Tactful_tokenizer - Regexp ตาม tokenizer สำหรับภาษาที่แตกต่างกัน
- SCAPEL - เครื่องมือ disambiguation ขอบเขตประโยค
การประมวลผลคำศัพท์
ที่เกิด
Stemming เป็นคำที่ใช้ในการดึงข้อมูลเพื่ออธิบายกระบวนการในการลดรูปแบบคำเป็นตัวแทนพื้นฐานบางอย่าง การสืบทอดควรแยกแยะจาก lemmatization เนื่องจาก stems ไม่จำเป็นต้องมีแรงจูงใจทางภาษา
- Ruby-stemmer-Ruby-stemmer เปิดเผย API ก้อนหิมะถึงทับทิม
- UEA -STEMMER - Stemmer อนุรักษ์นิยมสำหรับการค้นหาและการจัดทำดัชนี
การทำให้เป็นโรคจิต
Lemmatization ถือเป็นกระบวนการค้นหารูปแบบพื้นฐานของคำ Lemmas มักจะรวบรวมในพจนานุกรม
- Lemmatizer - Lemmatizer ที่ใช้ WordNet สำหรับข้อความภาษาอังกฤษ
สถิติคำศัพท์: ประเภทการนับและโทเค็น
- WC - สิ่งอำนวยความสะดวกในการนับคำที่เกิดขึ้นในข้อความ
- Word_Count - ตัวนับคำสำหรับวัตถุ
String และ Hash - Words_counted - ห้องสมุดทับทิมบริสุทธิ์นับสถิติคำที่มีตัวเลือกที่กำหนดเองที่แตกต่างกัน
การกรองหยุดคำ
- stopwords -filter - กรองและหยุดคำศัพท์ตามคำศัพท์ตามสโนว์บอล lemmatizer
การประมวลผลระดับวลี
- N_GRAM - เครื่องกำเนิดไฟฟ้า N -Gram
- Ruby -Ngram - แบ่งคำและวลีเป็น ngrams
- RAINGRAMS - ห้องสมุด NGRAMS ที่ยืดหยุ่นและมีความยืดหยุ่นทั่วไปเขียนด้วยทับทิมบริสุทธิ์
การประมวลผลทางไวยากรณ์
การแยกวิเคราะห์เขตเลือกตั้ง
- Stanfordparser - Wrapper จาก Ruby สำหรับ Stanford Parser
- Rley - การใช้ทับทิมบริสุทธิ์ของอัลกอริทึมการแยกวิเคราะห์ Earley สำหรับไวยากรณ์เขตเลือกตั้งที่ปราศจากบริบท
- rsyntaxtree - การสร้างภาพสำหรับต้นไม้ไวยากรณ์ในทับทิมตาม rmagick [DEP: Imagemagick]
การวิเคราะห์ความหมาย
- AMATCH - ชุดระยะทางห้าประเภทระหว่างสตริง (รวมถึง Levenshtein, ผู้ขาย, Jaro -Winkler, 'Pair Distance')
- Damerau-Levenshtein-คำนวณระยะทางแก้ไขโดยใช้อัลกอริทึม Damerau-Levenshtein
- น้ำร้อน - อัลกอริทึมการแก้ไขระยะห่างจาก Ruby Ruby FFI
- Levenshtein-FFI-การคำนวณระยะทางของสตริงที่รวดเร็วโดยใช้อัลกอริทึม Damerau-Levenshtein
- TF_IDF - ความถี่เอกสารความถี่ / ผกผันในทับทิมบริสุทธิ์
- TF-IDF-Similarity-คำนวณความคล้ายคลึงกันระหว่างข้อความโดยใช้ TF/IDF
การวิเคราะห์เชิงปฏิบัติ
- SentimentLib - อัญมณีการวิเคราะห์ความเชื่อมั่นที่ขยายได้อย่างง่าย
งานระดับสูง
การสะกดคำและการแก้ไขข้อผิดพลาด
- Gonterice - การสะกดคำและการแก้ไขไวยากรณ์ผ่าน Ginger API
- HUNSPELL -I18N - การผูกทับทิมกับตัวตรวจสอบคาถา Hunspell มาตรฐาน
- FFI -Hunspell - การผูกทับทับทิมที่ใช้ FFI สำหรับ Hunspell
- Hunspell - การผูกทับทิมกับ Hunspell ผ่าน Ruby C API
การจัดตำแหน่งข้อความ
- การจัดตำแหน่ง - กิจวัตรการจัดตำแหน่งสำหรับข้อความสองภาษา (การใช้งาน Gale -Church)
การแปลเครื่องจักร
- Google-Api-Client-ไคลเอนต์ทับทิม Google API
- Microsoft_Translator - ไคลเอนต์ Ruby สำหรับ Microsoft Translator API
- Termit - Google แปลด้วยการสังเคราะห์คำพูดในเทอร์มินัลของคุณ
- ZIPF - การใช้ Bleu และอัลกอริทึมพื้นฐานอื่น ๆ
การวิเคราะห์ความเชื่อมั่น
- Stimmung - ขั้วความหมายตามพจนานุกรม Sentiws
ตัวเลขวันที่และการแยกวิเคราะห์เวลา
- เรื้อรัง - พาร์สเซอร์ภาษาธรรมชาติที่เป็นธรรมชาติของทับทิมบริสุทธิ์
- Chronic_between - Parser ภาษาธรรมชาติที่เรียบง่ายสำหรับช่วงวันที่และเวลา
- เรื้อรัง _duration - ตัวแยกวิเคราะห์ทับทิมบริสุทธิ์สำหรับเวลาที่ผ่านไป
- Kronic - วิธีการแยกวิเคราะห์และจัดรูปแบบวันที่อ่านได้ของมนุษย์
- นิกเกิล - แยกข้อมูลวันที่เวลาและข้อความจากข้อความที่มีคำศัพท์ตามธรรมชาติ
- Tickle - ตัวแยกวิเคราะห์สำหรับเหตุการณ์ที่เกิดขึ้นซ้ำและทำซ้ำ
- Numerizer - Ruby Parser สำหรับนิพจน์จำนวนภาษาอังกฤษ
การจดจำเอนทิตีชื่อ
- Ruby -ner - ชื่อการรับรู้เอนทิตีกับ Stanford Ner และ Ruby
- Ruby-NLP-การผูกทับทับทิมสำหรับ Stanford Pos-Tagger และ Name Entity Recognizer
ข้อความถึงข้อความเป็นข้อความ
- Espeak-Ruby-API ทับทิมขนาดเล็กสำหรับใช้ 'eSpeak' และ 'lame' เพื่อสร้างไฟล์ MP3 แบบข้อความเป็นคำพูด
- TTS-การแปลงข้อความเป็นคำพูดโดยใช้บริการ Google Translate
- Att_Speech - เสื้อคลุมทับทิมเหนือ AT&T Speech API สำหรับการพูดถึงข้อความ
- PocketSphinx -Ruby - การผูก pocketSphinx
ตัวแทนโต้ตอบผู้ช่วยและ chatbots
- Chatterbot - กรอบ Twitter Bot ที่ใช้ทับทิมตรงไปตรงมาโดยใช้ OAuth เพื่อตรวจสอบสิทธิ์
- LITA - กรอบการใช้งาน BOT Operation ที่ขยายได้สูงเขียนด้วยที่เก็บข้อมูลถาวรบน Redis
ทรัพยากรภาษาศาสตร์
- RWORDNET - Pure Ruby Self มีห้องสมุด API สำหรับ Princeton WordNet®
- WordNet - การผูกมัดการปรับประสิทธิภาพสำหรับ Princeton WordNet®
ห้องสมุดการเรียนรู้ของเครื่อง
อัลกอริทึมการเรียนรู้ของเครื่องในทับทิมบริสุทธิ์หรือเขียนในภาษาการเขียนโปรแกรมอื่น ๆ ที่มีการผูกที่เหมาะสมสำหรับทับทิม
สำหรับรายการที่ทันสมัยเพิ่มเติมโปรดดู ML ที่ยอดเยี่ยมพร้อมรายการทับทิม
- RB -LIBSVM - รองรับเครื่องเวกเตอร์ด้วยทับทิม
- Weka - การผูก Jruby สำหรับ Weka อัลกอริทึม ML ที่แตกต่างกันนำไปใช้ผ่าน Weka
- DecisionTree - อัลกอริทึมการตัดสินใจของต้นไม้ ID3 ในทับทิมบริสุทธิ์ [โพสต์]
- RTIMBL - ผู้เรียนที่ใช้หน่วยความจำจากกรอบ TIMBL
- classifier -reborn - โมดูลตัวแยกประเภททั่วไปเพื่อให้เบย์และประเภทอื่น ๆ ของการจำแนกประเภท
- LDA -Ruby - การใช้งาน Ruby ของ LDA (การจัดสรร Dirichlet แฝง) สำหรับการสร้างแบบจำลองหัวข้ออัตโนมัติและการจัดกลุ่มเอกสาร
- Liblinear-Ruby-Swig-อินเทอร์เฟซทับทิมไปยัง Liblinear (มีประสิทธิภาพมากกว่า LIBSVM สำหรับการจำแนกประเภทข้อความ)
- Linnaeus - ตัวจําแนกเบย์ที่ได้รับการสนับสนุนจาก Redis
- maxent_string_classifier - JRuby Maximum Entropy Classifier สำหรับข้อมูลสตริงขึ้นอยู่กับเฟรมเวิร์ก OpenNLP Maxent
- Naive_bayes - ตัวแยกประเภทไร้เดียงสาไร้เดียงสา
- NBAYES - การใช้งานแบบเต็มรูปแบบของ Ruby ของไร้เดียงสาของไร้เดียงสา
- Omnicat - เฟรมเวิร์กชั้นวางทั่วไปสำหรับการจำแนกประเภทข้อความ
- Omnicat -Bayes - การจัดหมวดหมู่ข้อความไร้เดียงสาเบย์เป็นกลยุทธ์ตัวแยกประเภท Omnicat
- Ruby -Fann - การผูกทับทิมกับห้องสมุดเครือข่ายประสาทเทียมที่รวดเร็ว (FANN)
- RBLEARN - การแยกฟีเจอร์และไลบรารี crossvalidation
การสร้างภาพข้อมูล
โปรดดูส่วนการสร้างภาพข้อมูลในวิทยาศาสตร์ข้อมูลด้วยรายการทับทิม
การจดจำตัวละครแบบออพติคอล
- Tesseract -COR - wrapper ที่ใช้ FFI เหนือเครื่องยนต์ Tesseract OCR
การสกัดข้อความ
- YOMU - ไลบรารีสำหรับการแยกข้อความและข้อมูลเมตาจากไฟล์และเอกสารโดยใช้ชุดเครื่องมือวิเคราะห์เนื้อหา Apache Tika
การค้นหาข้อความแบบเต็มการดึงข้อมูลการจัดทำดัชนี
- RSOLR - ห้องสมุดไคลเอนต์ Ruby and Rails สำหรับ Apache Solr
- Sunspot - Rails Centric Client สำหรับ Apache Solr
- Thinking -Sphinx - ปลั๊กอินบันทึกที่ใช้งานอยู่สำหรับการใช้สฟิงซ์ในโครงการที่ใช้ราง (ไม่เพียง)
- Elasticsearch - Ruby Client และ API สำหรับ Elasticsearch
- Elasticsearch -Rails - การรวมทับทิมและ Rails สำหรับ Elasticsearch
- Google-Api-Client-Ruby API Library สำหรับบริการของ Google
การจัดการสตริงที่รับรู้ภาษา
ไลบรารีสำหรับการจัดการสตริงการรับรู้ภาษาเช่นการค้นหาการจับคู่รูปแบบการแปลงเคสการแปลงรหัสการแสดงออกปกติซึ่งต้องการข้อมูลเกี่ยวกับภาษาพื้นฐาน
- Fuzzy_match - การเปรียบเทียบสตริงฟัซซี่กับการวัดระยะทางและการแสดงออกปกติ
- การแข่งขัน Fuzzy-String-Library การจับคู่สตริงฟัซซี่สำหรับทับทิม
- Active_support - Ror
ActiveSupport Gem มีส่วนขยายสตริงต่าง ๆ ที่สามารถจัดการกรณีได้ - Fuzzy_tools - ชุดเครื่องมือสำหรับการค้นหาฟัซซี่ใน Ruby ปรับเพื่อความแม่นยำ
- U - U ขยายการสนับสนุน Unicode ของ Ruby
- Unicode - ไลบรารีการทำให้เป็นมาตรฐานของ Unicode
- Commonregexruby - ค้นหาข้อมูลทั่วไปจำนวนมากในสตริง
- Regexp -Examples - สร้างสตริงที่ตรงกับนิพจน์ทั่วไปที่กำหนด
- Verbal_expressions - ทำให้การแสดงออกปกติยาก
- Translit_kit - ข้อความภาษาฮิบรูและยิดดิชเป็นอักขระละติน
- RE2 - ไลบรารีนิพจน์ปกติความเร็วสูงสำหรับการขุดข้อความและการสกัดข้อความ
- regex_sample - การสร้างสตริงตัวอย่างจากนิพจน์ทั่วไปที่กำหนด
- IULIIA - การถอดรหัส cyrillic เป็นภาษาละตินในหลายวิธีที่เป็นไปได้ (กำหนดโดยการใช้งานอ้างอิง)
บทความโพสต์การพูดคุยและการนำเสนอ
- 2019
- การแยกข้อความจากภาพโดยใช้ Ruby โดย Aonemd [Post | รหัส]
- 2018
- การประมวลผลภาษาธรรมชาติและการวิเคราะห์ความเชื่อมั่นทวีต โดย Cassandra Corrales [Post]
- 2017
- Google NLP API ตรงกับ Ruby โดย Aja Hammerly [โพสต์]
- ไวยากรณ์ไม่ใช่ทุกอย่าง: NLP สำหรับ Rubyists โดย Aja Hammerly [สไลด์]
- การคำนวณทางวิทยาศาสตร์เกี่ยวกับ Jruby โดย Prasun Anand [Slides | วิดีโอ | สไลด์ สไลด์]
- Unicode Normalization ใน Ruby โดย Starr Horne [โพสต์]
- ปี 2559
- สร้างบอทโทรเลขอย่างรวดเร็วใน Ruby โดย Ardian Haxha [Tutorial]
- การเรียนรู้ลึก: บทนำสำหรับนักพัฒนาทับทิม โดย Geoffrey Litt [Slides]
- ฉันสร้างโปรแกรม Word2vec ที่บริสุทธิ์ได้อย่างไรเร็วกว่า 3x โดย Kei Sawada [สไลด์]
- DōmoArigatō, Mr. Roboto: การเรียนรู้ด้วยเครื่องกับ Ruby โดย Eric Weinstein [Slides | วิดีโอ]
- ปี 2558
- การวิเคราะห์ N-Gram เพื่อความสนุกสนานและผลกำไร โดยพระเยซู Castello [บทช่วยสอน]
- การเรียนรู้ของเครื่องจักรทำให้ง่ายด้วย Ruby โดย Lorenzo Masini [บทช่วยสอน]
- การใช้ Ruby Machine เรียนรู้การค้นหาคำพูดของปารีสฮิลตัน โดย Rick Carlino [การสอน]
- การสำรวจการประมวลผลภาษาธรรมชาติใน Ruby โดย Kevin Dias [Slides]
- การเรียนรู้ของเครื่องจักรทำให้ง่ายด้วย Ruby โดย Lorenzo Masini [Post]
- วิทยาศาสตร์ข้อมูลเชิงปฏิบัติในทับทิม โดย Bobby Grayson [สไลด์]
- 2014
- การแยกวิเคราะห์ภาษาธรรมชาติด้วยทับทิม โดย Glauco Custódio [บทช่วยสอน]
- Demystifying Data Science: การวิเคราะห์การประชุมการประชุมกับ Rails และ Ngrams โดย Todd Schneider [วิดีโอ | รหัส]
- การประมวลผลภาษาธรรมชาติด้วย Ruby โดย Konstantin Tennhard [วิดีโอ | วิดีโอ | วิดีโอ | สไลด์]
- 2013
- วิธีการแยกวิเคราะห์ 'Go' - การประมวลผลภาษาธรรมชาติใน Ruby โดย Tom Cartwright [Slides | วิดีโอ]
- การประมวลผลภาษาธรรมชาติใน Ruby โดย Brandon Black [Slides | วิดีโอ]
- การประมวลผลภาษาธรรมชาติด้วยทับทิม: N-Grams โดย Nathan Kleyn [การสอน | รหัส]
- การค้นหาเลิฟคราฟท์ตอนที่ 1: บทนำสู่ NLP และ The Treat Gem โดย Robert Qualls [Tutorial]
- ปี 2555
- การเรียนรู้ด้วยเครื่องกับทับทิมส่วนหนึ่ง โดย Vasily Vasinov [Tutorial]
- ปี 2554
- Ruby One-liners โดย Benoit Hamelin [โพสต์]
- การจัดกลุ่มใน Ruby โดย Colin Drake [Post/)]
- 2010
- Bayes_motel - การจำแนกแบบเบย์สำหรับ Ruby โดย Mike Perham [โพสต์]
- 2552
- การพอร์ต Stemmer uea-lite ไป Ruby โดย Jason Adams [โพสต์]
- ทรัพยากร NLP สำหรับ Ruby โดย Jason Adams [โพสต์]
- 2551
- สนับสนุนเครื่องเวกเตอร์ (SVM) ใน Ruby โดย Ilya Grigorik [Post]
- การจำแนกข้อความเชิงปฏิบัติกับ Ruby โดย Gleicon Moraes [Post | รหัส]
- 2550
- การตัดสินใจของต้นไม้การเรียนรู้ในทับทิม โดย Ilya Grigorik [โพสต์]
- 2549
- พูดภาษาของฉัน: การประมวลผลภาษาธรรมชาติกับ Ruby โดย Michael Granger [Slides | เขียนขึ้น | เขียนขึ้น]
โครงการและรหัสตัวอย่าง
- ระยะทาง - การใช้งานอัลกอริทึมระยะทางต่างๆพร้อมการคำนวณตัวอย่าง
- ชื่อการรับรู้เอนทิตีกับ Stanford Ner และ Ruby - ตัวอย่างในทับทิมและ Java พร้อมคำอธิบายบางอย่าง
- คำที่นับ - ตัวอย่างของสถิติคำที่ปรับแต่งได้ซึ่งขับเคลื่อนโดย Words_counted
- rsyntaxtree - การสาธิตบนเว็บของการสร้างภาพต้นไม้ไวยากรณ์
หนังสือ
- มิลเลอร์ร็อบ การประมวลผลข้อความด้วยทับทิม: แยกค่าจากข้อมูลที่ล้อมรอบคุณ Pragmatic Programmers, 2015. [ลิงก์]
- วัตสันมาร์ค Scripting Intelligence: การรวบรวมและประมวลผลข้อมูล Web 3.0 Apress, 2010. [ลิงก์]
- วัตสันมาร์ค เว็บความหมายเชิงปฏิบัติและแอปพลิเคชันข้อมูลที่เชื่อมโยง Lulu, 2010. [ลิงก์]
ชุมชน
ต้องการความช่วยเหลือจากคุณ!
โครงการทั้งหมดในส่วนนี้มีความสำคัญต่อชุมชน แต่ต้องการความสนใจมากขึ้น กรุณาหากคุณมีเวลาว่างและการอุทิศตนใช้เวลาหลายชั่วโมงกับรหัสที่นี่
- Ferret - การดึงข้อมูลใน C และ Ruby
- สรุป - เสื้อคลุม Ruby Native สำหรับการสรุปข้อความแบบเปิด
ทรัพยากรที่เกี่ยวข้อง
- การใช้งานการแปลด้วยเครื่องประสาท
- Ruby Awesome - ในบรรดารายการที่ยอดเยี่ยมอื่น ๆ รายการสั้น ๆ ของโครงการที่เกี่ยวข้องกับ NLP
- Ruby NLP-คอลเล็กชันที่ทันสมัยของห้องสมุดทับทิมสำหรับ NLP
- การประมวลผลคำพูดและภาษาธรรมชาติ - รายการทั่วไปของทรัพยากรที่เกี่ยวข้องกับ NLP (ส่วนใหญ่ไม่ใช่สำหรับโปรแกรมเมอร์ทับทิม)
- Scientific Ruby - พีชคณิตเชิงเส้นการสร้างภาพและการคำนวณทางวิทยาศาสตร์สำหรับทับทิม
- Iruby - เคอร์เนล Iruby สำหรับ Jupyter (Formelly Ipython)
- OCR ที่ยอดเยี่ยม - ทรัพยากร OCR (การจดจำอักขระออพติคอล) มากมาย
- Tensorflow ที่ยอดเยี่ยม - การเรียนรู้ของเครื่องด้วยไลบรารี Tensorflow
- Imagemagick
ใบอนุญาต
Awesome NLP with Ruby โดย Andrei Beliankou และผู้สนับสนุน
ในขอบเขตที่เป็นไปได้ภายใต้กฎหมายบุคคลที่เกี่ยวข้อง CC0 กับ Awesome NLP with Ruby ได้สละสิทธิ์ลิขสิทธิ์และสิทธิที่เกี่ยวข้องหรือใกล้เคียงกับ Awesome NLP with Ruby
คุณควรได้รับสำเนา CC0 LegalCode พร้อมกับงานนี้ ถ้าไม่ดู https://creativecommons.org/publicdomain/zero/1.0/