Proyek NLP yang luar biasa
Ini adalah daftar proyek yang dikuratori yang terhubung secara langsung atau berguna untuk pemrosesan bahasa alami (NLP) yang membuat senyum geek ada. Terinspirasi oleh Proyek GitHub Joseph Misiti
Daftar terkait:
- NLP yang luar biasa
- NLP-dengan-Ruby
- NLP yang dikurung-komunitas yang luar biasa
- Awesome-DL4NLP
- Awesome-D3
- Python yang luar biasa
- Awesome-data-science-viz
- LEARNING DEEP AWESOME
- Awesome-RL
- Awesome-rnn
- Dataet publik yang mengagumkan
Isi
- Sumber daya dan kerangka kerja
- Daftar terkait
- Barang belajar yang mendalam
- Pembelajaran Mesin
- Pemodelan Bahasa
- ML lainnya
- Barang keren lainnya
- Menyumbang
- Lisensi
- Kerangka kerja dialog
Tabel Berkala
- Visualisasi
- Pembelajaran Mesin
Lembar cheat
- Lembar Cheat ML
- Lembar cheat belajar mendalam
- Schience data
- Pembelajaran mendalam untuk praktik terbaik NLP
- Visualisasi Data Wikipedia
Sumber daya dan kerangka kerja
- Apache NLPCraft - API untuk Mengubah Bahasa Alami menjadi Tautan Tindakan
- Perjalanan. Tautan leksikon semantik. tautan parser semantik. [tautan] (http://trips.ihmc.us/parser/cgi/parse)
- C&C Boxer. tautan parser semantik
- Epilog. tautan kerangka kerja logika episodik
- Knext (kelanjutan proyek Lore). Ekstraksi Pengetahuan ke Tautan Logika Episodik (Mirip dengan Babelnet)
- Fred. Tautan Parser/Pengetahuan Semantik. link2. Alat Terkait Link3
- Legalo adalah pendekatan ekstraksi pengetahuan terbuka baru yang melakukan ekstraksi pengetahuan yang tidak diawasi, domain terbuka, dan abstraktif dari teks untuk memproduksi informasi yang dapat dibaca dengan mesin yang dapat digunakan secara langsung. link
- Delph-in. Proyek yang lebih luas untuk NLP; tata bahasa, parser, tautan
- Lkb. Sistem LKB adalah lingkungan pengembangan tata bahasa dan leksikon untuk digunakan dengan formalisme linguistik berbasis unifikasi. link
- Malt parser. Tautan Parser Sintaks Dependecy
- Yago. Tautan Basis Pengetahuan
- GERBANG . Tautan Pipa Teknik Teks
- Enju. tautan parser sintaksis
- Buka NLP. Kerangka kerja NLP di java link
- Corenlp. Stanford Core NLP Framework for parsing link
- Nltk. Kerangka kerja NLP yang luar biasa di Python Link
- Pynlpl. Perpustakaan Python untuk pemrosesan bahasa alami. Ini berisi berbagai modul yang berguna untuk tugas NLP yang umum dan kurang umum. link
- Valex. Kategorisasi Tautan Kata Kerja Bahasa Inggris
- Indeks kata kerja terpadu. Verbnet dan framenet tautan bersama
- scikit-learn. Pembelajaran mesin dalam Python. Alat sederhana dan efisien untuk penambangan data dan tautan analisis data
- Tuffy. Tautan mesin inferensi logika markov yang dapat diskalakan
- Fexlix. penerus tufy link
- Alkimia. Algoritma untuk pembelajaran relasional statistik dan inferensi logika probabilistik, berdasarkan tautan representasi logika Markov
- Pracmln. Logika Marcov di Python, proyek ini dimulai sebagai garpu untuk proyek probcong. Temukan lebih banyak tautan
- Probcog. Probcog adalah sistem pembelajaran dan penalaran relasional statistik yang mendukung pembelajaran dan inferensi yang efisien dalam tautan domain relasional
- Kreator. Kreator adalah lingkungan pengembangan terintegrasi (IDE) untuk bahasa representasi pengetahuan probabilistik relasional. Saat ini, Kreator mendukung Program Logika Bayesian (BLP), Markov Logic Networks (MLNS), Relational Maximum Entropy (RME), Relational Bayesian Networks (RBN), dan Prolog Probabilistik (Problog). link
- pyhtm. PyHTM - memori temporal hierarkis di Python; . Teknologi intelijen mesin kami disebut hirarkis memori temporal (HTM), yang merupakan teori komputasi terperinci dari neokorteks. Inti dari HTM adalah algoritma pembelajaran berbasis waktu yang menyimpan dan mengingat pola spasial dan temporal. HTM sangat cocok untuk berbagai masalah, terutama yang memiliki karakteristik berikut :. Streaming data daripada database statis. Pola yang mendasari dalam perubahan data dari waktu ke waktu. Banyak sumber data individu di mana model -model yang terpisah tidak praktis. Pola halus yang tidak selalu dapat dilihat oleh manusia. Pola berbasis waktu. Teknik sederhana seperti ambang batas menghasilkan positif palsu yang substansial dan negatif palsu. [tautan] (https://github.com/carver/pyhtm)
- Tahurob. Knowrob adalah sistem pemrosesan pengetahuan yang menggabungkan representasi pengetahuan dan metode penalaran dengan teknik untuk memperoleh pengetahuan dan untuk mendarat pengetahuan dalam sistem fisik dan dapat berfungsi sebagai kerangka kerja semantik yang umum untuk mengintegrasikan informasi dari berbagai sumber. Knowrob menggabungkan pengetahuan ensiklopedik statis, pengetahuan yang masuk akal, deskripsi tugas, model lingkungan, informasi objek dan informasi tentang tindakan yang diamati yang telah diperoleh dari berbagai sumber (secara aksiomatisasi secara manual, berasal dari pengamatan, atau diimpor dari web). Ini mendukung berbagai mekanisme penalaran deterministik dan probabilistik, pengelompokan, metode klasifikasi dan segmentasi, dan termasuk antarmuka kueri serta alat visualisasi. link
- Ghmm. General Hidden Markov Model Library (GHMM) adalah perpustakaan C yang tersedia secara bebas menerapkan struktur data dan algoritma yang efisien untuk HMM dasar dan diperluas dengan emisi diskrit dan berkelanjutan. Muncul dengan pembungkus python yang menyediakan antarmuka yang jauh lebih baik dan fungsi tambahan. tautan. pyhsmm "Ini adalah perpustakaan Python untuk perkiraan inferensi yang tidak diawasi dalam model Markov tersembunyi Bayesian (HMM) dan model semi-markov yang tersembunyi (HSMM) eksplisit, yang berfokus pada model linesis Bayesian. Sistem Dinamis
- Prisma. model simbolik-statistik; Pemeriksa Model untuk Logika Temporal dan Ekstensi Kuantitatif; verifikasi untuk sistem realtime; model Markov dll. link
- Uby. Tautan sumber daya leksikal bersatu bersatu
- Bebek. Parser CFG probabilistik untuk dimensi (waktu, suhu, ukuran dll) tautan
- Sling - Parser bingkai bahasa alami. Semantic Parser diimplementasikan menggunakan tautan jaringan saraf berulang dalam
- Kecerdasan Intent Parser Link
- Mycroft. Perusahaan yang membuat parser niat lain, pidato2Teks dan kerangka kerja teks2speech di tautan Python
- Iepy. IEPY adalah alat open source untuk ekstraksi informasi yang difokuskan pada ekstraksi hubungan
- Mitie. Proyek ini menyediakan alat ekstraksi informasi canggih (bahkan untuk penggunaan komersial). Rilis saat ini mencakup alat untuk melakukan ekstraksi entitas bernama dan deteksi hubungan biner serta alat untuk melatih ekstraktor khusus dan detektor relasi. link
- Sintaksnet. Kerangka kerja jaringan saraf open-source untuk TensorFlow yang menyediakan sistem fondasi untuk pemahaman bahasa alami (NLU). Rilis kami mencakup semua kode yang diperlukan untuk melatih model sintaksis baru pada data Anda sendiri, serta Parsey McParseface, parser bahasa Inggris yang telah kami latih untuk Anda, dan yang dapat Anda gunakan untuk menganalisis teks bahasa Inggris. link
- Gym openai. Toolkit untuk mengembangkan dan membandingkan algoritma pembelajaran penguatan. link
- Alur kerja spiff. Spiff Workflow adalah perpustakaan yang menerapkan kerangka kerja untuk alur kerja. Ini didasarkan pada http://www.workflowpatterns.com dan diimplementasikan dalam python murni. Link [Pola Alur Kerja] (http://www.workflowpatterns.com/) Tujuan dari inisiatif ini adalah untuk memberikan dasar konseptual untuk teknologi proses. Secara khusus, penelitian ini memberikan pemeriksaan menyeluruh terhadap berbagai perspektif (aliran kontrol, data, sumber daya, dan penanganan pengecualian) yang perlu didukung oleh bahasa alur kerja atau bahasa pemodelan proses bisnis.
- Proyek pembaca berita. link
- Toolkit disambiguasi indera kata dalam python menggunakan tautan Word2Vec (berisi set data)
- Server dokumen beranotasi untuk tautan format folia
- Toolkit Berguna untuk Bekerja dengan Anotasi Corpus di Folia dan Format Lain (Bandingkan dengan Dan's Corpkit) Tautan
- Alat Analisis Sentimen Vadersentimen untuk Tautan Python
- WOWPAL WABBIT - Pengaturan pembelajaran reinformecement menggunakan tautan teknik prediksi terstruktur. VowPal Wabbit adalah sistem pembelajaran mesin yang mendorong perbatasan pembelajaran mesin dengan teknik seperti online, hashing, allreduce, pengurangan, pembelajaran2Search, aktif, dan pembelajaran interaktif. link
- Timbl-Paket perangkat lunak open source yang menerapkan beberapa algoritma pembelajaran berbasis memori, di antaranya IB1-IG, implementasi klasifikasi tetangga K-Nearest dengan bobot fitur yang cocok untuk ruang fitur simbolik, dan IGTREE, perkiraan pohon keputusan IB1-IG. Link Link1 Link3
- Tautan tautan Pikes - Pengetahuan Ekstraksi
- RDFPRO - Manipulasi Swiss Knowfe Ro RDF, Tautan Pemrosesan RDF Basis Stream
- Spacy - Pemrosesan Bahasa Alami Kekuatan Industri (NLP) dengan Python dan Cython Link
- Tekstasi - NLP tingkat yang lebih tinggi dibangun di atas tautan spacy
- UKB - WSD berbasis grafik dan tautan kesamaan
- Marseille - Struktur Argumen Penambangan dengan Link Inferensi Ekspresif (Linear dan LSTM)
- Grammar Konstruksi Cairan - Tautan
- Python Cognitive Modeling Suite - Link
- Rasa - Tautan Pemahaman Bahasa Alami
- SenticNet-Berbicara tentang Senticnet berbicara tentang analisis sentimen tingkat konsep, yaitu, melakukan tugas-tugas seperti deteksi polaritas dan pengenalan emosi dengan memanfaatkan semantik dan linguistik sebagai pengganti hanya mengandalkan frekuensi kemunculan kata-kata. tautan tautan
Barang belajar yang mendalam
- Kode teller storry saraf
- Kode Sistem Pengakuan Entitas Jenis Buka
Sumber daya
- Babelnet - Tautan Diksi Enciclopedic Multilingual
- Nasari - Representasi Vektor Semantik untuk Tautan Babelnet
Pemodelan Bahasa
- Implementasi Skip-Gram Adaptif di Julia Link
- Lewati Kali Kalimat Kalimat, Kertas
- Kode pembaca yang penuh perhatian, kertas
- GENSIM - Perpustakaan Pemodelan Topik untuk Python, juga termasuk tautan implementasi Vord2VEC
- Vord2vec - Implementasi C Asli dan beberapa tautan sumber daya yang sudah dikomputasi
- Lewati Kali Kalimat Kalimat, Kertas
- Kode pembaca yang penuh perhatian, kertas
- FastText - Klasifikasi teks yang lebih cepat, lebih baik, perpustakaan untuk representasi dan klasifikasi teks cepat. link
- Infersent - kalimat embeddings (infersent) dan kode pelatihan untuk tautan NLI
ML lainnya
- Platform pembelajaran mendalam MXNET + NUYMPY CODE
Barang keren lainnya
- Kotak simpul. NodeBox memudahkan melakukan visualisasi data, desain generatif, dan tantangan produksi yang kompleks. link
- Callimacus - Data Terbuka Tertaut, RDF, Aplikasi Web, Visualisasi Data dll.
- Fitur Forge. Perpustakaan ini menyediakan serangkaian alat yang dapat berguna dalam banyak aplikasi pembelajaran mesin (klasifikasi, pengelompokan, regresi, dll.), Dan sangat membantu jika Anda menggunakan scikit-learn (meskipun ini dapat bekerja jika Anda memiliki algoritma yang berbeda). [tautan] [https://github.com/machinalis/featureforge/tree/master]
- Algoritma Generator Storry. [tautan] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithms]
- OpenCog AI Framework Opencog adalah proyek perangkat lunak sumber terbuka yang bertujuan untuk secara langsung menghadapi tantangan intelijen umum buatan (AGI), menggunakan inspirasi matematika dan biologis dan teknik rekayasa perangkat lunak profesional. . link
- Tautan Alat Anotasi Linguistik Folia
- Webanno - Tautan Alat Anotasi Linguistik
- Visdom - Alat yang fleksibel untuk membuat, mengatur, dan berbagi visualisasi data hidup yang kaya. link
Kerangka kerja dialog
- Skrip Obrolan - Manajer Alat Bahasa Alami/Manajer Dialog - Link1, Link2,
- Chatter Bot - Chatterbot adalah perpustakaan Python yang memudahkan untuk menghasilkan respons otomatis terhadap input pengguna. Chatterbot menggunakan pilihan algoritma pembelajaran mesin untuk menghasilkan berbagai jenis respons.
- Rivescript - Rivescript adalah bahasa skrip sederhana untuk chatbots dengan sintaks yang ramah dan mudah dipelajari. Buat chatbot Anda sendiri di Go, Java, JavaScript, Perl atau Python.
- SuperScript - Sistem dialog dan mesin bot untuk UI percakapan.
- BOTKIT - Botkit dirancang untuk memudahkan proses merancang dan menjalankan bot kreatif yang berguna yang hidup di dalam platform pesan.
Daftar serupa
- NLP yang luar biasa
- DL NLP yang luar biasa
- Daftar Proyek Universitas Rochester. tautan yang berpotensi berguna. link
- Daftar Misiti. link
- Deskripsi Penalaran Logika. daftar tautan penalaran
- Daftar Proyek Illinois. perangkat lunak dari tautan grup komputasi kognitif Illinois
Menyumbang
Kontribusi Selamat Datang! Baca Pedoman Kontribusi terlebih dahulu.
Lisensi
Sejauh mungkin berdasarkan hukum, Eugeniu Costezki telah melepaskan semua hak cipta dan hak terkait atau tetangga untuk pekerjaan ini.