Großartige NLP -Projekte
Dies ist eine kuratierte Liste von Projekten, die direkt für die Verarbeitung natürlicher Sprachverarbeitung (NLP) verbunden oder nützlich sind, die ein Geek zum Lächeln bringen, da sie existieren. Inspiriert von Joseph Missitis GitHub -Projekt
Verwandte Listen:
- Awesome-NLP
- nlp-with-ruby
- Awesome-Community-kuratierte NLP
- Awesome-DL4NLP
- Awesome-D3
- Awesome-Python
- Awesome-Data-Science-Viz
- Fantastisches tiefe Lern
- Awesome-Rl
- Awesome-rnn
- tolle öffentliche Datensätze
Inhalt
- Ressourcen und Frameworks
- Verwandte Listen
- Deep Learning Goodies
- Maschinelles Lernen
- Sprachmodellierung
- Andere Ml
- Andere coole Sachen
- Beitragen
- Lizenz
- Dialog -Frameworks
Periodische Tische
- Visualisierung
- Maschinelles Lernen
Cheat Sheets
- ML Cheat Sheet
- Deep Learnign Cheat Sheets
- Daten Schience
- Tiefes Lernen für NLP -Best Practices
- Datenvisualisierung Wikipedia
Ressourcen und Frameworks
- Apache NLPCRAFT - Eine API zur Umwandlung der natürlichen Sprache in Aktionen Link
- Reisen. Semantische Lexikonverbindung. Semantischer Parser -Link. [Link] (http://trips.ihmc.us/parser/cgi/parse)
- C & C Boxer. Semantischer Parser -Link
- Epilog. episodischer Logik -Framework -Link
- Knie (die Fortsetzung des Überlieferungsprojekts). Wissensextraktion in episodische Logik (ähnlich wie Babelnet) Link
- Fred. Semantischer Link für Parser/Wissensextraktor. Link2. Verwandte Tools Link3
- Legalo ist ein neuartiger Ansatz für offene Wissensextraktion, der unbeaufsichtigte, offene Domäne und abstraktive Wissensextraktion aus dem Text ausführt, um direkt verwendbare maschinenlesbare Informationen zu erstellen. Link
- Delph-in. Breiteres Projekt für NLP; Grammatik, Parser, Link
- Lkb. Das LKB-System ist eine Grammatik- und Lexikonentwicklungsumgebung für die Verwendung mit einheitlicher sprachlicher Formalismen. Link
- Malz -Parser. Abhängigkeits -Syntax -Parser -Link
- Yago. Wissensbasis -Link
- TOR . Text Engineering Pipeline Link
- Enju. Syntaktischer Parser -Link
- Öffnen Sie NLP. NLP -Framework im Java -Link
- Coreenlp. Stanford Core NLP -Framework für Parsen Link
- NLTK. Achsome NLP -Framework in Python Link
- Pynlpl. Python -Bibliothek für die Verarbeitung natürlicher Sprache. Es enthält verschiedene Module, die für gemeinsame und weniger verbreitete NLP -Aufgaben nützlich sind. Link
- Valex. Kategorisierung der englischen Verbensverbindungen
- Einheitlicher Verb index. Verbnet und Framenet Togetehr -Link
- Scikit-Learn. Maschinelles Lernen in Python. Einfache und effiziente Tools für Data Mining und Data Analysis Link
- Tuffy. Skalierbares Markov Logic Inference Engine Link
- Fexlix. Der Nachfolger von Tuffy Link
- Alchemie. Algorithmen für statistisches relationales Lernen und probabilistische Logikinferenz basieren auf der Markov Logic Repräsentation Link
- Pracmln. Marcov Logic In Python, dieses Projekt, begann als Gabel zu Probcong -Projekt. Weitere Link finden
- Probcog. Probcog ist ein statistisches relationales Lern- und Argumentationssystem, das ein effizientes Lernen und die Schlussfolgerung in relationalen Bereichen unterstützt
- Kreator. Kreator ist eine integrierte Entwicklungsumgebung (IDE) für relationale probabilistische Wissensrepräsentationssprachen. Derzeit unterstützt Kreator Bayesian Logic Programs (BLPS), Markov Logic Networks (MLNs), Relational Maximum Entropy (RME), Relational Bayesian Networks (RBN) und Probabilistic Prolog (Problog). Link
- pyhtm. PyHTM - Hierarchisches zeitliches Gedächtnis in Python; . Unsere Technologie für maschinelle Intelligenz wird als hierarchisches Temporal Memory (HTM) bezeichnet, eine detaillierte Computertheorie des Neocortex. Im Kern von HTM stehen zeitbasierte Lernalgorithmen, die räumliche und zeitliche Muster speichern und erinnern. HTM eignet sich gut für eine Vielzahl von Problemen, insbesondere für solche mit folgenden Eigenschaften :. Streaming -Daten anstelle statischer Datenbanken. Zugrunde liegende Muster in den Daten ändern sich im Laufe der Zeit. Viele individuelle Datenquellen, bei denen Handbetriebsmodelle unpraktisch sind. Subtile Muster, die von Menschen nicht immer gesehen werden können. Zeitbasierte Muster. Einfache Techniken wie Schwellenwerte ergeben erhebliche falsch positive und falsch negative. [Link] (https://github.com/carver/pyhtm)
- Knowrob. KnowROB ist ein Wissensverarbeitungssystem, das Wissensrepräsentations- und Argumentationsmethoden mit Techniken zum Erwerb von Wissen und zur Beerdigung des Wissens in einem physischen System kombiniert und als gemeinsamer semantischer Rahmen für die Integration von Informationen aus verschiedenen Quellen dienen kann. KnowROB kombiniert statisches enzyklopädisches Wissen, Kenntnisse des gesunden Menschenverstandes, Aufgabenbeschreibungen, Umgebungsmodelle, Objektinformationen und Informationen zu beobachteten Aktionen, die aus verschiedenen Quellen erfasst wurden (manuell axiomatisiert, aus Beobachtungen abgeleitet oder aus dem Web importiert). Es unterstützt unterschiedliche deterministische und probabilistische Argumentationsmechanismen, Clustering-, Klassifizierungs- und Segmentierungsmethoden und umfasst Abfragebestellen sowie Visualisierungstools. Link
- GHMM. Die allgemeine Hidden Markov Model Library (GHMM) ist eine frei verfügbare C -Bibliothek, die effiziente Datenstrukturen und Algorithmen für grundlegende und erweiterte HMMs mit diskreten und kontinuierlichen Emissionen implementiert. Es kommt mit Python -Wrappern, die eine viel schönere Schnittstelle und zusätzliche Funktionalität bieten. Link. pyhsmm "Dies ist eine Python-Bibliothek für ungefähre unbeaufsichtigte Folgerung in Bayesian Hidden Markov-Modellen (HMMS) und explizit versteckte Halbmarkov-Modelle (HSMMS). Lineare dynamische Systeme
- Prisma. symbolische statistische Modelle; eine Modellprüfung für zeitliche Logik und quantitative Erweiterungen; Überprüfung für Echtzeitsysteme; Markov -Modelle usw.. Link
- Uby. Eine groß angelegte, einheitliche lexikalisch-semantische Ressourcenverbindung
- Entlein. Probabilistischer CFG -Parser für Abmessungen (Zeit, Temperatur, Größe usw.) Verbindung
- Schlinge - Ein natürlicher Sprachrahmensemantik -Parser. Semantischer Parser implementiert mit Deep Recurrent Neural Network Link
- Witz. Intent Parser Link
- Mycroft. Ein Unternehmen, der einen anderen Absichts -Parser, ein Sprach2Text und ein Text2speech -Framework in Python -Link macht
- Iepy. IEPY ist ein Open -Source -Tool zur Informationsextraktion, das sich auf die Beziehungsextraktion konzentriert.link
- Mitie. Dieses Projekt bietet kostenlose (sogar für die kommerzielle Verwendung) hochmoderne Informationsextraktionstools. Die aktuelle Version enthält Tools zur Durchführung der genannten Entitätsextraktion und der Binärbeziehungserkennung sowie Tools für die Schulung benutzerdefinierter Extraktoren und Beziehungsdetektoren. Link
- Syntaxnet. Ein Open-Source-Rahmen für das neuronale Netzwerk für TensorFlow, das eine Grundlage für natürliche Sprachverständnis-Systeme (NLU) bietet. Unsere Veröffentlichung enthält den gesamten Code, der zum Training neuer Syntaxnet -Modelle für Ihre eigenen Daten erforderlich ist, sowie Parsey McParseface, einen englischen Parser, den wir für Sie geschult haben, und den Sie zum Analysieren von englischer Text verwenden können. Link
- Openai Fitnessstudio. Ein Toolkit zum Entwicklung und Vergleich von Verstärkungslernenalgorithmen. Link
- Spiff -Workflow. Spiff Workflow ist eine Bibliothek, in der ein Framework für Workflows implementiert wird. Es basiert auf http://www.workflowpatterns.com und in Pure Python implementiert. Link [Workflow Muster] (http://www.workflowpatts.com/) Ziel dieser Initiative ist es, eine konzeptionelle Grundlage für die Prozesstechnologie zu bieten. Insbesondere die Forschung liefert eine gründliche Untersuchung der verschiedenen Perspektiven (Kontrollfluss, Daten, Ressourcen und Ausnahmeberechnung), die durch eine Workflow -Sprache oder eine Sprache zur Modellierung von Geschäftsprozessen unterstützt werden müssen.
- Ein Nachrichtenleserprojekt. Link
- Word Sense Disambiguation Toolkit in Python mit Word2VEC (enthält auch Datensätze) Link
- Annotierter Dokumentenserver für Folia -Format -Link
- Toolkit nützlich für die Arbeit mit Corpus -Anmerkungen in Folien und anderen Formaten (verglichen mit Dan's Corpkit) Link
- Vadersentiment Sentiment Analysis Tool für Python Link
- WOWPAL WABBIT - Ein Wiederaufbau -Lernaufbau mit strukturierter Vorhersage -Technikverbindung. Vowpal Wabbit ist ein maschinelles Lernsystem, das die Grenze des maschinellen Lernens mit Techniken wie Online, Hashing, Allreduce, Reduktionen, Learning2Search, Active und Interactive Lernen vorantreibt. Link
- TIMBL-Ein Open-Source-Softwarepaket, das mehrere Speicher-basierte Lernalgorithmen implementiert, darunter IB1-Ig, eine Implementierung der K-Nearest-Nachbar-Klassifizierung mit Merkmalsgewichten für symbolische Merkmalsräume und Igtree, eine Entscheidungsbaumannäherung von IB1-Ig. Link Link1 Link3
- Pikes - Link Link für Wissensextraktion Suite
- RDFPRO - The Swiss Knowfe Ro Rdf Manipulation, Stream Base RDF -Verarbeitungsverbindung
- Spacy - Industrial -Fegth Natural Language Processing (NLP) mit Python und Cython Link
- Textak - höhere NLP auf der höheren Ebene auf dem Spacy -Link basiert
- UKB - Graph -basierte WSD und Ähnlichkeitslink
- Marseille - Bergbau -Argumentationsstrukturen mit ausdrucksstarker Inferenz (linearer und LSTM -Motoren) Link
- Flüssigkeitskonstruktion Grammatik - Link
- Python Cognitive Modeling Suite - Link
- Rasa - Verständnis für natürliche Sprache Verständnis
- Senticnet-Senticnet spricht über die Analyse der Stimmungsanalyse auf Konzeptebene, dh Aufgaben wie Polaritätserkennung und Emotionserkennung durch Nutzung von Semantik und Linguistik, um sich ausschließlich auf Word-Co-Auftreten zu stützen. Link Link
Deep Learning Goodies
- Nervenlager -Teller -Code
- Offene Typ Entitätserkennungssystemcode
Ressourcen
- Babelnet - Mehrsprachige Enciclopedic DictionNary Link
- Nasari - Semantische Vektordarstellung für Babelnet Link
Sprachmodellierung
- Adaptive Skip-Gram-Implementierung in Julia Link
- SUPPLY COMBER CODE, Papier überspringen
- Aufmerksamer Lesercode, Papier
- Gensim - Themenmodellierungsbibliothek für Python, enthält auch einen VORD2VEC -Implementierungslink
- VORD2VEC - Original -C -Implementierung und einiger vorberechtigter Ressourcenverbindungen
- SUPPLY COMBER CODE, Papier überspringen
- Aufmerksamer Lesercode, Papier
- FastText - schneller, bessere Textklassifizierung, Bibliothek für schnelle Textdarstellung und Klassifizierung. Link
- Inferent - Satzeinbettungen (Inferent) und Trainingscode für NLI -Link
Andere Ml
- Deep Learning Platform Mxnet + Nuympy Code
Andere coole Sachen
- Knotenbox. Mit NodeBox können Datenvisualisierungen, generatives Design und komplexe Produktionsprobleme einfach durchführen. Link
- Callimacus - verlinkte offene Daten, RDF, Webanwendung, Datenvisualisierung usw. Link
- Feature Forge. Diese Bibliothek bietet eine Reihe von Tools, die in vielen Anwendungen für maschinelles Lernen (Klassifizierung, Clustering, Regression usw.) nützlich sein können, und besonders hilfreich, wenn Sie Scikit-Learn verwenden (obwohl dies funktionieren kann, wenn Sie einen anderen Algorithmus haben). [Link] [https://github.com/machinalis/featureforge/tree/master]
- Lagergeneratoralgorithmen. [Link] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithmen]
- OpenCog AI Framework OpenCog ist ein Open-Source-Softwareprojekt, das darauf abzielt, die Herausforderung für künstliche General Intelligence (AGI) direkt zu stellen, wobei mathematische und biologische Inspiration und professionelle Software-Engineering-Techniken verwendet werden. . Link
- Link zum Sprachannotationsinstrument von Folien
- Webanno - Ein Link für sprachliche Annotationstools
- Visom - Ein flexibles Werkzeug zum Erstellen, Organisieren und Teilen von Visualisierungen lebender, reichhaltiger Daten. Link
Dialog -Frameworks
- Chat -Skript - Tool-/Dialogmanager für natürliche Sprache - Link1, Link2,
- Chatter Bot - Chatterbot ist eine Python -Bibliothek, mit der automatisierte Antworten auf die Eingabe eines Benutzers generiert werden können. Chatterbot verwendet eine Auswahl von Algorithmen für maschinelles Lernen, um verschiedene Arten von Antworten zu erzeugen.
- Rivescript - Rivescript ist eine einfache Skriptsprache für Chatbots mit einer freundlichen, leicht zu erlernen Syntax. Erstellen Sie Ihren eigenen Chatbot in Go, Java, JavaScript, Perl oder Python.
- Superscript - Ein Dialogsystem und Bot -Engine für Konversations -UIs.
- Botkit - Botkit wurde entwickelt, um den Prozess des Entwerfens und Betriebs nützlicher, kreativer Bots zu erleichtern, die innerhalb von Messaging -Plattformen leben.
Ähnliche Listen
- Super NLP
- tolles dl nlp
- Projektliste der Rochester University. potenziell nützliche Links. Link
- MISITI -Liste. Link
- Beschreibung Logische Vernunft. Liste der Vernunftverletzungen
- Illinois Projektliste. von Software aus Illinois Cognitive Rechengruppenverbindung
Beitragen
Beiträge willkommen! Lesen Sie zuerst die Beitragsrichtlinien.
Lizenz
Soweit gesetzlich möglich, hat Eugeniu Costezki auf alle Urheberrechte und verwandte oder benachbarte Rechte an dieser Arbeit verzichtet.