Projets de PNL géniaux
Il s'agit d'une liste organisée de projets directement connectés ou utiles pour le traitement du langage naturel (NLP) qui font un sourire geek car ils existent. Inspiré par le projet Github de Joseph Misiti
Listes connexes:
- génial-nlp
- PNL-avec-Ruby
- Awesome-Community-Hurated-NLP
- génial-dl4nlp
- génial-d3
- super-python
- Awesome-data-Science-à savoir
- superbe d'apprentissage
- génial-rl
- génial-rnn
- Awesome-public-Datasets
Contenu
- Ressources et cadres
- Listes connexes
- Goodies d'apprentissage en profondeur
- Apprentissage automatique
- Modélisation des langues
- Autre ML
- Autres trucs sympas
- Contribuer
- Licence
- Cadres de dialogue
Tables périodiques
- Visualisation
- Apprentissage automatique
Feuilles de triche
- Feuille de triche ML
- Feuilles de triche de Deep Learnign
- Data schience
- Deep Learning for NLP meilleures pratiques
- Visualisation des données wikipedia
Ressources et cadres
- Apache NLPCraft - Une API pour convertir le langage naturel en Actions Link
- Voyages. Lien de lexique sémantique. lien de l'analyseur sémantique. [lien] (http://trips.ihmc.us/parser/cgi/parse)
- C&C Boxer. lien d'analyseur sémantique
- Epilog. lien de framework logique épisodique
- KNEXT (la poursuite du projet Lore). Extraction des connaissances dans le lien de la logique épisodique (similaire à Babelnet)
- Fred. lien d'analyseur sémantique / extracteur de connaissances. link2. Outils connexes Link3
- Legalo est une nouvelle approche d'extraction de connaissances ouvertes qui effectue une extraction de connaissances non supervisée et ouverte et abstractive du texte pour produire des informations lisibles par machine directement utilisables. lien
- Delph-in. Projet plus large pour la PNL; Grammaire, analyseur, lien
- LKB. Le système LKB est un environnement de développement de grammaire et de lexique pour une utilisation avec des formalismes linguistiques basés sur l'unification. lien
- Analyseur de malt. lien d'analyse de syntaxe dépendante
- Yago. lien de base de connaissances
- GRILLE . lien de pipeline d'ingénierie de texte
- Enju. lien d'analyse syntaxique
- Open NLP. Framework NLP dans Java Link
- Corenlp. Framework NLP Stanford Core pour l'analyse du lien
- Nltk. Framework NLP Awersome dans Python Link
- Pynlpl. Bibliothèque Python pour le traitement du langage naturel. Il contient divers modules utiles pour les tâches NLP communes et moins courantes. lien
- Valex. Catégorisation du lien des verbes anglais
- Index verbe unifié. Verbnet et Framenet Togetehr Lien
- Scikit-learn. Apprentissage automatique à Python. Outils simples et efficaces pour l'exploration de données et le lien d'analyse des données
- Tuffy. Lien de moteur d'inférence de logique Markov évolutif
- Fexlix. Le successeur de Tuffy Link
- Alchimie. Algorithmes pour l'apprentissage relationnel statistique et l'inférence logique probabiliste, basée sur le lien de représentation logique de Markov
- pracmln. Marcov Logic in Python, ce projet a commencé comme un projet Fork to ProbCong. Trouvez plus de lien
- Probcog. ProbCog est un système d'apprentissage et de raisonnement relationnel statistique qui soutient l'apprentissage et l'inférence efficaces dans le lien des domaines relationnels
- Kreator. Kreator est un environnement de développement intégré (IDE) pour les langues de représentation des connaissances probabilistes relationnelles. À l'heure actuelle, Kreator prend en charge les programmes de logique bayésienne (BLP), les réseaux logiques de Markov (MLN), l'entropie maximale relationnelle (RME), les réseaux bayésiens relationnels (RBN) et le prolog (Problog). lien
- pyhtm. pyhtm - mémoire temporelle hiérarchique dans python; . Notre technologie d'intelligence machine est appelée mémoire temporelle hiérarchique (HTM), qui est une théorie informatique détaillée du néocortex. Au cœur de HTM se trouvent des algorithmes d'apprentissage basés sur le temps qui stockent et rappellent les modèles spatiaux et temporels. HTM est bien adapté à une grande variété de problèmes, en particulier ceux qui ont les caractéristiques suivantes :. Streaming Data plutôt que de bases de données statiques. Les modèles sous-jacents dans les données changent dans le temps. De nombreuses sources de données individuelles où la fabrication de modèles séparés à la main ne sont pas pratiques. Des modèles subtils qui ne peuvent pas toujours être vus par les humains. Modèles basés sur le temps. Des techniques simples telles que les seuils donnent des faux positifs et des faux négatifs substantiels. [lien] (https://github.com/carver/pyhtm)
- KnowRob. KnowRob est un système de traitement des connaissances qui combine la représentation des connaissances et les méthodes de raisonnement avec des techniques pour acquérir des connaissances et pour fonder les connaissances dans un système physique et peut servir de cadre sémantique commun pour intégrer les informations provenant de différentes sources. KnowRob combine des connaissances encyclopédiques statiques, des connaissances de bon sens, des descriptions de tâches, des modèles d'environnement, des informations d'objet et des informations sur les actions observées qui ont été acquises à partir de diverses sources (axiomatisé manuellement, dérivé des observations ou importés du Web). Il prend en charge différents mécanismes de raisonnement déterministe et probabiliste, les méthodes de clustering, de classification et de segmentation, et comprend des interfaces de requête ainsi que des outils de visualisation. lien
- Ghmm. La bibliothèque générale du modèle Markov (GHMM) est une bibliothèque C gratuite implémentant des structures et des algorithmes de données efficaces pour les HMM de base et étendus avec des émissions discrètes et continues. Il est livré avec des emballages Python qui fournissent une interface beaucoup plus agréable et des fonctionnalités ajoutées. lien . PYHSMM "Ceci est une bibliothèque Python pour une inférence non supervisée approximative dans les modèles bayésiens de Markov cachés (HMMS) et les modèles semi-Markov cachés de durée explicite (HSMMS), en se concentrant sur les extensions bayésiennes non paramétriques, les extensions HDP-HMM et HDP-HSMM, principalement avec des approximations de linge faible. Systèmes dynamiques.
- Prisme. modèles symboliques-statistiques; un vérificateur de modèle pour la logique temporelle et les extensions quantitatives; vérification des systèmes en temps réel; Modèles de Markov, etc. lien
- Uby. Un lien de ressources lexicales unifiées à grande échelle
- Le canard. Parser CFG probabiliste pour dimensions (temps, température, taille, etc.)
- Élingue - un analyseur de sémantique de cadre en langue naturelle. analyseur sémantique implémenté en utilisant un lien de réseau neuronal récurrent profond
- Wit lien d'analyseur d'intention
- Mycroft. Une entreprise créant un autre analyseur d'intention, un discours2tex
- Iepy. IEPY est un outil open source pour l'extraction d'informations axé sur l'extraction des relations.
- MITIE. Ce projet fournit des outils d'extraction d'informations de pointe gratuits (même à usage commercial). La version actuelle comprend des outils pour effectuer l'extraction des entités nommées et la détection de relations binaires ainsi que des outils pour la formation des extracteurs personnalisés et des détecteurs de relation. lien
- Syntaxnet. Un cadre de réseau neuronal open source pour TensorFlow qui fournit une base pour les systèmes de compréhension du langage naturel (NLU). Notre version comprend tout le code nécessaire pour former de nouveaux modèles de syntaxnet sur vos propres données, ainsi que Parsey McParseface, un analyseur anglais que nous avons formé pour vous, et que vous pouvez utiliser pour analyser le texte anglais. lien
- Openai Gym. Une boîte à outils pour développer et comparer les algorithmes d'apprentissage du renforcement. lien
- Spiff Workflow. SPIFF Workflow est une bibliothèque implémentant un cadre de workflows. Il est basé sur http://www.workflowpatterns.com et implémenté dans Pure Python. Lien [Modèles de flux de travail] (http://www.workflowpatterns.com/) Le but de cette initiative est de fournir une base conceptuelle pour la technologie des processus. En particulier, la recherche fournit un examen approfondi des différentes perspectives (flux de contrôle, données, ressources et manipulation des exceptions) qui doivent être soutenues par une langue de workflow ou un langage de modélisation de processus métier.
- Un projet de lecteur de nouvelles. lien
- Boîte à outils de désambiguïsation des mots dans Python à l'aide de Word2Vec (contient des ensembles de données aussi)
- serveur de documents annoté pour le lien de format Folia
- Toolkit utile pour travailler avec les annotations de corpus dans Folia et d'autres formats (par rapport à Dan's Corpkit)
- VADERSENTIMENT Sentiment Analysis Tool pour Python Link
- Wowpal Wabbit - une configuration d'apprentissage en référencement en utilisant un lien de technique de prédiction structurée. Vowpal Wabbit est un système d'apprentissage automatique qui pousse la frontière de l'apprentissage automatique avec des techniques telles que en ligne, hachage, allreduce, réductions, apprentissage2-recherche, apprentissage actif et interactif. lien
- TIMBL - Un progiciel open source implémentant plusieurs algorithmes d'apprentissage basés sur la mémoire, parmi lesquels IB1-IG, une implémentation de la classification des voisins K-Dearest avec une pondération des fonctionnalités adaptée aux espaces de fonctionnalités symboliques, et Igtree, une approximation de la décision d'IB1-IG. lien link1 link3
- Pikes - lien de suite d'extraction des connaissances
- RDFPRO - La manipulation Swiss Knowfe Ro RDF, lien de traitement RDF de base de flux
- Spacy - Traitement du langage naturel de force industrielle (NLP) avec python et lien cython
- Texty - NLP de niveau supérieur construit sur un lien spacy
- UKB - WSD basé sur des graphiques et lien de similitude
- Marseille - Structures d'arguments miniers avec inférence expressive (moteurs linéaires et LSTM)
- Grammaire de construction fluide - lien
- Python Cognitive Modeling Suite - Lien
- Rasa - Lien de compréhension du langage naturel
- SenticNet - Parler de SenticNet parle de l'analyse des sentiments au niveau du concept, c'est-à-dire effectuer des tâches telles que la détection de polarité et la reconnaissance des émotions en tirant parti de la sémantique et de la linguistique en ce qui concerne le seul compter sur les fréquences de co-occurrence des mots. lien lien
Goodies d'apprentissage en profondeur
- Code de teinteur de norme neuronale
- Code système de reconnaissance d'entité de type ouvrir
Ressources
- Babelnet - Lien multilingue encolopédique DictionNary
- Nasari - Représentation vectorielle sémantique pour Babelnet Link
Modélisation des langues
- Implémentation adaptative de skip-gram dans Julia Link
- Évitez le code du codeur de phrase, papier
- Code de lecteur attentif, papier
- Gensim - Bibliothèque de modélisation de sujets pour Python, comprend également un lien d'implémentation VORD2VEC
- VORD2VEC - Implémentation C originale et liaison de ressources précomputée
- Évitez le code du codeur de phrase, papier
- Code de lecteur attentif, papier
- FastText - plus rapide, meilleure classification de texte, bibliothèque pour la représentation et la classification du texte rapide. lien
- Infersense - Embeddings de phrases (infersent) et code de formation pour le lien NLI
Autre ML
- Plateforme d'apprentissage en profondeur MXNET + Nuympy Code
Autres trucs sympas
- Boîte de nœud. Nodebox facilite la visualisation des données, la conception générative et les défis de production complexes. lien
- Callimacus - Données ouvertes liées, RDF, application Web, visualisation des données, etc.
- Fonction Forge. Cette bibliothèque fournit un ensemble d'outils qui peuvent être utiles dans de nombreuses applications d'apprentissage automatique (classification, clustering, régression, etc.), et particulièrement utile si vous utilisez Scikit-Learn (bien que cela puisse fonctionner si vous avez un algorithme différent). [lien] [https://github.com/machinalis/featureforge/tree/master]
- Algorithmes du générateur Storry. [lien] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithms]
- OpenGOG AI Framework OpenCOG est un projet logiciel open source visant à relever directement le défi de l'intelligence générale artificielle (AGI), en utilisant des techniques d'inspiration mathématique et biologique et d'ingénierie logicielle professionnelle. . lien
- Lien d'outil d'annotation linguistique Folia
- Webanno - un lien d'outil d'annotation linguistique
- Visdom - Un outil flexible pour créer, organiser et partager des visualisations de données riches en direct. lien
Cadres de dialogue
- Script de chat - Tool / Dialog Manager du langage naturel - Link1, Link2,
- Chatter Bot - Chatterbot est une bibliothèque Python qui facilite la génération de réponses automatisées à l'entrée d'un utilisateur. Chatterbot utilise une sélection d'algorithmes d'apprentissage automatique pour produire différents types de réponses.
- Rivescript - Rivescript est un langage de script simple pour les chatbots avec une syntaxe amicale et facile à apprendre. Créez votre propre chatbot dans Go, Java, Javascript, Perl ou Python.
- Exposant - Un système de dialogue et un moteur BOT pour les interfaces intermédiaires conversationnelles.
- Botkit - Botkit est conçu pour faciliter le processus de conception et de gestion des robots créatifs utiles qui vivent à l'intérieur des plates-formes de messagerie.
Listes similaires
- NLP génial
- génial dl nlp
- Liste des projets de l'Université Rochester. Liens potentiellement utiles. lien
- Liste de Misiti. lien
- Description des raisons logiques. Liste des liens des raisons
- Liste des projets de l'Illinois. de logiciels de l'Illinois Cognitive Computation Group Lien
Contribuer
Les contributions sont la bienvenue! Lisez d'abord les directives de contribution.
Licence
Dans la mesure du possible en vertu de la loi, Eugeniu Costezki a renoncé à tous les droits d'auteur et aux droits connexes ou voisins de ce travail.