Impresionantes proyectos de PNL
Esta es una lista curada de proyectos directamente conectados o útiles para el procesamiento del lenguaje natural (PNL) que hacen que una sonrisa geek existan. Inspirado en el proyecto Github de Joseph Misiti
Listas relacionadas:
- Awesome-NLP
- PNL-With-Ruby
- impresionante-comunicación-curada-NLP
- impresionante-dl4nlp
- Awesome-D3
- Awesome-Python
- impresionante-data-ciencia-viz
- IMPRESIONANTE LABRA
- Awesome-RL
- impresionante-rnn
- Datasets de publicidad impresionante
Contenido
- Recursos y marcos
- Listas relacionadas
- Golosinas de aprendizaje profundo
- Aprendizaje automático
- Modelado de idiomas
- Otro ML
- Otras cosas geniales
- Contribuir
- Licencia
- Marcos de diálogo
Mesas periódicas
- Visualización
- Aprendizaje automático
Hojas de trampa
- Ml Hoja de trucos
- Hojas de trucos de aprendizaje profundo
- Schiencia de datos
- Aprendizaje profundo para las mejores prácticas de PNL
- Visualización de datos Wikipedia
Recursos y marcos
- Apache NLPCRACT: una API para convertir el lenguaje natural en el enlace de acciones
- Viajes. Link Léxico semántico. enlace semántico analizador. [enlace] (http://trips.ihmc.us/parser/cgi/parse)
- Boxer C&C. enlace de analizador semántico
- Epilog. Enlace del marco lógico episódico
- Knext (la continuación del proyecto Lore). Extracción de conocimiento en el enlace lógica episódica (similar a Babelnet)
- Fred. Parser semántico/enlace extractor de conocimiento. enlace2. Link3 de herramientas relacionadas3
- LegalO es un nuevo enfoque de extracción de conocimiento abierto que realiza una extracción de conocimiento abierta y de conocimiento abstracto del texto para producir información legible directamente utilizable por la máquina. enlace
- Delph-in. Proyecto más amplio para PNL; Gramática, analizador, enlace
- LKB. El sistema LKB es un entorno de desarrollo de gramática y léxico para su uso con formalismos lingüísticos basados en la unificación. enlace
- Parser de malta. Enlace de analizador de sintaxis dependiente
- Yago. Enlace de la base de conocimiento
- PUERTA . enlace de tubería de ingeniería de texto
- Enju. enlace de analizador sintáctico
- Abra NLP. Marco de PNL en Java Link
- Corenlp. Marco NLP de Stanford Core para el enlace de análisis
- Nltk. Marco de PNL en un enlace de Python
- Pynlpl. Biblioteca de Python para procesamiento del lenguaje natural. Contiene varios módulos útiles para tareas PNL comunes y menos comunes. enlace
- Valex. Categorización del enlace de verbos en inglés
- Índice verbal unificado. Verbnet y franet togetehr enlace
- Scikit-learn. Aprendizaje automático en Python. Herramientas simples y eficientes para la minería de datos y el enlace de análisis de datos
- Tuffy. Enlace de motor de inferencia lógica de Markov escalable
- Fexlix. El sucesor de Tuffy Link
- Alquimia. Algoritmos para el aprendizaje relacional estadístico e inferencia lógica probabilística, basadas en el enlace de representación lógica de Markov
- pracmln. Marcov Logic en Python, este proyecto comenzó como una bifurcación para el proyecto Probcong. Encuentra más enlace
- Probcog. Probcog es un sistema estadístico de aprendizaje y razonamiento relacional que respalda el aprendizaje e inferencia eficientes en el enlace de dominios relacionales
- Kreator. Kreator es un entorno de desarrollo integrado (IDE) para los idiomas de representación de conocimiento probabilístico relacional. En este momento, Kreator admite programas lógicos bayesianos (BLP), Networks Logic de Markov (MLN), entropía máxima relacional (RME), redes bayesianas relacionales (RBN) y prólogo probabilístico (ProBlog). enlace
- pyhtm. Pyhtm - Memoria temporal jerárquica en Python; . Nuestra tecnología de inteligencia de máquinas se llama memoria temporal jerárquica (HTM), que es una teoría computacional detallada de la neocorteza. En el núcleo de HTM hay algoritmos de aprendizaje basados en el tiempo que almacenan y recuerdan patrones espaciales y temporales. HTM es adecuado para una amplia variedad de problemas, particularmente aquellos con las siguientes características :. Transmisión de datos en lugar de bases de datos estáticas. Los patrones subyacentes en los datos cambian con el tiempo. Muchas fuentes de datos individuales donde la elaboración de modelos separados no es práctico. Patrones sutiles que no siempre pueden ser vistos por humanos. Patrones basados en el tiempo. Las técnicas simples, como los umbrales, producen falsos positivos sustanciales y falsos negativos. [enlace] (https://github.com/carver/pyhtm)
- Knowrob. KnowRob es un sistema de procesamiento de conocimiento que combina la representación del conocimiento y los métodos de razonamiento con técnicas para adquirir conocimiento y para fundamentar el conocimiento en un sistema físico y puede servir como un marco semántico común para integrar información de diferentes fuentes. KnowRob combina conocimiento enciclopédico estático, conocimiento de sentido común, descripciones de tareas, modelos de entorno, información de objetos e información sobre acciones observadas que se han adquirido de varias fuentes (axiomatizadas manualmente, derivadas de observaciones o importadas de la Web). Admite diferentes mecanismos de razonamiento determinista y probabilístico, agrupación, clasificación y métodos de segmentación, e incluye interfaces de consulta, así como herramientas de visualización. enlace
- Ghmm. La Biblioteca General de Modelos de Markov (GHMM) es una biblioteca C disponible gratuitamente que implementa estructuras y algoritmos de datos eficientes para HMM básicos y extendidos con emisiones discretas y continuas. Viene con envoltorios de pitón que proporcionan una interfaz mucho más agradable y una funcionalidad adicional. enlace . pyhsmm "Esta es una biblioteca de Python para inferencia aproximada no supervisada en los modelos Bayesian Hidden Markov (HMMS) y los modelos Semi-Markov ocultos (HSMM) de duración explícita (HSMMS), centrándose en las extensiones no paramétricas bayesianas, los modelos HDP-HMM y HDP-HSMM, principalmente con las aproximaciones débiles. Sistemas dinámicos lineales.
- Prisma. modelos simbólicos-estadísticos; un verificador de modelos para lógica temporal y extensiones cuantitativas; verificación para sistemas en tiempo real; modelos de Markov, etc. enlace
- Uby. Un enlace de recursos léxico-semántico unificado a gran escala
- Patito. Parser CFG probabilístico para dimensiones (tiempo, temperatura, tamaño, etc.) Enlace
- Sling: un analizador de semántico de marco de lenguaje natural. Parser semántico implementado utilizando un enlace de red neuronal recurrente profunda
- Ingenio enlace de analizador de intención
- Mycroft. Una empresa que hace otro analizador intencional, un Speech2Text y un Text2Speech marcos en Python Link
- IEPY. IEPY es una herramienta de código abierto para la extracción de información centrada en la extracción de relaciones.
- Mitie. Este proyecto proporciona herramientas de extracción de información de última generación (incluso para uso comercial). La versión actual incluye herramientas para realizar la extracción de entidad nombrada y la detección de relaciones binarias, así como herramientas para capacitar extractores personalizados y detectores de relaciones. enlace
- Sintaxetnet. Un marco de red neuronal de código abierto para TensorFlow que proporciona una base para los sistemas de comprensión del lenguaje natural (NLU). Nuestro lanzamiento incluye todo el código necesario para entrenar nuevos modelos de sintaxi en sus propios datos, así como Parsey McParseface, un analizador inglés que hemos entrenado para usted, y que puede usar para analizar el texto en inglés. enlace
- Gimnasio Operai. Un conjunto de herramientas para desarrollar y comparar algoritmos de aprendizaje de refuerzo. enlace
- flujo de trabajo spiff. Spiff Workflow es una biblioteca que implementa un marco para los flujos de trabajo. Se basa en http://www.workflowpatterns.com e implementada en Pure Python. Enlace [Patrones de flujo de trabajo] (http://www.workflowpatterns.com/) El objetivo de esta iniciativa es proporcionar una base conceptual para la tecnología de procesos. En particular, la investigación proporciona un examen exhaustivo de las diversas perspectivas (flujo de control, datos, recursos y manejo de excepciones) que deben ser respaldados por un lenguaje de flujo de trabajo o un lenguaje de modelado de procesos comerciales.
- Un proyecto de lector de noticias. enlace
- Word Sense Disambigation Toolkit en Python usando Word2Vec (también contiene conjuntos de datos) Enlace
- servidor de documentos anotado para enlace de formato folial
- Toolkit útil para trabajar con anotaciones de corpus en folia y otros formatos (en comparación con el enlace de Dan CorpKit)
- Herramienta de análisis de sentimientos de vadersentimentos para Python Link
- WOWPal Wabbit: una configuración de aprendizaje de reinformación utilizando el enlace de técnica de predicción estructurada. Vowpal Wabbit es un sistema de aprendizaje automático que empuja la frontera del aprendizaje automático con técnicas como en línea, hash, allreduce, reducciones, aprendizaje2Search, aprendizaje activo e interactivo. enlace
- TIMBL: un paquete de software de código abierto que implementa varios algoritmos de aprendizaje basados en la memoria, entre los cuales IB1-IG, una implementación de la clasificación de vecinos K-near más con la ponderación de características adecuada para espacios de características simbólicas e Igtree, una aproximación del árbol de decisiones de IB1-IG. Enlace Link1 Link3
- Pikes - Enlace de enlace de suite de extracción de conocimiento de conocimiento
- RDFPRO - La manipulación Swiss Knowfe RDF, enlace de procesamiento de RDF base de la base de flujo
- Spacy - Procesamiento de lenguaje natural de fuerza industrial (PNL) con Python y Cython Link
- Textacy - NLP de nivel superior construido en Spacy Link
- UKB - WSD basado en gráficos y enlace de similitud
- Marsella - Estructuras de argumentos mineros con enlace de inferencia expresiva (motores lineales y LSTM)
- Gramática de construcción de fluidos - enlace
- Suite de modelado cognitivo de Python - enlace
- Rasa - Link de comprensión del lenguaje natural
- Senticnet: hablar de Senticnet está hablando sobre el análisis de sentimientos a nivel de concepto, es decir, realizar tareas como la detección de polaridad y el reconocimiento de emociones al aprovechar la semántica y la lingüística en lugar de depender únicamente de las frecuencias de coincidencia de palabras. enlace
Golosinas de aprendizaje profundo
- Código de cajero neuronal.
- Código del sistema de reconocimiento de entidad de tipo abierto
Recursos
- Babelnet - Enlace de Dicción Enciclopédica multilingüe
- Nasari - Representación vectorial semántica para Babelnet Link
Modelado de idiomas
- Implementación adaptativa de gramo de omisión en Julia Link
- Omita el código del codificador de oraciones, papel
- Código de lector atento, documento
- Gensim - Biblioteca de modelado de temas para Python, también incluye un enlace de implementación de Vord2Vec
- Vord2VEC - Implementación original de C y un enlace de recursos precomputados
- Omita el código del codificador de oraciones, papel
- Código de lector atento, documento
- FastText: más rápida, mejor clasificación de texto, biblioteca para representación y clasificación de texto rápido. enlace
- Infersent - Incrustaciones de oraciones (inferentes) y código de entrenamiento para el enlace NLI
Otro ML
- Plataforma de aprendizaje profundo MXNET + Código NuyMpy
Otras cosas geniales
- Caja de nodo. NodeBox facilita la realización de visualizaciones de datos, diseño generativo y desafíos de producción complejos. enlace
- Callimacus: datos abiertos vinculados, RDF, aplicación web, visualización de datos, etc. Enlace
- Forjata de características. Esta biblioteca proporciona un conjunto de herramientas que pueden ser útiles en muchas aplicaciones de aprendizaje automático (clasificación, agrupación, regresión, etc.), y particularmente útiles si usa Scikit-Learn (aunque esto puede funcionar si tiene un algoritmo diferente). [Enlace] [https://github.com/machinalis/featureforge/tree/master]
- Algoritmos de generador de aturdimiento. [enlace] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithms]
- OpenCog AI Framework OpenCog es un proyecto de software de código abierto destinado a enfrentar directamente el desafío de inteligencia general artificial (AGI), utilizando inspiración matemática y biológica y técnicas de ingeniería de software profesional. . enlace
- Enlace de herramienta de anotación lingüística de folia
- Webanno: un enlace de herramienta de anotación lingüística
- Visdom: una herramienta flexible para crear, organizar y compartir visualizaciones de datos en vivo y ricos. enlace
Marcos de diálogo
- Script de chat - Herramienta de lenguaje natural/Administrador de diálogo - Link1, Link2,
- Chatter Bot: Chatterbot es una biblioteca de Python que facilita la generación de respuestas automatizadas a la entrada de un usuario. Chatterbot utiliza una selección de algoritmos de aprendizaje automático para producir diferentes tipos de respuestas.
- Rivescript - Rivescript es un lenguaje de secuencias de comandos simple para chatbots con una sintaxis amigable y fácil de aprender. Cree su propio chatbot en Go, Java, JavaScript, Perl o Python.
- SuperScript: un sistema de diálogo y un motor BOT para las UI conversacionales.
- BOTKIT - BOTKIT está diseñado para aliviar el proceso de diseño y ejecución de bots útiles y creativos que viven dentro de las plataformas de mensajería.
Listas similares
- NLP impresionante
- Impresionante DL NLP
- Lista de proyectos de la Universidad de Rochester. enlaces potencialmente útiles. enlace
- Lista de Misiti. enlace
- Descripción razonadores lógicos. Lista de enlace de razonadores
- Lista de proyectos de Illinois. de software del enlace del grupo de computación cognitiva de Illinois
Contribuir
¡Contribuciones bienvenidas! Lea las pautas de contribución primero.
Licencia
En la medida de lo posible según la ley, Eugeniu Costezki ha renunciado a todos los derechos de autor y derechos relacionados o vecinos para este trabajo.