Projetos incríveis de PNL
Esta é uma lista com curadoria de projetos diretamente conectados ou úteis para o processamento de linguagem natural (PNL), que faz um sorriso nerd para existir. Inspirado no projeto Github de Joseph Misiti
Listas relacionadas:
- Awesome-NLP
- NLP-With-Ruby
- Awesome-Community-Curated-NLP
- Awesome-dl4nlp
- Awesome-d3
- Awesome-python
- Awesome-Data-Science-Viz
- Aprendizagem incrível
- Awesome-rl
- Awesome-rnn
- Datasetes Públicos Awesome
Conteúdo
- Recursos e estruturas
- Listas relacionadas
- Getos de aprendizado profundo
- Aprendizado de máquina
- Modelagem de idiomas
- Outro Ml
- Outras coisas legais
- Contribuir
- Licença
- Estruturas de diálogo
Tabelas periódicas
- Visualização
- Aprendizado de máquina
Folhas de trapaça
- ML Folha de dicas
- Folhas de truques de aprendizado profundo
- Data Schience
- Aprendizagem profunda para as melhores práticas da PNL
- Wikipedia de visualização de dados
Recursos e estruturas
- Apache NLPcraft - Uma API para converter linguagem natural em link de ações
- Viagens. Link semântico do léxico. Link semântico de analisador. [link] (http://trips.ihmc.us/parser/cgi/parse)
- C&C Boxer. Link semântico de analisador
- Epilog. Link da estrutura lógica episódica
- KNEXT (a continuação do Projeto Lore). Extração de conhecimento na lógica episódica (semelhante ao Babelnet) Link
- Fred. Link semântico de analisador/extrator de conhecimento. link2. Ferramentas relacionadas Link3
- Legalo é uma nova abordagem de extração de conhecimento aberto que executa o domínio não supervisionado, aberto e a extração abstrata de conhecimento do texto para produzir informações diretamente utilizáveis para a máquina. link
- Delph-in. Projeto mais amplo para PNL; Gramática, analisador, link
- LKB. O sistema LKB é um ambiente de desenvolvimento de gramática e léxico para uso com formalismos lingüísticos baseados em unificação. link
- Analisador de malte. link de pasta de dependeCy Syntax
- Yago. Link da base de conhecimento
- PORTÃO . link de pipeline de engenharia de texto
- Enju. Link do analisador sintático
- NLP aberto. Estrutura do NLP no link Java
- CORENLP. Stanford Core NLP Framework for Parsing Link
- Nltk. Aumente a estrutura do NLP no link python
- Pynlpl. Biblioteca Python para processamento de linguagem natural. Ele contém vários módulos úteis para tarefas comuns e menos comuns de PNL. link
- Valex. Categorização do link de verbos em inglês
- Índice de verbos unificados. Link TOBNET e FRAMENET TOGETEHR
- Scikit-Learn. Aprendizado de máquina em Python. Ferramentas simples e eficientes para mineração de dados e link de análise de dados
- Tuffy. Link escalável do mecanismo de inferência de lógica markov
- Fexlix. o sucessor de Tuffy Link
- Alquimia. Algoritmos para aprendizado relacional estatístico e inferência de lógica probabilística, com base no link de representação lógica de Markov
- pracmln. Marcov Logic in Python, este projeto começou como um projeto de garfo para probncong. Encontre mais link
- ProbCog. O ProbCog é um sistema estatístico de aprendizado e raciocínio relacional que suporta aprendizado e inferência eficientes no link de domínios relacionais
- KRATOR. O Kreator é um ambiente de desenvolvimento integrado (IDE) para idiomas de representação de conhecimento probabilístico relacional. No momento, o Kreator suporta programas lógicos bayesianos (BLPs), Redes Lógicas de Markov (MLNs), Entropia Máxima Relacional (RME), Redes Bayesianas Relacionais (RBN) e Proco Probabilístico (Problog). link
- pyhtm. Pyhtm - Memória Temporal Hierárquica em Python; . Nossa tecnologia de inteligência de máquina é chamada de memória temporal hierárquica (HTM), que é uma teoria computacional detalhada do neocórtex. No centro do HTM, há algoritmos de aprendizado baseados no tempo que armazenam e lembram padrões espaciais e temporais. O HTM é adequado para uma ampla variedade de problemas, particularmente aqueles com as seguintes características :. Dados de streaming em vez de bancos de dados estáticos. Os padrões subjacentes na mudança de dados ao longo do tempo. Muitas fontes de dados individuais, onde os modelos separados de criação de mãos são impraticáveis. Padrões sutis que nem sempre podem ser vistos pelos humanos. Padrões baseados no tempo. Técnicas simples, como limiares, produzem falsos positivos substanciais e falsos negativos. [link] (https://github.com/carver/pyhtm)
- KnowRob. O KnowRob é um sistema de processamento de conhecimento que combina métodos de representação e raciocínio do conhecimento com técnicas para adquirir conhecimento e aterrar o conhecimento em um sistema físico e pode servir como uma estrutura semântica comum para integrar informações de diferentes fontes. O KnowRob combina conhecimento enciclopédico estático, conhecimento de senso comum, descrições de tarefas, modelos de ambiente, informações de objetos e informações sobre ações observadas que foram adquiridas de várias fontes (manualmente axiomatizadas, derivadas de observações ou importadas da Web). Ele suporta diferentes mecanismos de raciocínio determinístico e probabilístico, métodos de clustering, classificação e segmentação e inclui interfaces de consulta, bem como ferramentas de visualização. link
- Ghmm. A Biblioteca Geral de Modelo Markov Hidden (GHMM) é uma biblioteca C disponível gratuitamente, implementando estruturas e algoritmos de dados eficientes para HMMs básicos e estendidos com emissões discretas e contínuas. Ele vem com invólucros python que fornecem uma interface muito mais agradável e funcionalidade adicional. link . PYHSMM "Esta é uma biblioteca Python para aproximar a inferência não supervisionada nos modelos Bayesian Hidden Markov (HMMS) e os modelos semi-markov ocultos de duração explícita (HSMMs), focando as extensões não-paramétricas Bayesianas, também as extensões de HDP-HMM e HDPMM, principalmente com os fracos de lãs de fracasia. Sistemas dinâmicos
- Prisma. modelos estatísticos simbólicos; um verificador de modelo para lógica temporal e extensões quantitativas; verificação para sistemas em tempo real; Modelos de Markov etc. link
- Uby. Um link de recurso lexical-semântico unificado em larga escala
- Patinho. analisador CFG probabilístico para dimensões (tempo, temperatura, tamanho etc.) link
- Sling - Um analisador semântica de quadro de linguagem natural. Analisador semântico implementado usando um link de rede neural recorrente profundo
- Sagacidade. Link do analisador de intenção
- Mycroft. Uma empresa fazendo outro analisador de intenções, um discurso2text e uma estrutura de text2speech no link python
- IEPY. O IEPY é uma ferramenta de código aberto para extração de informações focada na extração de relação.link
- Mitie. Este projeto fornece ferramentas gratuitas de extração de informações de última geração (mesmo para uso comercial). A versão atual inclui ferramentas para realizar extração de entidade nomeada e detecção de relação binária, bem como ferramentas para treinamento de extratores e detectores de relação personalizados. link
- Sintaxe. Uma estrutura de rede neural de código aberto para o TensorFlow que fornece uma base para sistemas de entendimento de linguagem natural (NLU). Nosso lançamento inclui todo o código necessário para treinar novos modelos de sintaxe em seus próprios dados, bem como Parsey McParseface, um analisador inglês que treinamos para você e que você pode usar para analisar o texto em inglês. link
- Academia aberta. Um kit de ferramentas para desenvolver e comparar algoritmos de aprendizado de reforço. link
- Fluxo de trabalho do SPIFF. O Spiff Workflow é uma biblioteca implementando uma estrutura para fluxos de trabalho. É baseado em http://www.workflowpatterns.com e implementado em python puro. Link [Padrões de fluxo de trabalho] (http://www.workflowpatterns.com/) O objetivo desta iniciativa é fornecer uma base conceitual para a tecnologia do processo. Em particular, a pesquisa fornece um exame completo das várias perspectivas (fluxo de controle, dados, recursos e manuseio de exceções) que precisam ser suportados por uma linguagem de fluxo de trabalho ou por uma linguagem de modelagem de processos de negócios.
- Um projeto de leitor de notícias. link
- Word Sense Desambiguação Toolkit no Python usando o Word2vec (contém conjuntos de dados também) Link
- Link anotado de documentos para o formato Folia
- Kit de ferramentas úteis para trabalhar com anotações corpus em Folia e outros formatos (Compare com o Link do Corpo de Dan)
- Ferramenta de análise de sentimentos VadersEntiment para Python Link
- WOWPAL WABBIT - Uma configuração de aprendizado de reinformance usando o link da técnica de previsão estruturada. O Vowpal Wabbit é um sistema de aprendizado de máquina que empurra a fronteira do aprendizado de máquina com técnicas como on -line, hash, alteração, reduções, aprendizado de aprendizado2, ativo e aprendizado interativo. link
- TIMBL-Um pacote de software de código aberto que implementa vários algoritmos de aprendizado baseado em memória, entre os quais o IB1-IG, uma implementação da classificação vizinha mais antiga com a ponderação de recursos adequada para espaços de recursos simbólicos e Igtree, uma aproximação de árvore de decisão do IB1-IG. link link1 link3
- Pikes - Link do suíte de extração de conhecimento
- RDFPRO - A manipulação suíça de knowfe ro rdf, link de processamento RDF de base RDF
- Spacy - Processamento de linguagem natural de força industrial (PNL) com Python e Cython Link
- TEXTACY - PNL de nível superior construído no link Spacy
- UKB - WSD baseado em gráfico e link de similaridade
- Marselha - Estruturas de argumentos de mineração com inferência expressiva (link linear e mecanismos LSTM)
- Gramática de construção de fluidos - link
- Suíte de Modelagem Cognitiva Python - Link
- Rasa - Link para compreensão da linguagem natural
- SenticNet-Falar sobre a Senticnet está falando sobre análise de sentimentos no nível do conceito, ou seja, executando tarefas como detecção de polaridade e reconhecimento de emoções, aproveitando a semântica e a linguística em lugares de confiar apenas nas frequências de co-ocorrência de palavras. link de link
Getos de aprendizado profundo
- Código de caixa de armazenamento neural
- Código do sistema de reconhecimento de entidade de tipo aberto
Recursos
- BABELNET - Link multilíngue de dictionNary Dictiony
- Nasari - Representação de vetor semântico para Babelnet Link
Modelagem de idiomas
- Implementação adaptativa de pular grama em Julia Link
- Pule o código do codificador da frase, papel
- Código de leitores atenciosos, papel
- GENSIM - Biblioteca de modelagem de tópicos para Python, também inclui um link de implementação do Vord2vec
- Vord2vec - Implementação original C e algum link de recursos pré -computados
- Pule o código do codificador da frase, papel
- Código de leitores atenciosos, papel
- FastText - Classificação de texto mais rápida, melhor, biblioteca para representação e classificação de texto rápido. link
- Infecsent - Cheddings de sentença (Infecsent) e Código de Treinamento para Link NLI
Outro Ml
- Plataforma de aprendizado profundo mxnet + código nuyypy
Outras coisas legais
- Caixa de nó. O NodeBox facilita a visualização de dados, o design generativo e os desafios complexos de produção. link
- Callimacus - Dados abertos vinculados, RDF, aplicativo da web, visualização de dados etc. Link
- Feste forge. Esta biblioteca fornece um conjunto de ferramentas que podem ser úteis em muitos aplicativos de aprendizado de máquina (classificação, agrupamento, regressão etc.) e, particularmente útil, se você usar o Scikit-Learn (embora isso possa funcionar se você tiver um algoritmo diferente). [link] [https://github.com/machinalis/featureforge/tree/master]
- Algoritmos do gerador de armazenamento. [link] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithms]
- O OpenCog AI Framework OpenCog é um projeto de software de código aberto destinado a confrontar diretamente o desafio da Inteligência Geral Artificial (AGI), usando as técnicas de inspiração matemática e biológica e engenharia de software profissional. . link
- Link da ferramenta de anotação lingüística de folia
- Webanno - um link da ferramenta de anotação linguística
- Visdom - Uma ferramenta flexível para criar, organizar e compartilhar visualizações de dados ricos e vivos. link
Estruturas de diálogo
- Script de bate -papo - Ferramenta de linguagem natural/gerenciador de diálogo - Link1, Link2,
- Chatter Bot - ChatterBot é uma biblioteca Python que facilita a geração de respostas automatizadas para a entrada de um usuário. O ChatterBot usa uma seleção de algoritmos de aprendizado de máquina para produzir diferentes tipos de respostas.
- Rivescript - Rivescript é uma linguagem de script simples para chatbots com uma sintaxe amigável e fácil de aprender. Crie seu próprio chatbot em Go, Java, JavaScript, Perl ou Python.
- SUPERSCRIPT - Um sistema de diálogo e motor de bot para interface do usuário de conversação.
- Botkit - O Botkit foi projetado para facilitar o processo de projetar e executar bots úteis e criativos que vivem dentro de plataformas de mensagens.
Listas semelhantes
- NLP incrível
- DL incrível NLP
- Lista de projetos da Universidade de Rochester. links potencialmente úteis. link
- Lista de Misiti. link
- Descrição Raciocínio lógico. Lista de links de raciocínio
- Lista de projetos de Illinois. de software do link do grupo de computação cognitiva de Illinois
Contribuir
Contribuições Bem -vindo! Leia as diretrizes de contribuição primeiro.
Licença
Na medida do possível, sob a lei, Eugeniu Costezki renunciou a todos os direitos autorais e direitos relacionados ou vizinhos a este trabalho.