Stanford Corenlp fornece um conjunto de ferramentas de análise de linguagem natural escritas em Java. Pode tomar a entrada de texto de linguagem humana bruta e fornecer as formas básicas de palavras, suas partes da fala, sejam nomes de empresas, pessoas etc., normalizar e interpretar datas, tempos e quantidades numéricas, marcar a estrutura das frases em termos de frases ou dependências sintáticas e indicar quais frases substantivas se referem às mesmas entidades. Foi originalmente desenvolvido para o inglês, mas agora também fornece níveis variados de apoio ao árabe (moderno) árabe (continente) chinês, francês, alemão, húngaro, italiano e espanhol. Stanford Corenlp é uma estrutura integrada, o que facilita a aplicação de várias ferramentas de análise de idiomas a uma peça de texto. A partir do texto simples, você pode executar todas as ferramentas com apenas duas linhas de código. Suas análises fornecem os blocos de construção fundamentais para aplicações de entendimento de texto de texto de nível superior e específico de domínio. Stanford Corenlp é um conjunto de ferramentas de processamento de idiomas naturais estáveis e bem testados, amplamente utilizados por vários grupos na academia, indústria e governo. As ferramentas usam de várias formas os componentes probabilísticos de aprendizado de máquina e aprendizado profundo.
O Código Stanford Corenlp é escrito em Java e licenciado sob a licença pública geral da GNU (V2 ou posterior). Observe que este é o GPL completo, que permite muitos usos gratuitos, mas não seu uso no software proprietário que você distribui para outras pessoas.
Várias vezes por ano, distribuímos uma nova versão do software, que corresponde a uma confirmação estável.
Durante o tempo entre os lançamentos, sempre se pode usar a versão mais recente e em desenvolvimento do nosso código.
Aqui estão algumas instruções úteis para usar o código mais recente:
Às vezes, fornecemos frascos atualizados aqui que têm a versão mais recente do código.
Atualmente, a versão atual lançada do código é o nosso frasco mais recente lançado, embora você sempre possa criar o mais recente do Github Head.
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package , ele deve executar os testes e construir este arquivo jar: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar você precisará definir -Dclassifier=models . Aqui está o comando de amostra para espanhol: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar Os frascos de modelos que correspondem ao código mais recente podem ser encontrados na tabela abaixo.
Alguns dos modelos maiores (ingleses)-como o analisador e o Wikidict de redes de mudança-não são distribuídos com nosso frasco de modelos padrão. Isso requer o download dos frascos em inglês (extra) e inglês (KBP). Os recursos para outros idiomas exigem o uso do frasco de modelos correspondentes.
A melhor maneira de obter os modelos é usar o Git-LFS e cloná-los de abraçar o Hub Face.
Por exemplo, para obter os modelos franceses, execute os seguintes comandos:
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
Os frascos podem ser baixados diretamente dos links abaixo ou da página Hubging Face Hub também.
| Linguagem | Jar modelo | Última atualização |
|---|---|---|
| árabe | Download (HF Hub) | 4.5.6 |
| chinês | Download (HF Hub) | 4.5.6 |
| Inglês (extra) | Download (HF Hub) | 4.5.6 |
| Inglês (KBP) | Download (HF Hub) | 4.5.6 |
| Francês | Download (HF Hub) | 4.5.6 |
| Alemão | Download (HF Hub) | 4.5.6 |
| húngaro | Download (HF Hub) | 4.5.6 |
| italiano | Download (HF Hub) | 4.5.6 |
| Espanhol | Download (HF Hub) | 4.5.6 |
Obrigado a abraçar o rosto por ajudar na nossa hospedagem!
Se você não conhece o próprio Gradle, consulte o site oficial: https://gradle.org
Escreva o seguinte em seu Build.gradle de acordo com o Maven Central:
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}Se você deseja analisar o inglês, adicione seguintes:
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "Se você usar outra versão, substitua "4.5.5" por uma versão que você usa.
Você pode encontrar lançamentos de Stanford Corenlp no Maven Central.
Você pode encontrar mais explicações e documentação na página inicial de Stanford Corenlp.
Para obter informações sobre como fazer contribuições para Stanford Corenlp, consulte o arquivo contribuindo.md.
As perguntas sobre o CorenLP podem ser publicadas no Stackoverflow com a tag Stanford-NLP ou nas listas de discussão.