Stanford Corenlp proporciona un conjunto de herramientas de análisis de lenguaje natural escritas en Java. Puede tomar aportes de texto del lenguaje humano crudo y dar las formas base de palabras, sus partes del habla, ya sean nombres de empresas, personas, etc., normalizar e interpretar fechas, tiempos y cantidades numéricas, marcar la estructura de las oraciones en términos de frases o dependencias sintácticas, e indica qué frases sustantiales se refieren a las mismas entidades. Originalmente se desarrolló para inglés, pero ahora también proporciona niveles diferentes de apoyo para el árabe (estándar moderno), chino (continental) chino, francés, alemán, húngaro, italiano y español. Stanford Corenlp es un marco integrado, que hace que sea muy fácil aplicar un montón de herramientas de análisis de idiomas a un texto. A partir del texto plano, puede ejecutar todas las herramientas con solo dos líneas de código. Sus análisis proporcionan los bloques de construcción fundamentales para aplicaciones de comprensión de texto de nivel superior y de dominio. Stanford Corenlp es un conjunto de herramientas de procesamiento de lenguaje natural estable y bien probado, ampliamente utilizadas por varios grupos en la academia, la industria y el gobierno. Las herramientas utilizan de diversas maneras de aprendizaje automático probabilístico y de diversas componentes de aprendizaje profundo.
El Código de Stanford Corenlp está escrito en Java y está autorizado bajo la Licencia Pública General de GNU (V2 o posterior). Tenga en cuenta que este es el GPL completo, que permite muchos usos gratuitos, pero no su uso en el software propietario que distribuye a otros.
Varias veces al año distribuimos una nueva versión del software, que corresponde a una confirmación estable.
Durante el tiempo entre versiones, uno siempre puede usar la última versión en desarrollo de nuestro código.
Aquí hay algunas instrucciones útiles para usar el último código:
A veces proporcionaremos frascos actualizados aquí que tienen la última versión del código.
En la actualidad, la versión actual lanzada del código es nuestro frasco lanzado más reciente, aunque siempre puede construir lo último de Github Head usted mismo.
cd CoreNLP ; antcd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edumvn package , debe ejecutar las pruebas y construir este archivo JAR: CoreNLP/target/stanford-corenlp-4.5.4.jarstanford-corenlp-models-current.jar deberá establecer -Dclassifier=models . Aquí está el comando de muestra para español: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar Los modelos frascos que corresponden al último código se pueden encontrar en la tabla a continuación.
Algunos de los modelos más grandes (en inglés), como el analizador de reducción de cambio y el wikidict, no se distribuyen con nuestro fras de modelos predeterminados. Estos requieren descargar los frascos de inglés (extra) e inglés (KBP). Los recursos para otros idiomas requieren el uso del frasco de modelos correspondientes.
La mejor manera de obtener los modelos es usar GIT-LFS y clonarlos de Hub Face Hub.
Por ejemplo, para obtener los modelos franceses, ejecute los siguientes comandos:
# Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install
git clone https://huggingface.co/stanfordnlp/corenlp-french
Los frascos se pueden descargar directamente de los enlaces a continuación o la página de abrazadera de abrazos también.
| Idioma | Frasco modelo | Última actualización |
|---|---|---|
| árabe | Descargar (HF Hub) | 4.5.6 |
| Chino | Descargar (HF Hub) | 4.5.6 |
| Inglés (extra) | Descargar (HF Hub) | 4.5.6 |
| Inglés (KBP) | Descargar (HF Hub) | 4.5.6 |
| Francés | Descargar (HF Hub) | 4.5.6 |
| Alemán | Descargar (HF Hub) | 4.5.6 |
| húngaro | Descargar (HF Hub) | 4.5.6 |
| italiano | Descargar (HF Hub) | 4.5.6 |
| Español | Descargar (HF Hub) | 4.5.6 |
¡Gracias a abrazar la cara por ayudar con nuestro alojamiento!
Si no sabe Gradle, vea el sitio oficial: https://gradle.org
Escriba lo siguiente en su compilación. Gradle según Maven Central:
dependencies {
implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}Si desea analizar el inglés, agregue siguiendo:
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "Si usa otra versión, reemplace "4.5.5" a una versión que use.
Puede encontrar lanzamientos de Stanford Corenlp en Maven Central.
Puede encontrar más explicación y documentación en la página de inicio de Stanford Corenlp.
Para obtener información sobre cómo hacer contribuciones a Stanford Corenlp, consulte el archivo que contribuye.
Las preguntas sobre CORENLP se pueden publicar en StackOverflow con la etiqueta Stanford-NLP o en las listas de correo.