Descarga de CoreNLP - Descargar el código fuente CoreNLP

CoreNLP

Otro código fuente

v4.5.7 - Constituency to Dependency Converter Upgrades

Descargar

Stanford Corenlp

Stanford Corenlp proporciona un conjunto de herramientas de análisis de lenguaje natural escritas en Java. Puede tomar aportes de texto del lenguaje humano crudo y dar las formas base de palabras, sus partes del habla, ya sean nombres de empresas, personas, etc., normalizar e interpretar fechas, tiempos y cantidades numéricas, marcar la estructura de las oraciones en términos de frases o dependencias sintácticas, e indica qué frases sustantiales se refieren a las mismas entidades. Originalmente se desarrolló para inglés, pero ahora también proporciona niveles diferentes de apoyo para el árabe (estándar moderno), chino (continental) chino, francés, alemán, húngaro, italiano y español. Stanford Corenlp es un marco integrado, que hace que sea muy fácil aplicar un montón de herramientas de análisis de idiomas a un texto. A partir del texto plano, puede ejecutar todas las herramientas con solo dos líneas de código. Sus análisis proporcionan los bloques de construcción fundamentales para aplicaciones de comprensión de texto de nivel superior y de dominio. Stanford Corenlp es un conjunto de herramientas de procesamiento de lenguaje natural estable y bien probado, ampliamente utilizadas por varios grupos en la academia, la industria y el gobierno. Las herramientas utilizan de diversas maneras de aprendizaje automático probabilístico y de diversas componentes de aprendizaje profundo.

El Código de Stanford Corenlp está escrito en Java y está autorizado bajo la Licencia Pública General de GNU (V2 o posterior). Tenga en cuenta que este es el GPL completo, que permite muchos usos gratuitos, pero no su uso en el software propietario que distribuye a otros.

Construir instrucciones

Varias veces al año distribuimos una nueva versión del software, que corresponde a una confirmación estable.

Durante el tiempo entre versiones, uno siempre puede usar la última versión en desarrollo de nuestro código.

Aquí hay algunas instrucciones útiles para usar el último código:

Construcción proporcionada

A veces proporcionaremos frascos actualizados aquí que tienen la última versión del código.

En la actualidad, la versión actual lanzada del código es nuestro frasco lanzado más reciente, aunque siempre puede construir lo último de Github Head usted mismo.

Construir con hormigas

Asegúrese de tener hormiga instalada, detalles aquí: http://ant.apache.org/
Compile el código con este comando: cd CoreNLP ; ant
Luego ejecute este comando para construir un jar con la última versión del código: cd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edu
Esto creará un nuevo frasco llamado Stanford-Corenlp.jar en la carpeta Corenlp que contiene el último código
Las dependencias que funcionan con el último código están en Corenlp/Lib y Corenlp/Liblocal, así que asegúrese de incluirlos en su classpath.
Cuando use la última versión del código, asegúrese de descargar las últimas versiones de los modelos CorenLP, modelos ingleses e inglés-modelos-kbp e incluirlas en su classpath. Si está procesando idiomas distintos del inglés, asegúrese de descargar la última versión del jar de modelos para el idioma que le interesa.

Construir con Maven

Asegúrese de haber instalado Maven, detalles aquí: https://maven.apache.org/
Si ejecuta este comando en el mvn package , debe ejecutar las pruebas y construir este archivo JAR: CoreNLP/target/stanford-corenlp-4.5.4.jar
Cuando use la última versión del código, asegúrese de descargar las últimas versiones de los modelos CorenLP, modelos en inglés-Extra y modelos en inglés-kbp e incluirlas en su classpath. Si está procesando idiomas distintos del inglés, asegúrese de descargar la última versión del jar de modelos para el idioma que le interesa.
Si desea utilizar Stanford Corenlp como parte de un proyecto Maven, debe instalar los frascos de modelos en su repositorio Maven. A continuación se muestra un comando de muestra para instalar el frasco de modelos españoles. Para otros idiomas, simplemente cambie el nombre del idioma en el comando. Para instalar stanford-corenlp-models-current.jar deberá establecer -Dclassifier=models . Aquí está el comando de muestra para español: mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.5.4 -Dclassifier=models-spanish -Dpackaging=jar

Modelos

Los modelos frascos que corresponden al último código se pueden encontrar en la tabla a continuación.

Algunos de los modelos más grandes (en inglés), como el analizador de reducción de cambio y el wikidict, no se distribuyen con nuestro fras de modelos predeterminados. Estos requieren descargar los frascos de inglés (extra) e inglés (KBP). Los recursos para otros idiomas requieren el uso del frasco de modelos correspondientes.

La mejor manera de obtener los modelos es usar GIT-LFS y clonarlos de Hub Face Hub.

Por ejemplo, para obtener los modelos franceses, ejecute los siguientes comandos:

 # Make sure you have git-lfs installed
# (https://git-lfs.github.com/)
git lfs install

git clone https://huggingface.co/stanfordnlp/corenlp-french

Los frascos se pueden descargar directamente de los enlaces a continuación o la página de abrazadera de abrazos también.

Idioma	Frasco modelo	Última actualización
árabe	Descargar (HF Hub)	4.5.6
Chino	Descargar (HF Hub)	4.5.6
Inglés (extra)	Descargar (HF Hub)	4.5.6
Inglés (KBP)	Descargar (HF Hub)	4.5.6
Francés	Descargar (HF Hub)	4.5.6
Alemán	Descargar (HF Hub)	4.5.6
húngaro	Descargar (HF Hub)	4.5.6
italiano	Descargar (HF Hub)	4.5.6
Español	Descargar (HF Hub)	4.5.6

¡Gracias a abrazar la cara por ayudar con nuestro alojamiento!

Instalar por Gradle

Si no sabe Gradle, vea el sitio oficial: https://gradle.org

Escriba lo siguiente en su compilación. Gradle según Maven Central:

 dependencies {
    implementation ' edu.stanford.nlp:stanford-corenlp:4.5.5 '
}

Si desea analizar el inglés, agregue siguiendo:

    implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models "
    implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english "
    implementation " edu.stanford.nlp:stanford-corenlp:4.5.5:models-english-kbp "

Si usa otra versión, reemplace "4.5.5" a una versión que use.