Descarga de behemoth - Descarga del código fuente behemoth

behemoth

Otro código fuente

behemoth-1.1

Descargar

Behemoth es una plataforma de código abierto para el procesamiento de documentos a gran escala basado en Apache Hadoop.

Consiste en una implementación simple basada en anotaciones de un documento y una serie de módulos que operan en estos documentos. Uno de los aspectos principales del gigante es simplificar la implementación de analizadores de documentos a gran escala pero también proporcionar módulos reutilizables para:

ingerir de fuentes de datos comunes (WARC, Nutch, etc.)
Procesamiento de texto (tika, uima, puerta, identificación del idioma)
Generación de salida para herramientas externas (Solr, Mahout)

Su arquitectura modular simplifica el desarrollo de anotadores personalizados basados en MapReduce.

Tenga en cuenta que Behemoth no implementa ningún componente de PNL o aprendizaje automático como tales, sino que sirve como un "pegamento a gran escala" para los recursos existentes. Al estar basado en Hadoop, se beneficia de todas sus características, a saber, escalabilidad, tolerancia a fallas y, sobre todo, la respaldo de una próspera comunidad de código abierto.

Wiki: https://github.com/digitalpebble/behemoth/wiki

Lista de correo: http://groups.google.com/group/digitalpebble

Stackoverflow: http://stackoverflow.com/questions/tagged/behemoth

Expandir

Información adicional

Versión behemoth-1.1
Tipo Otro código fuente
Fecha de actualización 2025-04-16
tamaño 1.55MB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo