Download do behemoth - Download do código -fonte behemoth

behemoth

Outro código-fonte

behemoth-1.1

Baixar

Behemoth é uma plataforma de código aberto para processamento de documentos em larga escala com base no Apache Hadoop.

Consiste em uma simples implementação baseada em anotação de um documento e em vários módulos que operam nesses documentos. Um dos principais aspectos do gigante é simplificar a implantação de analisadores de documentos em larga escala, mas também para fornecer módulos reutilizáveis para:

Ingestão de fontes de dados comuns (Warc, Nutch, etc ...)
Processamento de texto (tika, uima, portão, identificação de idiomas)
Gerando saída para ferramentas externas (Solr, Mahout)

Sua arquitetura modular simplifica o desenvolvimento de anotadores personalizados com base no MapReduce.

Observe que o Behemoth não implementa nenhum componente de PNL ou aprendizado de máquina como tal, mas serve como um 'Grueware em larga escala' para os recursos existentes. Sendo baseado no Hadoop, ele se beneficia de todos os seus recursos, como escalabilidade, tolerância a falhas e, principalmente, o backup de uma próspera comunidade de código aberto.

Wiki: https://github.com/digitalpebble/behemoth/wiki

Lista de discussão: http://groups.google.com/group/digitalpebble

Stackoverflow: http://stackoverflow.com/questions/tagged/behemoth

Expandir

Informações adicionais

Versão behemoth-1.1
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 1.55MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos