Descarga aspen - Descarga del código fuente aspen

aspen

Otro código fuente

1.0.0

Descargar

Álamo temblón

Aspen le permite buscar un gran corpus de archivos de texto sin formato a través del navegador.

Soporte de consulta de búsqueda potente a través de la sintaxis de la cadena de consultas de Elasticsearch
Realiza una limpieza básica de datos de texto sin formato y puede extraer títulos de documentos
UI receptiva que funciona en dispositivos móviles
Corre en Docker

Comenzando a usar Docker Compose

1. Recoja sus documentos

Coloque todos sus archivos en un solo lugar, como ~/ebooks/ :

 $ tree ~/ebooks
/Users/ian/ebooks
└── Project Gutenberg/
    ├── Beowulf.txt
    ├── Dracula.txt
    ├── Frankenstein.txt

2. Ejecutar Aspen y Elasticsearch

 $ docker-compose up -d
Creating network "aspen_default" with the default driver
Creating elasticsearch ... done
Creating aspen         ... done

3. Convierta cualquier documento no consultado (PDFS, MS Word) a texto sin formato

Use la utilidad convert incluida, que envuelve Apache Tika, para convertirlos en texto sin formato. Pase un nombre de archivo en relación con su directorio de datos:

 $ ls ~/ebooks
Project Gutenberg Test.docx

$ docker-compose run aspen convert Test.docx
Starting elasticsearch ... done
Test.docx doesn't exist, trying /data/Test.docx
Creating /data/Test.txt...
...
OK

$ ls ~/ebooks
Project Gutenberg Test.docx         Test.txt

4. Importar contenido a Elasticsearch

Comience reiniciando ElasticSearch para asegurarse de que todo esté funcionando:

 $ docker-compose run aspen es-reset
Starting elasticsearch ... done
Results from DELETE: { acknowledged: true }
✓ Done.

Ahora importe todos los documentos .txt . El script import intentará descubrir el título del documento automáticamente:

 $ docker-compose run aspen import
Starting elasticsearch ... done
→ Base directory is /app/public/data
▲ Ignoring non-text path: Test.docx
→ Test.txt → Test Document
→ Project Gutenberg/Beowulf.txt → The Project Gutenberg EBook of Beowulf
→ Project Gutenberg/Dracula.txt → The Project Gutenberg EBook of Dracula, by Bram Stoker
→ Project Gutenberg/Frankenstein.txt → Project Gutenberg's Frankenstein, by Mary Wollstonecraft (Godwin) Shelley
✓ Done!

También puede ejecutar import con un directorio o nombre de archivo relativo al directorio de datos. Por ejemplo, import Project Gutenberg o import Project GutenbergDracula.txt .

A veces, los documentos de texto sin formato actúan de manera extraña. Tal vez bin/import no puede extraer un título o tal vez los aspectos destacados de la búsqueda están desactivados. El archivo puede tener las terminaciones de línea incorrectas o una de esos molestos encabezados de BOM UTF-8. Intente ejecutar DOS2UNIX en sus archivos de texto para solucionarlos.

5. ¡Hecho!

Vaya a http: // localhost: 3000/y comience a buscar!

Configuración de desarrollo

1. Instalar dependencias

Es más fácil usar Elasticsearch a través de Docker.

Puede obtener el nodo y el hilo a través de Homebrew en Mac, o puede descargar Node.js V8.5 o posterior e npm install -g yarn para obtener hilo.

Para la conversación de documento ( bin/convert ) que querrá:

Apache Tika
UNRTF
Par

En MacOS puede brew install node tika unrtf par .

2. Clon el repositorio

 $ git clone [email protected]:statico/aspen.git
$ cd aspen
$ yarn install

3. Configure Elasticsearch e importar sus datos

Consulte los pasos 1-4 en la sección "Usando Docker" anterior. En resumen, reúna sus archivos de texto en un solo lugar, configure Elasticsearch e importarlos con el comando bin/import .

4. Inicie la aplicación web

Aspen se construye usando Next.js, que es Node + ES6 + Express + React + Hot Reloading + Lots más. Simplemente ejecute:

 $ yarn run dev

... y vaya a http: // localhost: 3000

Si está trabajando en server.js y desea reiniciar el servidor automático, haga:

 $ yarn global add nodemon
$ nodemon -w server.js -w lib -x yarn -- run dev

Notas de desarrollo

Esto comenzó como un ejemplo angular 1 + cafeescript. Recientemente lo migré para usar Next.js, ES6 y React. Puede ver una diferencia completa aquí.
Todavía estoy usando Elasticsearch 1.7 porque no me he molestado en aprender las versiones más nuevas.

Campo de golf

Guía de elasticsearch
Elasticsearch 1.7 referencia
comando tree

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-10
tamaño 346.41KB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo