يتيح لك Aspen البحث في مجموعة كبيرة من الملفات النصية العادية عبر المتصفح.
ضع جميع ملفاتك في مكان واحد ، مثل ~/ebooks/ :
$ tree ~/ebooks
/Users/ian/ebooks
└── Project Gutenberg/
├── Beowulf.txt
├── Dracula.txt
├── Frankenstein.txt
$ docker-compose up -d
Creating network "aspen_default" with the default driver
Creating elasticsearch ... done
Creating aspen ... done
استخدم الأداة المساعدة convert ، التي تلتف Apache Tika ، لتحويلها إلى نص عادي. تمرير اسم ملف نسبة إلى دليل البيانات الخاص بك:
$ ls ~/ebooks
Project Gutenberg Test.docx
$ docker-compose run aspen convert Test.docx
Starting elasticsearch ... done
Test.docx doesn't exist, trying /data/Test.docx
Creating /data/Test.txt...
...
OK
$ ls ~/ebooks
Project Gutenberg Test.docx Test.txt
ابدأ بإعادة تعيين Elasticsearch للتأكد من أن كل شيء يعمل:
$ docker-compose run aspen es-reset
Starting elasticsearch ... done
Results from DELETE: { acknowledged: true }
✓ Done.
الآن استيراد جميع مستندات .txt . سيحاول البرنامج النصي import معرفة عنوان المستند تلقائيًا:
$ docker-compose run aspen import
Starting elasticsearch ... done
→ Base directory is /app/public/data
▲ Ignoring non-text path: Test.docx
→ Test.txt → Test Document
→ Project Gutenberg/Beowulf.txt → The Project Gutenberg EBook of Beowulf
→ Project Gutenberg/Dracula.txt → The Project Gutenberg EBook of Dracula, by Bram Stoker
→ Project Gutenberg/Frankenstein.txt → Project Gutenberg's Frankenstein, by Mary Wollstonecraft (Godwin) Shelley
✓ Done!
يمكنك أيضًا تشغيل import باستخدام دليل أو اسم ملف بالنسبة إلى دليل البيانات. على سبيل المثال ، import Project Gutenberg أو import Project GutenbergDracula.txt .
في بعض الأحيان تتصرف مستندات النص العادي بشكل غريب. ربما لا يمكن لـ bin/import استخلاص العنوان أو ربما يتم إيقاف تشغيل أبرز البحث. قد يكون للملف نهايات الخط الخاطئة أو واحدة من رؤوس UTF-8 BOM المزعجة. حاول تشغيل DOS2UNIX على ملفاتك النصية لإصلاحها.
انتقل إلى http: // localhost: 3000/وابدأ البحث!
من الأسهل استخدام Elasticsearch عبر Docker.
يمكنك الحصول على العقدة والغزل عبر Homebrew على Mac ، أو يمكنك تنزيل Node.js V8.5 أو الأحدث npm install -g yarn للحصول على الغزل.
لمحادثة المستند ( bin/convert ) ستحتاج:
على MacOS ، يمكنك brew install node tika unrtf par .
$ git clone [email protected]:statico/aspen.git
$ cd aspen
$ yarn install
انظر الخطوات 1-4 في قسم "باستخدام Docker". باختصار ، اجعل ملفاتك النصية معًا في مكان واحد ، وقم بإعداد Elasticsearch ، واستيرادها باستخدام أمر bin/import .
تم تصميم Aspen باستخدام Next.js ، وهو Node + ES6 + Express + React + Hot Reloading + الكثير. ببساطة الجري:
$ yarn run dev
... وانتقل إلى http: // localhost: 3000
إذا كنت تعمل على server.js وتريد إعادة تشغيل الخادم التلقائي ، فقم:
$ yarn global add nodemon
$ nodemon -w server.js -w lib -x yarn -- run dev
tree