Соглашение [TOC]
Некоторые материалы, используемые в этом приложении, такие как словарь английского языка PTS , римский текст Типинака (римская версия VRI) и т. Д., И т. Д., Получены только для свободного распределения и некоммерческого.
Таким образом, этот проект должен быть опубликован по этой лицензии:
NonCommercial-ShareAlike 4.0 International (CC NC-SA 4.0)
*********************************
This tipitaka digital text version copy right Vipassana Research Institute ("VRI"), Mumbai India.
Used by permission of VRI gratefully acknowledged.
*********************************
/**
* Copyright Path Nirvana 2018
* The code and character mapping defined in this file can not be used for any commercial purposes.
* Permission from the auther is required for all other purposes.
*/
PTS Pali-Anglish Dictionary Buddhadust_pts_ped.utf8.txt получен из Buddhadust
Corrected reprint © The Pali Text Society
Commercial Rights Reserved
Creative Commons Licence by-nc/3.0/
См. Полный список файлов в readme.html
| Имя | Источник |
|---|---|
| Пайцет Типинака Текст | Разделен на 2662 файла по https://tipitaka.app (используемый цифровой пайф -тип |
| Словарь Pāḷi | + Pts ped buddhadust_pts_ped.utf8.tx из Buddhadust + Siongui/Data GitHub Repository: vi-su-pali_viet_abhi_terms.tsv vi-su-pali_viet_dictionary.tsv vi-su-pali_viet_vinaya_terms.tsv |
| Руководство по медитации Па-Аук | Некоторые электронные книги по медитации Pa-Auk |
| Tam tạng pāḷi việt | Вьетнамский перевод проекта Tipiṭaka (в настоящее время он еще не закончен.) Из Tam Tang Pali Viet , большинство файлов извлечены из: https://tamtangpaliviet.net/ttpv/ttpv_bandich.htm |
| Другие базы данных | Некоторые другие различные базы данных, такие как наши личные электронные книги, пересмотренный неограниченный словарь Вебстера (1913) (эта версия теперь находится в открытом доступе) и т. Д., Которые имеют большие по размеру файлов и могут быть недоступны в этой онлайн-версии. |
Требования: PHP Server с включенным расширением SQLITE3 FTS5 (недавняя версия PHP должна соответствовать требованиям)
Ссылка загрузки (еще не доступна для публичного выпуска): это хранилище
Примечание. Из -за ограничения размера файла мы застегнули все файлы .sqlite3 в репозитории папки /данных. Вам нужно расстегнуть их разар, прежде чем использовать. Если вы используете команду терминала в UNZIP, можете попробовать это unzip -qq './data/*.zip' , не делайте больше папок.
Таким образом, папка данных будет содержит что -то подобное (и другие файлы).:
data
├── paaukmed.sqlite3
├── palidict.sqlite3
├── tptk.sqlite3
├── ttpv_budsas.net.sqlite3
...other files...
На Android мы можем использовать приложение Termux с пакетами сервера PHP и Apache2. Вы можете использовать любые другие готовые приложения PHP-сервера All-One, если они поддерживают расширение SQLite3 FTS5 .
На iPad мы можем использовать это приложение с приложением Phpwin .
В целом, чтобы создать полное приложение для поиска текста, вам нужно сделать эти шаги:
Step 1: gather documents into one placeStep 2: convert them into plain .txt files, do "data clean" etc.Step 3: create an indexed databaseStep 4: search UI or CLI for the indexed databaseВаша база данных может привести к «ошибке внутреннего сервера» (код 500) позже.
Таким образом, рекомендуется удалить их перед индексацией.
# Find empty files
find . -type f -size 0b -print
find . -type f -size 0b -delete
# Find empty dirs
find . -empty -type d -print
find . -empty -type d -delete"." текущий каталог.
Первые с -принтом являются только перечислять (сухой пробег) только элементы, если вы в порядке, а затем используйте следующие команды с опцией -delete . Это удалит соответствующие предметы.
Системные требования: Python3 , Java
Вы можете использовать tika-app.jar (скачать с https://tika.apache.org) для преобразования документов в файлы TXT с режимом пакетного режима.
# Read Getting Started with Apache Tika
# from https://tika.apache.org for more info
java -jar tika-app.jar -t -i < inputDirectory > -o < outputDirectory >prepare-textdata.py , чтобы сначала очистить эти текстовые файлы. Проверьте https://github.com/vpnry/dhammafts-dev-code для файлов исходного кода. # This will help to fix broken lines
python3 prepare-textdata.py После того, как вы успешно преобразовали все ваши документы в простые текстовые файлы, теперь вы можете использовать Apache Lucene для создания индексной базы данных, или, в данном случае, мы просто используем SQLite3 FTS5 для этого:
На шаге 2 выше, конвертированные файлы TXT могут содержать сломанные линии, используйте prepare-textdata.py , чтобы исправить их (если вы еще не сделали):
python3 prepare-textdata.pyПосле этого вы можете их указать:
python3 index-all-others.pyПоздравляю! Почти :)
Теперь просто поместите свои индексированные базы данных в data каталога. И обновить их пути в файле index.php . Найдите следующую строку и обновите ее соответственно для ваших случаев.
$ dbConnection = new SQLite3 ( " data/tptk.sqlite3 " );Мы развернули это приложение на Heroku с бесплатной учетной записью. Из -за ограничения хранения не все доступные ресурсы индексируются для этого публичного выпуска. Вот указанные списки файлов:
Электронные книги по медитации PA-AUK
paaukmed/
├── 01 Samatha and Rupa(A5).pdf
├── 02 Nama (newFont14.5.11)(A4).pdf
├── 03 Patticca(5thMethod)(newFont14.5.11).pdf
├── 04 Paticca (1st Method)(new font14.5.11).pdf
├── 05 PATHANA (new font14.5.11) 3.pdf
├── 06 CFMP(LakkhanaRasa)(2011).pdf
├── 07 Vipassana(all) (newFont14.5.11)3.pdf
├── 14 Ways En-Ch.pdf
├── 14 Ways Singhalese.pdf
├── NUTRIMENT- BORN MATERIALITY.pdf
├── Nutriment-born(Revised19.12.2012)5(Lg+A4).pdf
├── Recollection of Past Lives by Abhinna Etc.pdf
└── Rupa+Nama Tables (all) 10.pdf
0 directories, 14 files
ttpv/
├── 28_Khp-Dh-Ud-It.pdf
├── 29_Sn.pdf
├── 30_Vv_Pv.pdf
├── 31_Thag_Thig.pdf
├── 32_Ja_I.pdf
├── 33_Ja_II.pdf
├── 34_Ja_III.pdf
├── 35_Nidd_I.pdf
├── 36_Nidd_II.pdf
├── 45_Mil.pdf
├── Indacanda - Kinh Tung Pali Le Bai Tam Bao.pdf
├── ttpv_01_Pr.pdf
├── ttpv_02_Pc_I.pdf
├── ttpv_03_Pc_II.pdf
├── ttpv_04_Mv_I.pdf
├── ttpv_05_Mv_II.pdf
├── ttpv_06_Cv_I.pdf
├── ttpv_07_Cv_II.pdf
├── ttpv_08_Par_I.pdf
├── ttpv_09_Par_II.pdf
├── ttpv_37_Pts_I.pdf
├── ttpv_38_Pts_II.pdf
├── ttpv_39_Ap_I.pdf
├── ttpv_40_Ap_II.pdf
├── ttpv_41_Ap_III.pdf
├── ttpv_42_Bv&Cp.pdf
└── ttpv_bkn_ptm Gioi Bon Tkn.pdf
0 directories, 27 files
Пусть мы все сможем правильно понять и практиковать Дхамму быстро. Пусть вы все будете хорошо и счастливы!