Table des matières [TOC]
Certains documents utilisés dans cette application, tels que le dictionnaire anglaise PTS Pali , le texte romain pāḷi tipiṭaka (version vri romaine), etc ... sont destinés à la distribution gratuite et non commerciale uniquement.
Ainsi, ce projet devrait être publié sous cette licence:
NonCommercial-ShareAlike 4.0 International (CC NC-SA 4.0)
*********************************
This tipitaka digital text version copy right Vipassana Research Institute ("VRI"), Mumbai India.
Used by permission of VRI gratefully acknowledged.
*********************************
/**
* Copyright Path Nirvana 2018
* The code and character mapping defined in this file can not be used for any commercial purposes.
* Permission from the auther is required for all other purposes.
*/
PTS Pali-English Dictionary Buddhadust_pts_ped.Utf8.txt est obtenu à Buddhadust
Corrected reprint © The Pali Text Society
Commercial Rights Reserved
Creative Commons Licence by-nc/3.0/
Voir la liste complète des fichiers dans Readme.html
| Nom | Source |
|---|---|
| Texte Pāḷi Tipiṭaka | Divisé en 2662 fichiers par https://tipitaka.app (utilisé le texte numérique Pāḷi Tipiṭaka VRI version) |
| Dictionnaire pāḷi | + Pts ped buddhadust_pts_ped.utf8.tx de Buddhadust + SIONGUI / Data GitHub Repository: vi-su-pali_viet_abhi_terms.tsv vi-su-pali_viet_dictionary.tsv vi-su-pali_viet_vinaya_terms.tsv |
| Manuel de méditation PA-AUK | Certains ebooks du manuel de méditation du monastère de la forêt PA-AUK Voir la liste des fichiers |
| Tam tạng pāḷi việt | Une traduction vietnamienne du projet Tipiṭaka (actuellement il n'est pas encore terminé.) De Tam Tang Pali Viet , la plupart des fichiers sont récupérés de: https://tamtangpaliviet.net/ttpv/ttpv_bandich.htm |
| Autres bases de données | Quelques autres bases de données diverses comme nos livres électroniques personnels, le dictionnaire révisé de Webster (1913) (cette version est maintenant dans le domaine public) etc ... qui sont importantes en taille de fichiers et peuvent ne pas être disponibles sur cette version en ligne. |
Exigences: Server PHP avec extension SQLite3 FTS5 activée (une version récente de PHP devrait répondre aux exigences)
Télécharger le lien (non disponible pour la version publique): ce référentiel
Remarque: En raison de la limitation de la taille du fichier, nous avons zippé tous les fichiers .sqlite3 dans le référentiel du dossier / données. Vous devez les décompresser avant de l'utiliser. Si vous utilisez la commande Terminal pour vous décompresser, pouvez essayer ce unzip -qq './data/*.zip' , ne faites pas plus de dossiers.
Ainsi, le dossier de données contient quelque chose comme ça (et autres fichiers).:
data
├── paaukmed.sqlite3
├── palidict.sqlite3
├── tptk.sqlite3
├── ttpv_budsas.net.sqlite3
...other files...
Sur Android, nous pouvons utiliser l'application Termux avec les packages de serveur PHP et Apache2. Vous pouvez utiliser toutes les autres applications de serveur PHP tout-en-un préparées tant qu'elles prennent en charge l'extension SQLite3 FTS5 .
Sur iPad, nous pouvons utiliser cette application avec l'application phpwin .
En général, pour créer une application de recherche de texte intégral, vous devez faire ces étapes:
Step 1: gather documents into one placeStep 2: convert them into plain .txt files, do "data clean" etc.Step 3: create an indexed databaseStep 4: search UI or CLI for the indexed databaseVotre base de données peut entraîner une "erreur du serveur interne" (code 500) plus tard.
Il est donc recommandé de les supprimer avant d'indexer.
# Find empty files
find . -type f -size 0b -print
find . -type f -size 0b -delete
# Find empty dirs
find . -empty -type d -print
find . -empty -type d -deleteLe "." est le répertoire actuel.
Les premiers avec -print sont de répertorier les éléments (Run) à sec), si vous êtes d'accord, utilisez les commandes suivantes avec l'option -elete . Il supprimera les éléments correspondants.
Exigences du système: Python3 , Java
Vous pouvez utiliser tika-app.jar (télécharger à partir de https://tika.apache.org) pour convertir des documents en fichiers txt avec le mode batch.
# Read Getting Started with Apache Tika
# from https://tika.apache.org for more info
java -jar tika-app.jar -t -i < inputDirectory > -o < outputDirectory >prepare-textdata.py pour nettoyer ces fichiers texte en premier. Vérifiez https://github.com/vpnry/dhammafts-dev-code pour les fichiers de code source. # This will help to fix broken lines
python3 prepare-textdata.py Après avoir converti tous vos documents en fichiers en texte brut, vous pouvez maintenant utiliser Apache Lucene pour créer une base de données d'index, ou dans ce cas, nous utilisons simplement SQLite3 FTS5 pour le faire:
À l' étape 2 ci-dessus, les fichiers TXT convertis peuvent contenir des lignes brisées, utilisez prepare-textdata.py pour les réparer (si vous ne l'avez pas encore fait):
python3 prepare-textdata.pyAprès cela, vous pouvez les indexer:
python3 index-all-others.pyBravo! Presque fait! :)
Placez maintenant simplement vos bases de données indexées sur les data du répertoire. Et mettez à jour leurs chemins dans le fichier index.php . Trouvez la ligne de suivi et mettez-la à mettre à jour en conséquence à vos cas.
$ dbConnection = new SQLite3 ( " data/tptk.sqlite3 " );Nous avons déployé cette application sur Heroku avec un compte gratuit. En raison de la limitation de stockage, toutes les ressources disponibles ne sont pas indexées pour cette version publique. Voici les listes de fichiers indexés:
Ebooks du manuel de méditation PA-AUK
paaukmed/
├── 01 Samatha and Rupa(A5).pdf
├── 02 Nama (newFont14.5.11)(A4).pdf
├── 03 Patticca(5thMethod)(newFont14.5.11).pdf
├── 04 Paticca (1st Method)(new font14.5.11).pdf
├── 05 PATHANA (new font14.5.11) 3.pdf
├── 06 CFMP(LakkhanaRasa)(2011).pdf
├── 07 Vipassana(all) (newFont14.5.11)3.pdf
├── 14 Ways En-Ch.pdf
├── 14 Ways Singhalese.pdf
├── NUTRIMENT- BORN MATERIALITY.pdf
├── Nutriment-born(Revised19.12.2012)5(Lg+A4).pdf
├── Recollection of Past Lives by Abhinna Etc.pdf
└── Rupa+Nama Tables (all) 10.pdf
0 directories, 14 files
ttpv/
├── 28_Khp-Dh-Ud-It.pdf
├── 29_Sn.pdf
├── 30_Vv_Pv.pdf
├── 31_Thag_Thig.pdf
├── 32_Ja_I.pdf
├── 33_Ja_II.pdf
├── 34_Ja_III.pdf
├── 35_Nidd_I.pdf
├── 36_Nidd_II.pdf
├── 45_Mil.pdf
├── Indacanda - Kinh Tung Pali Le Bai Tam Bao.pdf
├── ttpv_01_Pr.pdf
├── ttpv_02_Pc_I.pdf
├── ttpv_03_Pc_II.pdf
├── ttpv_04_Mv_I.pdf
├── ttpv_05_Mv_II.pdf
├── ttpv_06_Cv_I.pdf
├── ttpv_07_Cv_II.pdf
├── ttpv_08_Par_I.pdf
├── ttpv_09_Par_II.pdf
├── ttpv_37_Pts_I.pdf
├── ttpv_38_Pts_II.pdf
├── ttpv_39_Ap_I.pdf
├── ttpv_40_Ap_II.pdf
├── ttpv_41_Ap_III.pdf
├── ttpv_42_Bv&Cp.pdf
└── ttpv_bkn_ptm Gioi Bon Tkn.pdf
0 directories, 27 files
Puissions-nous tous être en mesure de comprendre et de pratiquer correctement le Dhamma. Puissiez-vous tous être bien et heureux!