PytexTrank est une implémentation Python de Textrank en tant qu'extension de pipeline spacy, pour le travail en langage naturel basé sur des graphiques - et les pratiques de graphiques de connaissances connexes. Cela inclut la famille des algorithmes TextGraph :
Les cas d'utilisation populaires pour cette bibliothèque comprennent:
Voir notre documentation complète sur: https://derwen.ai/docs/ptr/
Voir la section "Gettant" de la documentation en ligne.
Pour installer à partir de PYPI:
python3 -m pip install pytextrank
python3 -m spacy download en_core_web_sm
Si vous travaillez directement à partir de ce dépôt GIT, assurez-vous également d'installer les dépendances:
python3 -m pip install -r requirements.txt
Alternativement, pour installer des dépendances à l'aide de conda :
conda env create -f environment.yml
conda activate pytextrank
Ensuite, pour utiliser la bibliothèque avec un simple cas d'utilisation:
import spacy
import pytextrank
# example text
text = "Compatibility of systems of linear constraints over the set of natural numbers. Criteria of compatibility of a system of linear Diophantine equations, strict inequations, and nonstrict inequations are considered. Upper bounds for components of a minimal set of solutions and algorithms of construction of minimal generating sets of solutions for all types of systems are given. These criteria and the corresponding algorithms for constructing a minimal supporting set of solutions can be used in solving all the considered types systems and systems of mixed types."
# load a spaCy model, depending on language, scale, etc.
nlp = spacy . load ( "en_core_web_sm" )
# add PyTextRank to the spaCy pipeline
nlp . add_pipe ( "textrank" )
doc = nlp ( text )
# examine the top-ranked phrases in the document
for phrase in doc . _ . phrases :
print ( phrase . text )
print ( phrase . rank , phrase . count )
print ( phrase . chunks ) Voir les cahiers de didacticiel dans le sous-répertoire examples pour un exemple de code et de modèles à utiliser pour intégrer PyTextTank aux bibliothèques connexes dans Python: https://derwen.ai/docs/ptr/tutorial/
Nous accueillons les gens qui s'impliquent en tant que contributeurs à ce projet open source!
Pour des instructions détaillées, veuillez consulter: contribution.md
Au lieu de cela, installez simplement à partir de PYPI ou utilisez conda.
Pour configurer l'environnement de construction localement, consultez la section "Build Instructions" de la documentation en ligne.
D'une manière générale, le principal numéro de version de Pytextrank suivra le numéro de version majeur de la version spaCy associée.
Voir: ChangeLog.md
Le code source de pytextrank plus son logo, sa documentation et ses exemples ont une licence MIT qui est succincte et simplifie l'utilisation dans les applications commerciales.
Tous les documents ici sont Copyright © 2016-2024 Derwen, Inc.
Veuillez utiliser l'entrée Bibtex suivante pour citer PytexTrank si vous l'utilisez dans votre recherche ou votre logiciel:
@software { PyTextRank ,
author = { Paco Nathan } ,
title = { {PyTextRank, a Python implementation of TextRank for phrase extraction and summarization of text documents} } ,
year = 2016 ,
publisher = { Derwen } ,
doi = { 10.5281/zenodo.4637885 } ,
url = { https://github.com/DerwenAI/pytextrank }
}Les citations sont utiles pour le développement et la maintenance continus de cette bibliothèque. Par exemple, consultez nos citations répertoriées sur Google Scholar.
Un grand merci à nos sponsors open source; and to our contributors: @ceteri, @louisguitton, @Ankush-Chander, @tomaarsen, @CaptXiong, @Lord-V15, @anna-droid-beep, @dvsrepo, @clabornd, @dayalstrub-cma, @kavorite, @0dB, @htmartin, @williamsmj, @mattkohl, @vanita5, @Harshgrandeur, @mnowotka, @kjam, @saithetheshwar, @laxatifs, @Dimmu, @ jasonzhangzy1757, @ jake-aft, @ junchen1992, @shyamcody, @chikubee; Aussi à @mihalcea qui mène des travaux de recherche sur la PNL exceptionnels, l'encouragement des merveilleux gens de l'explosion qui développent Spacy, ainsi que le soutien général de Derwen, Inc.