Pytextrank -это внедрение Python Textrank как расширение трубопровода Spacy, для работы на основе графиков естественного языка-и связанных с ними практик графов знаний. Это включает в себя семейство алгоритмов текстовых графов :
Популярные варианты использования этой библиотеки включают в себя:
Смотрите нашу полную документацию по адресу: https://derwen.ai/docs/ptr/
Смотрите раздел «Начало работы» онлайн -документации.
Установка из PYPI:
python3 -m pip install pytextrank
python3 -m spacy download en_core_web_sm
Если вы работаете непосредственно из этого репо, обязательно установите зависимости:
python3 -m pip install -r requirements.txt
В качестве альтернативы, чтобы установить зависимости, используя conda :
conda env create -f environment.yml
conda activate pytextrank
Затем использовать библиотеку с помощью простого варианта использования:
import spacy
import pytextrank
# example text
text = "Compatibility of systems of linear constraints over the set of natural numbers. Criteria of compatibility of a system of linear Diophantine equations, strict inequations, and nonstrict inequations are considered. Upper bounds for components of a minimal set of solutions and algorithms of construction of minimal generating sets of solutions for all types of systems are given. These criteria and the corresponding algorithms for constructing a minimal supporting set of solutions can be used in solving all the considered types systems and systems of mixed types."
# load a spaCy model, depending on language, scale, etc.
nlp = spacy . load ( "en_core_web_sm" )
# add PyTextRank to the spaCy pipeline
nlp . add_pipe ( "textrank" )
doc = nlp ( text )
# examine the top-ranked phrases in the document
for phrase in doc . _ . phrases :
print ( phrase . text )
print ( phrase . rank , phrase . count )
print ( phrase . chunks ) См. Учебные записные книжки в examples подканалиста для образца кода и шаблонов для использования при интеграции PytextTank с соответствующими библиотеками в Python: https://derwen.ai/docs/ptr/tutorial/
Мы приветствуем, как люди участвуют в качестве участников этого проекта с открытым исходным кодом!
Для получения подробных инструкций см.: Appling.md
Вместо этого просто установите из PYPI или используйте Conda.
Чтобы настроить среду сборки локально, см. Раздел «Инструкции по сборке» онлайн -документации.
Вообще говоря, основное количество выпуска Pytextrank будет отслеживать с основным номером выпуска соответствующей версии spaCy .
Смотрите: Changelog.md
Исходный код для Pytextrank плюс его логотип, документация и примеры имеют лицензию MIT, которая кратко и упрощает использование в коммерческих приложениях.
Все материалы здесь являются Copyright © 2016-2024 Derwen, Inc.
Пожалуйста, используйте следующую запись Bibtex для цитирования Pytextrank , если вы используете его в своем исследовании или программном обеспечении:
@software { PyTextRank ,
author = { Paco Nathan } ,
title = { {PyTextRank, a Python implementation of TextRank for phrase extraction and summarization of text documents} } ,
year = 2016 ,
publisher = { Derwen } ,
doi = { 10.5281/zenodo.4637885 } ,
url = { https://github.com/DerwenAI/pytextrank }
}Цитаты полезны для дальнейшей разработки и обслуживания этой библиотеки. Например, см. Наши цитаты, указанные в Google Scholar.
Большое спасибо нашим спонсорам с открытым исходным кодом; И нашим участникам: @ceteri, @louisguitton, @ankush-chander, @tomaarsen, @captxiong, @lord-v15, @anna-drod-beep, @dvsrepo, @clabornd, @dayalstrub-cma, @kavorite, @0db, @htmartin, @williamsmj, @mattkohl, @wanitkhl, @wanitkohl, @wanitkh @Harshgrandeur, @mnowotka, @kjam, @saithejeshwar, @laxatives, @dimmu, @jasonzhangzy1757, @jake-aft, @junchen1992, @shyamcody, @chikubee; Также в @mihalcea, который возглавляет выдающуюся исследовательскую работу НЛП, поощрение со стороны замечательных людей по взрыву, которые разрабатывают Spacy, а также общую поддержку от Derwen, Inc.