R -r обертка в библиотеку Python Spacy «Промышленная прочность на естественном языке» от https://spacy.io.
Установите пакет Spacyr R:
install.packages( " spacyr " )От GitHub:
Чтобы установить последний пакет из Source, вы можете просто запустить следующее.
remotes :: install_github( " quanteda/spacyr " )Установите Spacy и требования
Просто беги:
library( spacyr )
spacy_install()Если вы хотите установить определенную версию, просто добавьте ее в команду установки:
library( spacyr )
spacy_install( version = " apple " )Проверьте инструмент полезной версии на https://spacy.io/usage и посмотреть, что доступно.
(необязательно) Добавить больше языковых моделей
Если оставить без изменений, spacy_install() добавляет модель по умолчанию «en_core_web_sm». Вы можете добавить больше языковых моделей с помощью spacy_download_langmodel() . Например, чтобы установить небольшую и эффективную модель немецкого языка:
spacy_download_langmodel( " de_core_news_sm " )Проверьте доступные модели по адресу https://spacy.io/usage/models.
Если вы столкнетесь с любыми проблемами, вы можете попробовать путь ручной установки, описанный ниже.
spacy_install() выполняет ряд задач для настройки виртуальной среды, в которой установлен SPACY. Виртуальные среды -это рекомендуемый способ установить приложения Python, так как отсутствие центрального контроля конфликтов зависимостей (которое выполняется CRAN в R -World), что конфликты между пакетами гораздо более распространены. Следовательно, каждый пакет Python и его зависимости обычно устанавливаются в их собственной папке.
Обычно ничто из этого не должно вас беспокоить. Тем не менее, опыт показывает, что некоторые системы сталкиваются с проблемами во время установки, которые трудно предвидеть разработчиками. Ниже, поэтому мы объясняем, как вы можете выполнить шаги в spacy_install() вручную, чтобы отлаживать любые проблемы, которые могут возникнуть. Пожалуйста, подайте проблему GitHub только после того, как вы попытались вручную запустить шаги, чтобы мы могли оказать вам более целенаправленную помощь.
Установите Python
Вы можете использовать свою собственную установку Python для шагов ниже. По умолчанию, spacy_install() загружает и устанавливает минимальную версию Python в каталоге по умолчанию, используемому пакетом reticulate для простоты. Это можно сделать с помощью одной команды:
python_exe <- reticulate :: install_python() Функция возвращает путь в исполняемый файл Python. Вы можете запустить это снова в любое время, чтобы получить этот путь (установка пропускается, если файлы уже присутствуют). Если вы предпочитаете использовать определенную версию Python, вы можете использовать эту функцию для ее установки, и она будет подхвачена spacyr .
Установите виртуальную среду
По умолчанию spacyr использует среду, называемую «r-spacyr», которая расположена в каталоге, управляемом reticulate . Мы можем создать это с:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Если это вызывает проблемы по какой -то причине, вы можете установить среду в любом месте, которое удобно для вас, как:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Обратите внимание, что spacyr не знает о существовании этой среды, если вы не сообщите ее через переменную среды SPACY_PYTHON . Вы можете сделать это либо в каждом сеансе с:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) Или вы положите его в свой файл .Renviron . Вы можете использовать эту маленькую вспомогательную функцию, чтобы сделать изменение постоянным:
usethis :: edit_r_environ( scope = " user " ) Мы также должны сообщить reticulate , что она должна использовать эту среду с этого момента.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Мы используем Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") чтобы проверить, установлен ли SPACY_PYTHON , и использует по умолчанию в противном случае.
Установите Spacy
Установка spaCy и его зависимости снова выполняется с помощью reticulate . Мы еще раз проверяем, установлен ли Spacy_python, если вы выбрали папку без декорации.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Установите модели языка Spacy
Языковые модели установлены так же.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Если какой -либо из этих шагов не удастся, пожалуйста, подайте проблему (после проверки, если он уже существует для вашей ошибки). Вы также можете использовать отдельные команды для настройки вашей настройки.
Мы приветствуем ваши комментарии и отзывы. Пожалуйста, подайте вопросы на странице проблем и/или отправьте нам комментарии по адресу [email protected] и [email protected].