Une emballage R à la bibliothèque Python de la Spacy Strength Natural Language Traitement "de https://spacy.io.
Installez le package Spacyr R:
install.packages( " spacyr " )De GitHub:
Pour installer le dernier package de Source, vous pouvez simplement exécuter ce qui suit.
remotes :: install_github( " quanteda/spacyr " )Installer Spacy et les exigences
Courez simplement:
library( spacyr )
spacy_install()Si vous souhaitez installer une version spécifique, ajoutez-la simplement à la commande d'installation:
library( spacyr )
spacy_install( version = " apple " )Consultez l'outil de version utile sur https://spacy.io/usage et pour voir ce qui est disponible.
(Facultatif) Ajouter plus de modèles de langue
Si elle est inchangée, spacy_install() ajoute le modèle par défaut «en_core_web_sm». Vous pouvez ajouter plus de modèles de langage avec spacy_download_langmodel() . Par exemple, pour installer un petit et efficace modèle de langue allemande:
spacy_download_langmodel( " de_core_news_sm " )Consultez les modèles disponibles sur https://spacy.io/usage/Models.
Si vous rencontrez des problèmes, vous pouvez essayer le chemin d'installation manuel décrit ci-dessous.
spacy_install() effectue un certain nombre de tâches pour configurer un environnement virtuel dans lequel Spacy est installé. Les environnements virtuels sont le moyen recommandé d'installer des applications Python, car le manque de contrôle central des conflits de dépendance (qui est effectué par Cran dans le monde R ) signifie que les conflits entre les packages sont beaucoup plus courants. Par conséquent, chaque package Python et ses dépendances sont généralement installés dans leur propre dossier.
Habituellement, rien de tout cela ne devrait vous préoccuper. Cependant, l'expérience montre que certains systèmes rencontrent des problèmes lors de l'installation qui sont difficiles à prévoir par les développeurs. Ci-dessous, nous expliquons donc comment vous pouvez effectuer les étapes de spacy_install() manuellement, pour déboguer les problèmes qui pourraient survenir. Veuillez déposer un problème GitHub après avoir essayé d'exécuter manuellement les étapes, afin que nous puissions vous fournir une aide plus ciblée.
Installer python
Vous pouvez utiliser votre propre installation de Python pour les étapes ci-dessous. Par défaut, spacy_install() télécharge et installe une version python minimale dans le répertoire par défaut utilisé par le package reticulate pour la simplicité. Cela peut être fait avec une seule commande:
python_exe <- reticulate :: install_python() La fonction renvoie le chemin d'accès au fichier exécutable Python. Vous pouvez l'exécuter à nouveau à tout moment pour obtenir ce chemin (l'installation est ignorée si les fichiers sont déjà présents). Si vous préférez utiliser une version spécifique de Python, vous pouvez utiliser cette fonction pour l'installer et elle sera récupérée par spacyr .
Configurer un environnement virtuel
Par défaut, spacyr utilise un environnement appelé «R-Spacyr», qui se trouve dans un répertoire géré par reticulate . Nous pouvons le créer avec:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Si cela cause des problèmes pour une raison quelconque, vous pouvez installer l'environnement dans n'importe quel endroit qui vous convient:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Notez que spacyr ne connaît pas l'existence de cet environnement à moins que vous ne le disiez via la variable d'environnement SPACY_PYTHON . Vous pouvez le faire soit à chaque session avec:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) Ou vous le placez dans votre fichier .Renviron . Vous pouvez utiliser cette petite fonction d'assistance pour rendre le changement permanent:
usethis :: edit_r_environ( scope = " user " ) Nous devons également dire à reticulate qu'il devrait utiliser cet environnement à partir de maintenant.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Nous utilisons Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") pour vérifier si SPACY_PYTHON est défini et utilise la valeur par défaut autrement.
Installer Spacy
L'installation spaCy et de ses dépendances se fait à nouveau par reticulate . Nous vérifions à nouveau si Spacy_python est défini, au cas où vous auriez choisi un dossier non défaut.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Installer des modèles de langage spacy
Les modèles de langue sont installés de la même manière.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Si l'une de ces étapes échoue, veuillez déposer un problème (après avoir vérifié si l'on existe déjà pour votre erreur). Vous pouvez également utiliser les commandes individuelles pour personnaliser votre configuration.
Nous accueillons vos commentaires et commentaires. Veuillez déposer des problèmes sur la page des problèmes et / ou nous envoyer des commentaires à [email protected] et [email protected].