Un envoltorio R de la biblioteca de Python Spacy "Fuerza natural del lenguaje natural" de https://spacy.io.
Instale el paquete SpacyR R:
install.packages( " spacyr " )De Github:
Para instalar el último paquete desde la fuente, simplemente puede ejecutar lo siguiente.
remotes :: install_github( " quanteda/spacyr " )Instalar Spacy y requisitos
Simplemente ejecute:
library( spacyr )
spacy_install()Si desea instalar una versión específica, simplemente agréguela al comando Instalar:
library( spacyr )
spacy_install( version = " apple " )Consulte la herramienta de versión útil en https://spacy.io/usage y ver lo que está disponible.
(opcional) Agregue más modelos de idioma
Si se deja sin cambios, spacy_install() agrega el modelo predeterminado "EN_CORE_WEB_SM". Puede agregar más modelos de idioma con spacy_download_langmodel() . Por ejemplo, para instalar un modelo de idioma alemán pequeño y eficiente:
spacy_download_langmodel( " de_core_news_sm " )Consulte los modelos disponibles en https://spacy.io/usage/models.
Si se encuentra con algún problema, puede probar la ruta de instalación manual que se describe a continuación.
spacy_install() realiza una serie de tareas para configurar un entorno virtual en el que se instala Spacy. Los entornos virtuales son la forma recomendada de instalar aplicaciones de Python, ya que la falta de control de conflictos de dependencia central (que realiza CRAN en el mundo R ) significa que los conflictos entre los paquetes son mucho más comunes. Por lo tanto, cada paquete de Python y sus dependencias generalmente se instalan en su propia carpeta.
Por lo general, nada de esto debería preocuparse. Sin embargo, la experiencia muestra que algunos sistemas tienen problemas durante la instalación que son difíciles de prever por los desarrolladores. A continuación, explicamos cómo puede realizar los pasos en spacy_install() manualmente, para depurar cualquier problema que pueda ocurrir. Solo presente un problema de GitHub después de haber intentado ejecutar manualmente a través de los pasos, para que podamos brindarle una ayuda más específica.
Instalar python
Puede usar su propia instalación de Python para los pasos a continuación. Por defecto, spacy_install() descarga e instala una versión mínima de Python en el directorio predeterminado utilizado por el paquete de reticulate para simplificar. Esto se puede hacer con un solo comando:
python_exe <- reticulate :: install_python() La función devuelve la ruta al archivo ejecutable de Python. Puede ejecutar esto nuevamente en cualquier momento para obtener esa ruta (la instalación se omite si los archivos ya están presentes). Si prefiere usar una versión específica de Python, puede usar esta función para instalarla y spacyr la recogerá.
Configurar un entorno virtual
Por defecto, spacyr utiliza un entorno llamado "R-SpacyR", que se encuentra en un directorio administrado por reticulate . Podemos crearlo con:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Si esto causa problemas por algún motivo, puede instalar el entorno en cualquier ubicación que sea conveniente para que le guste:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Tenga en cuenta que spacyr no sabe de la existencia de este entorno a menos que lo cuente a través de la variable de entorno SPACY_PYTHON . Puedes hacer eso en cada sesión con:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) O lo pones en tu archivo .Renviron . Puede usar esta pequeña función de ayuda para hacer que el cambio sea permanente:
usethis :: edit_r_environ( scope = " user " ) También debemos decirle reticulate que debe usar este entorno a partir de ahora.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Usamos Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") para verificar si SPACY_PYTHON está configurado y use el valor predeterminado de otra manera.
Instalar Spacy
La instalación de spaCy y sus dependencias se realiza nuevamente a través de reticulate . Verificamos nuevamente si SPACY_PYTHON está configurado, en caso de que elija una carpeta no definitiva.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Instalar modelos de lenguaje espacial
Los modelos de idioma se instalan de la misma manera.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Si alguno de esos pasos falla, presente un problema (después de verificar si ya existe para su error). También puede usar los comandos individuales para personalizar su configuración.
Agradecemos sus comentarios y comentarios. POR FAVOR PRESENTA PROBLEMAS EN LA PÁGINA DE CUESTROS y/o envíenos comentarios a [email protected] y [email protected].