Um embalagem do R para a biblioteca Python de “Processamento de Linguagem Natural de Força Industrial” de https://spacy.io.
Instale o pacote spacyr r:
install.packages( " spacyr " )Do github:
Para instalar o pacote mais recente da fonte, você pode simplesmente executar o seguinte.
remotes :: install_github( " quanteda/spacyr " )Instale o Spacy e os requisitos
Basta correr:
library( spacyr )
spacy_install()Se você deseja instalar uma versão específica, basta adicioná -la ao comando de instalação:
library( spacyr )
spacy_install( version = " apple " )Verifique a ferramenta de versão útil em https://spacy.io/usage e para ver o que está disponível.
(Opcional) Adicione mais modelos de linguagem
Se deixado inalterado, spacy_install() adiciona o modelo "en_core_web_sm" padrão. Você pode adicionar mais modelos de idiomas com spacy_download_langmodel() . Por exemplo, para instalar um modelo de idioma alemão pequeno e eficiente:
spacy_download_langmodel( " de_core_news_sm " )Confira os modelos disponíveis em https://spacy.io/usage/models.
Se você tiver algum problema, poderá experimentar o caminho de instalação manual descrito abaixo.
spacy_install() executa várias tarefas para configurar um ambiente virtual no qual o Spacy está instalado. Os ambientes virtuais são a maneira recomendada de instalar aplicativos Python, pois a falta de controle de conflitos de dependência central (que é executado por Cran no mundo R ) significa que os conflitos entre os pacotes são muito mais comuns. Portanto, cada pacote Python e suas dependências geralmente são instalados em sua própria pasta.
Geralmente, nada disso deve preocupá -lo. No entanto, a experiência mostra que alguns sistemas enfrentam problemas durante a instalação que são difíceis de prever pelos desenvolvedores. Abaixo, portanto, explicamos como você pode executar as etapas em spacy_install() manualmente, para depurar quaisquer problemas que possam ocorrer. Por favor, arquive apenas um problema do Github depois de tentar executar manualmente as etapas, para que possamos fornecer a você mais ajuda direcionada.
Instale o python
Você pode usar sua própria instalação do Python para as etapas abaixo. Por padrão, spacy_install() Downloads e instala uma versão mínima do Python no diretório padrão usado pelo pacote reticulate , por simplicidade. Isso pode ser feito com um único comando:
python_exe <- reticulate :: install_python() A função retorna o caminho para o arquivo executável do Python. Você pode executar isso novamente a qualquer momento para obter esse caminho (a instalação é ignorada se os arquivos já estiverem presentes). Se você preferir usar uma versão específica do Python, pode usar esta função para instalá -la e ela será captada pelo spacyr .
Configure um ambiente virtual
Por padrão, spacyr usa um ambiente chamado "R-Spacyr", localizado em um diretório gerenciado por reticulate . Podemos criá -lo com:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Se isso causar problemas por algum motivo, você pode instalar o ambiente em qualquer local que seja conveniente para você:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Observe que spacyr não conhece a existência desse ambiente, a menos que você indique através da variável de ambiente SPACY_PYTHON . Você pode fazer isso em cada sessão com:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) Ou você o coloca no seu arquivo .Renviron . Você pode usar esta pequena função auxiliar para tornar a mudança permanente:
usethis :: edit_r_environ( scope = " user " ) Também precisamos dizer reticulate que ele deve usar esse ambiente a partir de agora.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Usamos Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") para verificar se SPACY_PYTHON está definido e usamos o padrão de outra forma.
Instale o Spacy
A instalação de spaCy e suas dependências é novamente feita por meio reticulate . Verificamos novamente se Spacy_python estiver definido, caso você tenha escolhido uma pasta não-defensora.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Instale modelos de linguagem espacial
Os modelos de idiomas são instalados da mesma maneira.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Se alguma dessas etapas falhar, registre um problema (depois de verificar se já existir para o seu erro). Você também pode usar os comandos individuais para personalizar sua configuração.
Congratulamo -nos com seus comentários e feedback. Por favor, arquive problemas na página de questões e/ou envie -nos comentários em [email protected] e [email protected].