Ein R -Wrapper in die Python -Bibliothek „industrielle Kraft natürliche Sprache“ von https://spacy.io.
Installieren Sie das Sprayr R -Paket:
install.packages( " spacyr " )Von Github:
Um das neueste Paket von Source zu installieren, können Sie einfach Folgendes ausführen.
remotes :: install_github( " quanteda/spacyr " )Installieren Sie Spacy und Anforderungen
Einfach rennen:
library( spacyr )
spacy_install()Wenn Sie eine bestimmte Version installieren möchten, fügen Sie sie einfach dem Befehl Install hinzu:
library( spacyr )
spacy_install( version = " apple " )Überprüfen Sie das hilfreiche Versionstool unter https://spacy.io/usage und sehen Sie, was verfügbar ist.
(Optional) Weitere Sprachmodelle fügen Sie hinzu
Wenn es unverändert bleibt, fügt spacy_install() das Standardmodell "EN_CORE_WEB_SM" hinzu. Sie können weitere Sprachmodelle mit spacy_download_langmodel() hinzufügen. Zum Beispiel, um ein kleines und effizientes deutsches Sprachmodell zu installieren:
spacy_download_langmodel( " de_core_news_sm " )Schauen Sie sich die verfügbaren Modelle unter https://spacy.io/usage/models an.
Wenn Sie Probleme haben, können Sie den nachstehend beschriebenen manuellen Installationspfad ausprobieren.
spacy_install() führt eine Reihe von Aufgaben aus, um eine virtuelle Umgebung einzurichten, in der Spacy installiert ist. Virtuelle Umgebungen sind die empfohlene Methode zur Installation von Python -Anwendungen, da das Fehlen einer Konfliktkontrolle für zentrale Abhängigkeiten (die von Cran in der R -Welt durchgeführt wird) bedeutet, dass Konflikte zwischen Paketen viel häufiger sind. Daher werden jedes Python -Paket und seine Abhängigkeiten normalerweise in ihrem eigenen Ordner installiert.
Normalerweise sollte Sie nichts davon betreffen. Die Erfahrung zeigt jedoch, dass einige Systeme während der Installation Probleme haben, die von Entwicklern schwer vorhersehen. Im Folgenden erklären wir daher, wie Sie die Schritte in spacy_install() manuell ausführen können, um alle Probleme zu debuggen. Bitte stellen Sie nur ein GitHub -Problem ein, nachdem Sie versucht haben, die Schritte manuell durchzuführen, damit wir Ihnen gezieltere Hilfe leisten können.
Python installieren
Sie können Ihre eigene Installation von Python für die folgenden Schritte verwenden. Standardmäßig lädt und installiert spacy_install() eine minimale Python -Version im Standardverzeichnis, das vom reticulate -Paket für den Einfachheit halber verwendet wird. Dies kann mit einem einzigen Befehl erfolgen:
python_exe <- reticulate :: install_python() Die Funktion gibt den Pfad in die ausführbare Python -Datei zurück. Sie können dies jederzeit erneut ausführen, um diesen Pfad zu erhalten (die Installation wird übersprungen, wenn die Dateien bereits vorhanden sind). Wenn Sie es vorziehen, eine bestimmte Version von Python zu verwenden, können Sie diese Funktion verwenden, um sie zu installieren, und sie wird von spacyr abgeholt.
Richten Sie eine virtuelle Umgebung ein
Standardmäßig verwendet spacyr eine Umgebung namens „R-Spacyr“, die sich in einem von reticulate verwalteten Verzeichnis befindet. Wir können es erstellen mit:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Wenn dies aus irgendeinem Grund zu Problemen führt, können Sie die Umgebung an einem beliebigen Ort installieren, der für Sie so bequem ist:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Beachten Sie, dass spacyr die Existenz dieser Umgebung nicht kennt, es sei denn, Sie erzählen dies durch die Umgebungsvariable SPACY_PYTHON . Sie können dies entweder in jeder Sitzung mit:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) Oder Sie haben es in Ihre .Renviron -Datei gesteckt. Sie können diese kleine Helferfunktion verwenden, um die Änderung dauerhaft zu machen:
usethis :: edit_r_environ( scope = " user " ) Wir müssen auch reticulate mitteilen, dass sie diese Umgebung von nun an nutzen sollte.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Wir verwenden Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") um zu überprüfen, ob SPACY_PYTHON eingestellt ist, und verwenden die Standardeinstellung ansonsten.
Spacing installieren
Die Installation spaCy und seiner Abhängigkeiten wird durch reticulate erneut durchgeführt. Wir überprüfen erneut, ob spacy_python gesetzt ist, falls Sie einen Nicht-Default-Ordner entschieden haben.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Installieren Sie Spacy -Sprachmodelle
Die Sprachmodelle sind auf die gleiche Weise installiert.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Wenn einer dieser Schritte fehlschlägt, stellen Sie bitte ein Problem ein (nachdem Sie überprüft werden, ob es bereits für Ihren Fehler vorliegt). Sie können auch die einzelnen Befehle verwenden, um Ihr Setup anzupassen.
Wir begrüßen Ihre Kommentare und Feedback. Bitte stellen Sie Probleme auf der Seite "Ausgaben" ein und/oder senden Sie uns Kommentare unter [email protected] und [email protected].