Perpustakaan Rpacy "Kekuatan Industri Pengolahan Bahasa Alami" Spacy dari https://spacy.io.
Instal Paket Spacyr :
install.packages( " spacyr " )Dari GitHub:
Untuk menginstal paket terbaru dari Sumber, Anda dapat dengan cukup menjalankan yang berikut.
remotes :: install_github( " quanteda/spacyr " )Pasang spacy dan persyaratan
Cukup jalankan:
library( spacyr )
spacy_install()Jika Anda ingin menginstal versi tertentu, cukup tambahkan ke perintah instal:
library( spacyr )
spacy_install( version = " apple " )Periksa alat versi yang bermanfaat di https://spacy.io/usage dan untuk melihat apa yang tersedia.
(Opsional) Tambahkan lebih banyak model bahasa
Jika dibiarkan tidak berubah, spacy_install() menambahkan model "en_core_web_sm" default. Anda dapat menambahkan lebih banyak model bahasa dengan spacy_download_langmodel() . Misalnya, untuk memasang model bahasa Jerman yang kecil dan efisien:
spacy_download_langmodel( " de_core_news_sm " )Lihat model yang tersedia di https://spacy.io/usage/models.
Jika Anda mengalami masalah apa pun, Anda dapat mencoba jalur instalasi manual yang dijelaskan di bawah ini.
spacy_install() melakukan sejumlah tugas untuk mengatur lingkungan virtual di mana spacy diinstal. Lingkungan virtual adalah cara yang disarankan untuk menginstal aplikasi Python, karena kurangnya kontrol konflik ketergantungan pusat (yang dilakukan oleh Cran di R ) berarti bahwa konflik antar paket jauh lebih umum. Oleh karena itu setiap paket Python dan dependensinya biasanya dipasang di folder mereka sendiri.
Biasanya, semua ini tidak menjadi perhatian Anda. Namun, pengalaman menunjukkan bahwa beberapa sistem mengalami masalah selama instalasi yang sulit diperkirakan oleh pengembang. Di bawah ini, kami menjelaskan bagaimana Anda dapat melakukan langkah -langkah di spacy_install() secara manual, untuk men -debug masalah apa pun yang mungkin terjadi. Harap hanya mengajukan masalah github setelah Anda mencoba menjalankan langkah -langkah secara manual, sehingga kami dapat memberi Anda bantuan yang lebih bertarget.
Instal Python
Anda dapat menggunakan instalasi Python Anda sendiri untuk langkah -langkah di bawah ini. Secara default, spacy_install() mengunduh dan menginstal versi python minimal di direktori default yang digunakan oleh paket reticulate untuk kesederhanaan. Ini bisa dilakukan dengan satu perintah:
python_exe <- reticulate :: install_python() Fungsi mengembalikan jalur ke file yang dapat dieksekusi Python. Anda dapat menjalankan ini lagi kapan saja untuk mendapatkan jalur itu (instalasi dilewati jika file sudah ada). Jika Anda lebih suka menggunakan versi python tertentu, Anda dapat menggunakan fungsi ini untuk menginstalnya dan itu akan diambil oleh spacyr .
Siapkan lingkungan virtual
Secara default, spacyr menggunakan lingkungan yang disebut "R-SpacyR", yang terletak di direktori yang dikelola oleh reticulate . Kita dapat membuatnya dengan:
reticulate :: virtualenv_create( " r-spacyr " , python = python_exe )Jika ini menyebabkan masalah karena suatu alasan, Anda dapat menginstal lingkungan di lokasi mana pun yang nyaman bagi Anda seperti itu:
reticulate :: virtualenv_create( " path/to/directory " , python = python_exe ) Perhatikan, bahwa spacyr tidak tahu keberadaan lingkungan ini kecuali Anda mengatakannya melalui variabel lingkungan SPACY_PYTHON . Anda dapat melakukannya di setiap sesi dengan:
Sys.setenv( SPACY_PYTHON = " path/to/directory " ) Atau Anda memasukkannya ke dalam file .Renviron Anda. Anda dapat menggunakan fungsi pembantu kecil ini untuk membuat perubahan permanen:
usethis :: edit_r_environ( scope = " user " ) Kita juga perlu memberi tahu reticulate bahwa itu harus menggunakan lingkungan ini mulai sekarang.
reticulate :: use_virtualenv(Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " )) Kami menggunakan Sys.getenv("SPACY_PYTHON", unset = "r-spacyr") untuk memeriksa apakah SPACY_PYTHON diatur dan menggunakan default sebaliknya.
Instal Spacy
Menginstal spaCy dan ketergantungannya dilakukan lagi melalui reticulate . Kami memeriksa lagi apakah spacy_python diatur, jika Anda memilih folder non-default.
reticulate :: py_install( " spacy " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Instal Model Bahasa Spacy
Model bahasa dipasang dengan cara yang sama.
reticulate :: py_install( " en_core_web_sm " , envname = Sys.getenv( " SPACY_PYTHON " , unset = " r-spacyr " ))Jika salah satu dari langkah -langkah itu gagal, silakan ajukan masalah (setelah memeriksa apakah ada yang sudah ada untuk kesalahan Anda). Anda juga dapat menggunakan perintah individual untuk menyesuaikan pengaturan Anda.
Kami menyambut komentar dan umpan balik Anda. Silakan ajukan masalah di halaman masalah, dan/atau kirim komentar kepada kami di [email protected] dan [email protected].