nlp in practice
1.0.0
Gunakan NLP ini, penambangan teks, dan sampel kode pembelajaran mesin dan alat untuk menyelesaikan masalah data teks dunia nyata.
Tautan di kolom pertama membawa Anda ke subfolder/repositori dengan kode sumber.
| Tugas | Artikel terkait | Jenis Sumber | Keterangan |
|---|---|---|---|
| Ekstraksi frasa skala besar | Artikel Frase2Vec | skrip Python | Ekstrak frasa untuk sejumlah besar data menggunakan pyspark. Anotasi teks menggunakan frasa ini atau gunakan frasa untuk tugas hilir lainnya. |
| Cloud Word untuk Jupyter Notebook dan Aplikasi Web Python | Artikel Word_Cloud | Script Python + Notebook | Visualisasikan kata kunci atas menggunakan jumlah kata atau tfidf |
| Gensim word2vec (dengan dataset) | Artikel Word2Vec | buku catatan | Cara bekerja dengan benar dengan word2vec untuk mendapatkan hasil yang diinginkan |
| Membaca file dan jumlah kata dengan Spark | Artikel Spark | skrip Python | Cara membaca file dari berbagai format menggunakan pyspark dengan contoh word count |
| Mengekstraksi kata kunci dengan TF-IDF dan SKLEARN (dengan dataset) | Artikel TFIDF | buku catatan | Cara mengekstrak kata kunci yang menarik dari teks menggunakan TF-IDF dan SKLEARN Python |
| Preprocessing teks | Artikel preprocessing teks | buku catatan | Beberapa cuplikan kode tentang cara melakukan preprocessing teks. Termasuk stemming, penghapusan kebisingan, lemmatisasi dan penghapusan kata berhenti. |
| TFIDFTRANSFORMER vs. tfidfvectorizer | TFIDFTRANSFORMER DAN TFIDFVECTORIZER Penggunaan Artikel | buku catatan | Cara menggunakan tfidftransformer dan tfidfvectorizer dengan benar dan perbedaan antara keduanya dan apa yang akan digunakan kapan. |
| Mengakses embeddings kata pra-terlatih dengan gensim | Artikel kata embeddings kata pra-terlatih | buku catatan | Cara mengakses sarung tangan pra-terlatih dan embeddings word2vec menggunakan gensim dan contoh bagaimana embedding ini dapat dimanfaatkan untuk kesamaan teks |
| Klasifikasi Teks di Python (dengan Dataset Berita) | Klasifikasi Teks dengan Artikel Regresi Logistik | buku catatan | Mulailah dengan klasifikasi teks. Pelajari cara membangun dan mengevaluasi classifier teks untuk klasifikasi berita menggunakan regresi logistik. |
| Contoh Penggunaan CountVectorizer | Bagaimana cara menggunakan CountVectorizer dengan benar? Artikel tampilan mendalam | buku catatan | Pelajari cara memaksimalkan penggunaan countvectorizer sehingga Anda tidak hanya menghitung jumlah kata, tetapi juga preprocessing data teks Anda dengan tepat serta mengekstraksi fitur tambahan dari dataset teks Anda. |
| Contoh HashingVectorizer | HashingVectorizer Vs. Artikel CountVectorizer | buku catatan | Pelajari perbedaan antara hashingVectorizer dan countvectorizer dan kapan menggunakan yang. |
| CBOW vs. Skipgram | Word2Vec: Perbandingan antara artikel CBOW, SKIPGRAM & SKIPGRAMSI | buku catatan | Perbandingan cepat dari tiga arsitektur embeddings. |
Repositori ini dikelola oleh Kavita Ganesan. Terhubung dengan saya di LinkedIn atau Twitter.