
- Untuk tugas sains data lengkap, materi, dll. Silakan periksa repositori ilmu data.
- Untuk algoritma pembelajaran mesin , silakan periksa repositori pembelajaran mesin.
- Untuk algoritma pembelajaran yang mendalam, silakan periksa repositori pembelajaran yang mendalam.
- Untuk visi komputer , silakan periksa repositori visi komputer.
Folder dengan semua bahan untuk tugas/domain tertentu
Teknik NLP modern dari jaringan saraf berulang dan embeddings kata ke transformer dan perhatian diri. Mencakup topik terapan seperti pertanyaan menjawab dan menghasilkan teks.
Ini adalah perpanjangan dari kursus pemrosesan bahasa alami (ML untuk) yang diajarkan di Sekolah Analisis Data Yandex (YSDA). Untuk saat ini, hanya sebagian dari topik yang mungkin dibahas di sini.
Kursus ini akan mencakup teknologi mesin pencari, yang memainkan peran penting dalam aplikasi penambangan data apa pun yang melibatkan data teks karena dua alasan. Pertama, sementara data mentah mungkin besar untuk masalah tertentu, seringkali merupakan subset yang relatif kecil dari data yang relevan, dan mesin pencari adalah alat penting untuk dengan cepat menemukan sebagian kecil dari data teks yang relevan dalam pengumpulan teks yang besar. Kedua, mesin pencari diperlukan untuk membantu analis menginterpretasikan pola apa pun yang ditemukan dalam data dengan memungkinkan mereka untuk memeriksa data teks asli yang relevan untuk memahami pola yang ditemukan. Anda akan mempelajari konsep dasar, prinsip, dan teknik utama dalam pengambilan teks, yang merupakan ilmu mendasar dari mesin pencari.
Repositori resmi untuk 'Pemrosesan Bahasa Alami Praktis' oleh O'Reilly Media
Tersedia sebagai buku: NLP di Python - Panduan QuickStart
| Judul | Keterangan |
|---|---|
| ACL | di Vimeo |
| [Stanford CS224N: Pemrosesan bahasa alami dengan pembelajaran yang mendalam | Musim Dingin 2021] (https://www.youtube.com/playlist?list=PloromVodv4rosh4v6133s9lfprhjembmj) |
| Natural Language Processing (NLP) Zero to Hero | oleh TensorFlow |
| Zero to Hero: NLP dengan TensorFlow dan Keras (GDG Sofia Meetup) | |
| Pemrosesan bahasa alami | Konten ini didasarkan pada kelas Machine Learning University (MLU) yang dipercepat kelas pemrosesan bahasa alami. Slide, notebook, dan set data tersedia di GitHub |
Saya seorang ilmuwan riset di Google. Saya menulis blog tentang pemrosesan bahasa alami dan pembelajaran mesin.
Daftar blog teknik yang dikuratori
Gradien adalah organisasi dengan misi memudahkan siapa pun untuk belajar tentang AI dan memfasilitasi diskusi dalam komunitas AI. Kami didirikan pada 2017 oleh sekelompok siswa dan peneliti di Stanford AI Lab.
| Judul | Keterangan |
|---|---|
| Contoh pembelajaran mendalam nvidia untuk inti tensor - pemrosesan bahasa alami | Contoh pembelajaran mendalam |
| Pemrosesan bahasa alami dengan transformer | Buku catatan dan materi untuk buku O'Reilly "Pemrosesan Bahasa Alami dengan Transformers" |
| Referensi NLP yang luar biasa | Daftar sumber daya yang dikuratori yang didedikasikan untuk distilasi pengetahuan, sistem rekomendasi, terutama pemrosesan bahasa alami (NLP) |
| NLP - Tutorial | |
| Tutorial Proses Bahasa Alami | |
| NLP dengan Python | Scikit-learn, nltk, spacy, gensim, textblob dan banyak lagi ... |
| NLP dan Data Science Github Repository Spotlight | Sorotan harian dari beberapa repositori NLP dan Ilmu Data yang diremehkan. |
| NLP 101: Repositori sumber daya untuk pembelajaran yang mendalam dan pemrosesan bahasa alami | Dokumen ini dirancang untuk mereka yang memiliki antusiasme untuk belajar mendalam dalam pemrosesan bahasa alami. Jika ada rekomendasi atau saran yang baik, saya akan mencoba menambahkan lebih banyak. |
| NLP-Progress | Repositori untuk melacak kemajuan dalam pemrosesan bahasa alami (NLP), termasuk set data dan canggih saat ini untuk tugas NLP yang paling umum. |
| Wajah memeluk | Repo publik untuk posting blog HF |
| Allennlp | Perpustakaan penelitian NLP open-source, dibangun di atas Pytorch. Allenai.org |
Perpustakaan NLP, kerangka kerja, modul
| Judul | Keterangan |
|---|---|
| Natural Language Toolkit (NLTK) | NLTK - The Natural Language Toolkit - adalah serangkaian modul python open source, set data, dan tutorial yang mendukung penelitian dan pengembangan dalam pemrosesan bahasa alami. |
| bakat |
Kerangka kerja yang sangat sederhana untuk pemrosesan bahasa alami canggih (NLP). Bakat adalah: |
| tekstasi | textacy adalah perpustakaan Python untuk melakukan berbagai tugas pemrosesan bahasa alami (NLP), yang dibangun di atas perpustakaan spacy berkinerja tinggi. Dengan fundamental --- tokenisasi, penandaan bagian-dari-pidato, penguraian ketergantungan, dll. --- didelegasikan ke perpustakaan lain, textacy berfokus terutama pada tugas-tugas yang datang sebelumnya dan mengikuti setelahnya. |
| Allennlp | Perpustakaan Penelitian NLP, dibangun di atas Pytorch, untuk mengembangkan model pembelajaran mendalam yang canggih pada berbagai tugas linguistik. |
| Nlpgym | NLPGYM adalah toolkit untuk menjembatani kesenjangan antara aplikasi RL dan NLP. Ini bertujuan untuk memfasilitasi penelitian dan pembandingan aplikasi DRL pada tugas pemrosesan bahasa alami. Toolkit menyediakan lingkungan interaktif untuk tugas NLP standar seperti penandaan urutan, penjawab pertanyaan, dan klasifikasi urutan. |
| Gensim |
| Judul | Keterangan |
|---|---|
| Tutorial NLP | Tutorial pemrosesan bahasa alami untuk peneliti pembelajaran mendalam |
| Pemrosesan bahasa alami dalam tutorial Python | Membandingkan komedian berdiri menggunakan pemrosesan bahasa alami |
? 100 makalah NLP yang harus dibaca
? Sci-hub (kertas)
? Stanford, Jadwal Seminar NLP
? CS224N: Pemrosesan bahasa alami dengan pembelajaran yang mendalam
? CIS 700-008 - Fiksi Interaktif dan Pembuatan Teks
? Harvard NLP
? Transformator yang diilustrasikan
Menerapkan jaringan neural aliran perhatian dua arah sebagai garis dasar pada skuad, meningkatkan implementasi model Chris Chute, menambahkan input karakter-kata seperti yang dijelaskan dalam makalah asli dan meningkatkan kode GautiERDMNS.