Daftar sumber daya pemula yang dikuratori dalam pemrosesan bahasa alami
Pemeliharaan
Dibya Chakravorty
Kontribusi
Jangan ragu untuk mengirim permintaan tarik, atau email saya ([email protected])
Bagaimana daftar ini dimulai
Pada 10 November 2016, pengguna Hacker News (HN) Aarohmankad meminta komunitas HN untuk saran tentang sumber daya NLP pemula. Ini meminta utas HN menjadi populer dan tinggal di halaman depan untuk beberapa waktu. Pada saat ini, ia mengumpulkan banyak saran yang dihasilkan masyarakat tentang sumber daya NLP pemula. Daftar ini adalah upaya untuk merangkum diskusi ini ke dalam daftar sumber daya yang koheren. Saya juga menulis posting blog tentang ini.
Daftar isi
- Buku
- MOOCS
- Video YouTube
- Kursus universitas online
- Paket untuk dimainkan
- Makalah Akademik
- Belajar dengan melakukan
- Proyek Sumber Terbuka
- Ide yang menyenangkan
- Lebah
- Grup pengguna
- Panduan Lainnya
Buku
- Pemrosesan Bicara dan Bahasa: Buku teks klasik dan standar di NLP. Draf pra publikasi edisi ke -3 tersedia di sini.
- Pemrosesan Bahasa Alami dengan Python: Buku Berorientasi Aplikasi. Contohnya adalah dalam Python (NLTK). Versi online gratis di sini.
- Taming Teks: Buku Berorientasi Aplikasi. Contohnya ada di Java.
- Yayasan Pemrosesan Bahasa Alami Statistik: Teks Klasik tentang Statistik NLP. Masuk jauh ke implementasi parser, tagger dll.
- Buku Pegangan Pemrosesan Bahasa Alami: Perlakuan lengkap NLP yang dimulai dari akar historis dan berakhir dengan metode modern NLP.
- Terjemahan Mesin Statistik: Pelajari cara membuat layanan seperti Google Translate
- Pengantar Pengambilan Informasi: Pelajari mur dan baut layanan seperti Google Search dan Google News (pencarian, klasifikasi teks, pengelompokan dll.)
- Analisis Prolog dan Bahasa Alami: Menerapkan Algortihms NLP dalam Prolog.
MOOCS
- Kursus Coursera yang ditawarkan oleh University of Michigan: Kursus pengantar yang mencakup semua bahan prasyarat. Bahasa pemrograman yang disukai adalah Python.
- Kursus Coursera Dicontinued yang ditawarkan oleh Comlumbia University, tersedia di Torrents Academic: Teori dan Kursus Berorientasi Konsep. Hanya bahan kursus yang tersedia saat ini.
Video YouTube
- Seri video oleh Jurafsky dan Martin: Jurafsky dan Martin keduanya adalah profesor di Stanford, dan mereka telah menulis beberapa buku teks klasik di NLP.
- Stanford CS224D: Pembelajaran mendalam di NLP: Applicatin of Deep Learning di NLP
- NLP dengan Python dan NLTK: Seri video berorientasi aplikasi menggunakan Python dan NLTK.
Kursus universitas online
- Kursus Penerjemahan Mesin di University of Pennsylvania
Paket untuk dimainkan
- NLTK: Perpustakaan NLP paling populer di Python. Dokumentasi yang sangat baik dalam bentuk buku/versi online gratis. Kuat dan dapat diperluas.
- Stanford Corenlp: Perpustakaan NLP yang kaya dan fitur, ditulis dalam Java. Demo online tersedia di sini.
- Spacy: Perpustakaan NLP yang muncul di Python. Cepat dan canggih. Mencoba mempertahankan API yang seragam saat menerapkan algoritma canggih. Mereka memiliki blog dan demo online.
- Apache Tika: Menawarkan antarmuka terpadu untuk mengekstraksi data teks dan data meta dari berbagai format file (PPT, PDF dll.) Dan analisis.
Makalah Akademik
- Pembelajaran mendalam di NLP: repo github yang mengumpulkan makalah tentang pembelajaran mendalam di NLP.
Belajar dengan melakukan
Seringkali cara terbaik untuk belajar adalah berkontribusi pada proyek NLP open source yang ada atau menerapkan ide yang menyenangkan.
Proyek Sumber Terbuka
- Betty: Betty adalah proyek open source dengan penggunaan kehidupan nyata dan pertimbangan NLP praktis, dan sedang mencari pengelola baru.
Ide yang menyenangkan
- Fiksi Fiksi Interaktif/Parser: Sebuah video game di mana interaksi pemain terutama melibatkan teks. Dengarkan podcast Floss yang menyala ini tentang topik ini.
Lebah
- IBM Watson Cloud: Dari pembuat IBM Watson. Ini memungkinkan Anda mengintegrasikan fungsionalitas NLP di aplikasi Anda melalui API. Ada uji coba gratis/gratis.
Grup pengguna
- ACM Bunga Khusus di AI: Jika Anda mendambakan beberapa kontak manusia tatap muka.
Panduan Lainnya
- Pertanyaan quora tentang cara masuk ke nlp
- Awesome-NLP di GitHub: Repo GitHub yang berisi daftar sumber daya NLP yang dikuratori.