(Bekerja sedang berlangsung!)
Natural Language Processing (NLP) telah membuat kemajuan besar dalam beberapa tahun terakhir karena keberhasilan teknik modern yang didasarkan pada pembelajaran mendalam. Dengan munculnya popularitas NLP dan ketersediaan berbagai bentuk data skala besar, sekarang bahkan lebih penting untuk memahami cara kerja dalam teknik dan konsep NLP, dari prinsip pertama, karena mereka menemukan jalan mereka ke penggunaan dan aplikasi dunia nyata yang mempengaruhi masyarakat luas. Membangun intuisi dan memiliki pemahaman konsep yang kuat keduanya penting untuk menghasilkan teknik inovatif, meningkatkan penelitian, dan membangun teknologi AI dan NLP yang berpusat pada manusia.
Kami memperkenalkan seri baru yang disebut Fundamentals of NLP di mana kami bertujuan untuk mengajarkan tentang teknik dan konsep NLP penting mulai dari prinsip pertama. Kami akan memperkenalkan aspek teoritis dan motivasi setiap konsep yang dibahas di seluruh seri. Kemudian kami akan mendapatkan pengalaman langsung dengan menggunakan metode bootstrap, alat standar industri, dan perpustakaan open-source lainnya untuk mengimplementasikan berbagai teknik. Sepanjang jalan, kami juga akan membahas praktik terbaik, berbagi referensi penting, menunjukkan kesalahan umum untuk dihindari saat melatih dan membangun model NLP, dan mendiskusikan apa yang ada di depan.
Bergabunglah dengan komunitas Slack kami untuk menemukan lebih banyak tentang ini dan proyek yang sedang berlangsung lainnya. Jangan ragu untuk menghubungi saya di Twitter untuk undangan ke grup Slack kami.
Bab 1: Tokenisasi, Lemmatisasi, Bintang, dan Segmentasi Kalimat - Colab Notebook, Versi Web
nlp_fundamentals utama. Masalah dengan tag good first issue adalah tugas yang baik untuk memulai.