قائمة منسقة من موارد المبتدئين في معالجة اللغة الطبيعية
نقير
ديبيا تشاكرافورتي
مساهمات
لا تتردد في إرسال طلبات السحب ، أو مراسلتي عبر البريد الإلكتروني ([email protected])
كيف بدأت هذه القائمة
في 10 نوفمبر 2016 ، طلب مستخدم أخبار Hacker (HN) Aarohmankad من مجتمع HN اقتراحات بشأن موارد المبتدئين NLP. أصبح هذا الموضوع ASS HN شائعًا وبقي في الصفحة الأولى لبعض الوقت. في هذا الوقت ، جمعت الكثير من الاقتراحات التي تم إنشاؤها للمجتمع حول موارد المبتدئين NLP. هذه القائمة هي محاولة لتلخيص هذه المناقشة في قائمة متماسكة من الموارد. كما كتبت منشور مدونة على هذا.
جدول المحتويات
- كتب
- MOOCs
- مقاطع فيديو يوتيوب
- دورات الجامعة على الإنترنت
- حزم للعب مع
- الأوراق الأكاديمية
- التعلم من خلال العمل
- مشاريع مفتوحة المصدر
- أفكار ممتعة
- واجهات برمجة التطبيقات
- مجموعات المستخدمين
- أدلة أخرى
كتب
- معالجة الكلام واللغة: كتاب مدرسي كلاسيكي ومعتاد في NLP. مسودة نشر ما قبل النشر للطبعة الثالثة المتاحة هنا.
- معالجة اللغة الطبيعية مع بيثون: كتاب موجه نحو التطبيق. أمثلة في Python (NLTK). نسخة مجانية عبر الإنترنت هنا.
- ترويض النص: كتاب موجه نحو التطبيق. أمثلة في جافا.
- أسس معالجة اللغة الطبيعية الإحصائية: النص الكلاسيكي على NLP الإحصائي. يعمق في تنفيذ المحللين والعلامات وما إلى ذلك.
- كتيب معالجة اللغة الطبيعية: علاج كامل لـ NLP يبدأ من الجذور التاريخية وينتهي بالطرق الحديثة لـ NLP.
- ترجمة الآلة الإحصائية: تعلم كيفية تقديم خدمة مثل Google Translate
- مقدمة لاسترجاع المعلومات: تعلم المكسرات والخدمات من الخدمات مثل Google Search و Google News (البحث ، تصنيف النص ، التجميع وما إلى ذلك)
- تحليل المقدمة واللغة الطبيعية: تنفيذ NLP Algortihms في Prolog.
MOOCs
- دورة Coursera التي تقدمها جامعة ميشيغان: دورة تمهيدية تغطي جميع المواد المسبقة. لغة البرمجة المفضلة هي بيثون.
- دورة Coursera DiContinued التي تقدمها جامعة Comlumbia ، متوفرة على السيول الأكاديمية: النظرية والدورة الموجهة نحو المفهوم. فقط مواد الدورة التدريبية متوفرة في هذه المرحلة.
مقاطع فيديو يوتيوب
- سلسلة الفيديو التي كتبها Jurafsky و Martin: Jurafsky و Martin كلاهما أساتذة في ستانفورد ، وقد كتبوا كتب مدرسية كلاسيكية متعددة على NLP.
- Stanford CS224D: التعلم العميق في NLP: تطبيق التعلم العميق في NLP
- NLP مع Python و NLTK: سلسلة الفيديو الموجهة للتطبيق باستخدام Python و NLTK.
دورات الجامعة على الإنترنت
- دورة الترجمة الآلية في جامعة بنسلفانيا
حزم للعب مع
- NLTK: مكتبة NLP الأكثر شعبية في Python. وثائق ممتازة في شكل كتاب/نسخة مجانية عبر الإنترنت. قوي وقابل للتمديد.
- Stanford Corenlp: Fast and Meature Rich NLP Library ، مكتوبة في Java. العرض التوضيحي عبر الإنترنت متاح هنا.
- Spacy: مكتبة أخرى ناشئة NLP في Python. بسرعة وحالة الفن. يحاول الحفاظ على واجهة برمجة تطبيقات موحدة أثناء تنفيذ خوارزميات الحالة الفنية. لديهم مدونة وتوضيح عبر الإنترنت.
- Apache Tika: يقدم واجهة موحدة لاستخراج بيانات النص وبيانات التعريف من العديد من تنسيقات الملفات المختلفة (PPT ، PDF إلخ) والتحليل.
الأوراق الأكاديمية
- التعلم العميق في NLP: ريبو جيثب الذي يجمع الأوراق حول التعلم العميق في NLP.
التعلم من خلال العمل
غالبًا ما تكون أفضل طريقة للتعلم هي المساهمة في مشروع NLP مفتوح المصدر الحالي أو تنفيذ فكرة ممتعة.
مشاريع مفتوحة المصدر
- Betty: Betty هو مشروع مفتوح المصدر مع كل من استخدام الحياة الواقعية واعتبارات NLP العملية ، ويبحث عن مشرفيين جدد.
أفكار ممتعة
- الخيال التفاعلي/الخيال القائم على المحلل: لعبة فيديو حيث تتضمن تفاعلات اللاعب في المقام الأول نصًا. استمع إلى هذا البودكاست الخيط المضيء حول هذا الموضوع.
واجهات برمجة التطبيقات
- IBM Watson Cloud: من صانعي IBM Watson. يتيح لك دمج وظائف NLP في تطبيقك عبر API. هناك طبقة مجانية/تجربة مجانية.
مجموعات المستخدمين
- مجموعة اهتمامات ACM الخاصة في الذكاء الاصطناعي: إذا كنت تتوق لبعض وجهاً لوجه الاتصال البشري.
أدلة أخرى
- سؤال Quora حول كيفية الوصول إلى NLP
- Awesome-NLP على Github: ريبو Github يحتوي على قائمة منسقة من موارد NLP.