Une liste organisée de ressources débutantes dans le traitement du langage naturel
Maintienneur
Dibya Chakravorty
Contributions
N'hésitez pas à envoyer des demandes de traction ou à m'envoyer un e-mail ([email protected])
Comment cette liste a commencé
Le 10 novembre 2016, un utilisateur de Hacker News (HN), Aarohmankad, a demandé à la communauté HN des suggestions sur les ressources NLP débutantes. Ce fil HN Ask est devenu populaire et est resté en première page pendant un certain temps. Pendant ce temps, il a rassemblé de nombreuses suggestions générées par la communauté sur les ressources de PNL débutantes. Cette liste est une tentative de résumer cette discussion dans une liste cohérente de ressources. J'ai également écrit un article de blog à ce sujet.
Table des matières
- Livres
- Moocs
- Vidéos youtube
- Cours universitaires en ligne
- Packages pour jouer avec
- Papiers universitaires
- Apprendre en faisant
- Projets open source
- Idées amusantes
- Apis
- Groupes d'utilisateurs
- Autres guides
Livres
- Traitement de la parole et du langage: manuel classique et standard dans la PNL. Pré-publication Brouillage de la 3e édition disponible ici.
- Traitement du langage naturel avec Python: livre orienté vers l'application. Des exemples sont dans Python (NLTK). Version en ligne gratuite ici.
- Taming Text: livre orienté vers l'application. Des exemples sont en Java.
- Fondations du traitement statistique du langage naturel: texte classique sur la PNL statistique. Va profondément dans la mise en œuvre des analyseurs, des taggers, etc.
- Manuel de traitement du langage naturel: un traitement complet de la PNL qui commence à partir des racines historiques et se termine par les méthodes modernes de la PNL.
- Traduction de machine statistique: Apprenez à faire un service comme Google Translate
- Introduction à la recherche d'informations: Apprenez les écrous et boulons de services comme Google Search et Google News (recherche, classification de texte, clustering, etc.)
- Analyse du Prolog et du langage naturel: implémenter des algortihms de PNL dans Prolog.
Moocs
- Coursera Courser offert par l'Université du Michigan: cours d'introduction qui couvre tous les documents préalables. Le langage de programmation favorisé est Python.
- Cours de Cursera DiContinued proposé par l'Université Comlumbia, disponible sur les torrents académiques: théorie et cours axés sur le concept. Seuls les documents de cours sont disponibles à ce stade.
Vidéos youtube
- Les séries de vidéos de Jurafsky et Martin: Jurafsky et Martin sont toutes deux professeurs à Stanford, et ils ont écrit plusieurs manuels classiques sur NLP.
- Stanford CS224D: Deep Learning in NLP: Applicatin of Deep Learning in NLP
- NLP avec Python et NLTK: série vidéo orientée vers l'application à l'aide de Python et NLTK.
Cours universitaires en ligne
- Cours de traduction automatique à l'Université de Pennsylvanie
Packages pour jouer avec
- NLTK: bibliothèque NLP la plus populaire à Python. Excellente documentation sous la forme d'un livre / version en ligne gratuite. Puissant et extensible.
- Stanford Corenlp: Fast and Feature Rich NLP Library, écrit en Java. Une démo en ligne est disponible ici.
- Spacy: une autre bibliothèque NLP émergente dans Python. Rapide et à l'état de l'art. Essaie de maintenir une API uniforme lors de la mise en œuvre des algorithmes de pointe. Ils ont un blog et une démo en ligne.
- Apache Tika: propose une interface unifiée pour extraire les données de texte et les méta-données de nombreux formats de fichiers différents (PPT, PDF etc.) et analyse.
Papiers universitaires
- Deep Learning in NLP: A GitHub Repo qui recueille des articles sur l'apprentissage en profondeur dans la PNL.
Apprendre en faisant
Souvent, la meilleure façon d'apprendre est de contribuer à un projet de PNL open source existant ou de mettre en œuvre une idée amusante.
Projets open source
- Betty: Betty est un projet open source avec une utilisation réelle et des considérations pratiques NLP, et recherche de nouveaux mainteneurs.
Idées amusantes
- Fiction interactive / Fiction basée sur l'analyseur: un jeu vidéo où les interactions du joueur impliquent principalement du texte. Écoutez ce podcast de fil illuminant sur le sujet.
Apis
- IBM Watson Cloud: des fabricants d'IBM Watson. Il vous permet d'intégrer la fonctionnalité NLP dans votre application via une API. Il y a un niveau gratuit / essai gratuit.
Groupes d'utilisateurs
- ACM Special Interest Group dans l'IA: Si vous avez envie d'un contact humain face à face.
Autres guides
- Quora Question sur la façon de pénétrer dans la PNL
- Awesome-NLP sur GitHub: un repo GitHub contenant une liste organisée de ressources NLP.