(Travail en cours!)
Le traitement du langage naturel (PNL) a fait des progrès substantiels au cours des dernières années en raison du succès des techniques modernes basées sur l'apprentissage en profondeur. Avec la montée en puissance de la popularité de la PNL et la disponibilité de différentes formes de données à grande échelle, il est désormais encore plus impératif de comprendre le fonctionnement interne des techniques et des concepts de la PNL, des premiers principes, car ils trouvent leur chemin dans l'utilisation du monde réel et les applications qui affectent la société dans son ensemble. La construction d'intuitions et la compréhension solide des concepts sont à la fois importantes pour trouver des techniques innovantes, améliorer la recherche et créer des technologies d'IA et de PNL sécurisées et centrées sur l'homme.
Nous introduisons une nouvelle série intitulée Fundamentals of NLP où nous visons à enseigner les techniques et les concepts des PNL importants à partir des premiers principes. Nous présenterons l'aspect théorique et la motivation de chaque concept couvert tout au long de la série. Ensuite, nous obtiendrons une expérience pratique en utilisant des méthodes de bootstrap, des outils standard et d'autres bibliothèques open source pour implémenter les différentes techniques. En cours de route, nous couvrirons également les meilleures pratiques, partagerons des références importantes, soulignerons les erreurs courantes à éviter lors de la formation et de la construction de modèles de PNL et discuteront de ce qui nous attend.
Rejoignez notre communauté Slack pour en savoir plus à ce sujet et d'autres projets en cours. N'hésitez pas à me contacter sur Twitter pour une invitation à notre groupe Slack.
Chapitre 1: Tokenisation, lemmatisation, tige et segmentation des phrases - Colab Notebook, version Web
nlp_fundamentals . Les problèmes avec la good first issue sont de bonnes tâches pour commencer.