(Arbeit in Arbeit!)
Die natürliche Sprachverarbeitung (NLP) hat in den letzten Jahren aufgrund des Erfolgs moderner Techniken, die auf tiefem Lernen beruhen, erhebliche Fortschritte erzielt. Mit dem Anstieg der Popularität von NLP und der Verfügbarkeit verschiedener Formen großer Daten ist es jetzt noch wichtiger, die inneren Funktionsweise von NLP-Techniken und -konzepten aus den ersten Prinzipien zu verstehen, da sie ihren Weg in die Verwendung und Anwendungen in der realen Welt finden, die sich auf die Gesellschaft auswirken. Aufbau von Intuitionen und ein solides Verständnis für Konzepte ist sowohl wichtig für die Entwicklung innovativer Techniken, die Verbesserung der Forschung und den Aufbau sicherer, menschlichzentrierter KI- und NLP-Technologien.
Wir stellen eine neue Serie mit dem Titel "Fundamentals of NLP" vor, in der wir über wichtige NLP -Techniken und -konzepte nach den ersten Prinzipien unterrichten möchten. Wir werden den theoretischen Aspekt und die Motivation jedes Konzepts in der gesamten Serie vorstellen. Anschließend sammeln wir praktische Erfahrungen, indem wir Bootstrap-Methoden, Branchen-Standard-Tools und andere Open-Source-Bibliotheken verwenden, um die verschiedenen Techniken zu implementieren. Unterwegs werden wir auch Best Practices abdecken, wichtige Referenzen teilen, auf häufige Fehler hinweisen, die Sie beim Training und Bauen von NLP -Modellen vermeiden und diskutieren, was vor uns liegt.
Schließen Sie sich unserer Slack -Community bei, um mehr über diese und andere laufende Projekte zu erfahren. Wenden Sie sich gerne auf Twitter, um eine Einladung zu unserer Slack -Gruppe zu erhalten.
Kapitel 1: Tokenisierung, Lemmatisierung, Stamm und Satzsegmentierung - Colab Notebook, Webversion
nlp_fundamentals . Probleme mit dem good first issue -Tag sind gute Aufgaben, mit denen Sie beginnen können.