nlp in practice
1.0.0
Verwenden Sie diese NLP-, Text -Mining- und maschinellen Lerncode -Muster und -Tools, um reale Textdatenprobleme zu lösen.
Links in der ersten Spalte bringen Sie mit dem Quellcode zum Unterordner/Repository.
| Aufgabe | Verwandter Artikel | Quellentyp | Beschreibung |
|---|---|---|---|
| Große Phrasenextraktion | Phrase2Vec -Artikel | Python -Skript | Extrahieren Sie Phrasen für große Datenmengen mit PYSPARK. Anmerkende Text mit diesen Phrasen oder verwenden Sie die Phrasen für andere nachgeschaltete Aufgaben. |
| Word Cloud für Jupyter Notebook und Python Web Apps | WORD_CLOUD -Artikel | Python -Skript + Notizbuch | Visualisieren Sie die Top -Schlüsselwörter mit Word Couns oder TFIDF |
| Gensim Word2VEC (mit Datensatz) | Word2VEC -Artikel | Notizbuch | So arbeiten Sie korrekt mit Word2VEC, um die gewünschten Ergebnisse zu erzielen |
| Lesen von Dateien und Wortzahl mit Spark | Funkenartikel | Python -Skript | So lesen Sie Dateien verschiedener Formate mit PYSPARK mit einem Beispiel für Wortanzeigen |
| Extrahieren von Schlüsselwörtern mit TF-IDF und Sklearn (mit Datensatz) | TFIDF -Artikel | Notizbuch | So extrahieren Sie interessante Schlüsselwörter aus Text mit TF-IDF und Pythons Sklearn |
| Textvorverarbeitung | Textvorverarbeitungsartikel | Notizbuch | Ein paar Codeausschnitte zur Durchführung von Textvorverarbeitung. Beinhaltet Stamm, Geräuschentfernung, Lemmatisierung und Stop -Word -Entfernung. |
| Tfidftransformer vs. tfidfVectorizer | TFIDFTRANSFORMAL- UND TFIDFVECTORSIZER -Nutzungsartikel | Notizbuch | So verwenden Sie TFIDFTransformer und TFIDFVectorizer korrekt und der Unterschied zwischen den beiden und dem, was zu verwenden ist, wann. |
| Zugriff auf vorgebildete Worteinbettungen mit Gensim | Vorausgebildeter Worteinbettungsartikel | Notizbuch | So greifen Sie mit Gensim und einem Beispiel dafür, wie diese Einbettungen für die Ähnlichkeit der Text eingesetzt werden können |
| Textklassifizierung in Python (mit Nachrichten Datensatz) | Textklassifizierung mit logistischer Regression Artikel | Notizbuch | Beginnen Sie mit der Textklassifizierung. Erfahren Sie, wie Sie einen Textklassifizierer für die Nachrichtenklassifizierung mithilfe der logistischen Regression erstellen und bewerten. |
| COUNTVECTORIZER -Nutzungsbeispiele | Wie benutze ich CountVectorizer richtig? Ein detaillierter Artikel Artikel | Notizbuch | Erfahren Sie, wie Sie die Verwendung von CountVectorizer so maximieren können, dass Sie nicht nur die Wörterzahlen berechnen, sondern auch Ihre Textdaten entsprechend vorab und extrahieren zusätzliche Funktionen aus Ihrem Textdatensatz. |
| HashingVectorizer -Beispiele | HashingVectorizer Vs. CountVectorizer -Artikel | Notizbuch | Erfahren Sie die Unterschiede zwischen HashingVectorizer und CountVectorizer und wann Sie welche verwenden sollen. |
| CBOW vs. Skipgram | Word2VEC: Ein Vergleich zwischen CBOW, Skipgram & Skipgramsi -Artikel | Notizbuch | Ein kurzer Vergleich der drei Einbettungsarchitektur. |
Dieses Repository wird von Kavita Ganesan aufrechterhalten. Verbinde dich mit mir auf LinkedIn oder Twitter.