nlp in practice
1.0.0
Используйте эти образцы и инструменты кода машинного обучения в НЛП, текстовое управление и инструменты для решения проблем с текстовыми данными реального мира.
Ссылки в первом столбце перенесите вас в подпапку/репозиторий с исходным кодом.
| Задача | Связанная статья | Тип источника | Описание |
|---|---|---|---|
| Крупномасштабная извлечение фразы | Фраза2VEC Статья | Скрипт Python | Извлеките фразы для больших объемов данных с использованием pyspark. Аннотируйте текст, используя эти фразы или используйте фразы для других нижестоящих задач. |
| Word Cloud для Notebook Jupyter и веб -приложений Python | Статья Word_Cloud | Скрипт Python + ноутбук | Визуализируйте верхние ключевые слова, используя количество слов или TFIDF |
| Gensim word2vec (с набором данных) | Статья Word2VEC | блокнот | Как правильно работать с Word2VEC, чтобы получить желаемые результаты |
| Чтение файлов и количество слов с помощью Spark | Spark Article | Скрипт Python | Как читать файлы разных форматов, используя pyspark с примером подсчета слов |
| Извлечение ключевых слов с помощью TF-IDF и Sklearn (с набором данных) | TFIDF статья | блокнот | Как извлечь интересные ключевые слова из текста, используя TF-IDF и Python Sklearn |
| Текст предварительная обработка | Текстовая предварительная обработка статьи | блокнот | Несколько фрагментов кода о том, как выполнить предварительную обработку текста. Включает в себя стебля, удаление шума, лемматизация и удаление слова. |
| TFIDFTRANSFORMER против TFIDFVECTORIZER | Статья об использовании tfidftransformer и tfidfvectorizer | блокнот | Как правильно использовать tfidftransformer и tfidfvectorizer и разницу между ними и тем, что использовать, когда. |
| Доступ | Предварительно обученная статья | блокнот | Как получить доступ к предварительно обученным встраиванию перчаток и word2VEC с использованием gensim и пример того, как эти встраивания могут быть использованы для сходства текста |
| Текстовая классификация в Python (с набором данных новостей) | Текстовая классификация с помощью статьи о логистической регрессии | блокнот | Начните с классификацией текста. Узнайте, как построить и оценить текстовый классификатор для классификации новостей, используя логистическую регрессию. |
| Примеры использования графства | Как правильно использовать график -экзамен? Углубленная статья | блокнот | Узнайте, как максимизировать использование граф -вертикализатора так, чтобы вы не просто вычислили количество слов, но и предварительно предварительно обрабатываете ваши текстовые данные, а также извлечение дополнительных функций из вашего текстового набора данных. |
| Примеры хэшингекторализатора | Хэшинг верлеклизатор против Статья CountVectorizer | блокнот | Изучите различия между хэшингекторизатором и графическим векторизатором и когда использовать, который. |
| CBOW против SKIPGRAM | Word2VEC: Сравнение статьи Cbow, Skipgram & Skipgramsi | блокнот | Быстрое сравнение трех встроенных архитектуры. |
Этот репозиторий поддерживается Кавитой Ганесан. Связайтесь со мной в LinkedIn или Twitter.