
- Для получения полных задач по науке о данных , материалах и т. Д. Пожалуйста, проверьте хранилище науки о данных.
- На наличие алгоритмов машинного обучения, пожалуйста, проверьте хранилище машинного обучения.
- На наличие алгоритмов глубокого обучения, пожалуйста, проверьте репозиторий глубокого обучения.
- На наличие компьютерного видения, пожалуйста, проверьте репозиторий Computer Vision.
Папки со всеми материалами для конкретной задачи/домена
Современные методы НЛП из повторяющихся нейронных сетей и встроенных слов в трансформеры и самопринятие. Охватывает прикладные темы, такие как вопросы ответа и генерация текста.
Это расширение курса по обработке естественного языка (ML для), преподаваемого в Школе анализа данных Yandex (YSDA). На данный момент только часть тем, вероятно, будет покрыта здесь.
Этот курс будет охватывать технологии поисковых систем, которые играют важную роль в любых приложениях для интеллектуального анализа данных, включающих текстовые данные по двум причинам. Во -первых, хотя необработанные данные могут быть большими для какой -либо конкретной проблемы, это часто является относительно небольшим подмножеством данных, которые имеют релевантные данные, а поисковая система является важным инструментом для быстрого обнаружения небольшого подмножества соответствующих текстовых данных в большом сборе текста. Во -вторых, необходимы поисковые системы, чтобы помочь аналитикам интерпретировать любые шаблоны, обнаруженные в данных, позволяя им изучить соответствующие исходные текстовые данные, чтобы понять любой обнаруженный шаблон. Вы изучите основные понятия, принципы и основные методы поиска текста, которые являются основной наукой поисковых систем.
Официальный репозиторий для «практической обработки естественного языка» от O'Reilly Media
Доступно как книга: NLP в Python - Guide Quickstart
| Заголовок | Описание |
|---|---|
| Acl | в Vimeo |
| [Стэнфорд CS224N: обработка естественного языка с глубоким обучением | Зима 2021] (https://www.youtube.com/playlist?list=ploromvodv4rosh4v6133s9lfprhjembmj) |
| Обработка естественного языка (NLP) Zero to Hero | Тензорфлоу |
| Zero to Hero: NLP с Tensorflow и Keras (GDG Sofia Meetup) | |
| Обработка естественного языка | Этот контент основан на Университете машинного обучения (MLU) ускоренного класса обработки естественного языка. Слайды, записные книжки и наборы данных доступны на GitHub |
Я ученый в Google. Я блог о обработке естественного языка и машинном обучении.
Куратор строки инженерных блогов
Градиент - это организация с миссиями по облегчению упрощения изучения искусственного интеллекта и облегчения обсуждения в сообществе ИИ. Мы были основаны в 2017 году группой студентов и исследователей в лаборатории Стэнфорда ИИ.
| Заголовок | Описание |
|---|---|
| Примеры глубокого обучения NVIDIA для ядер тензоров - обработка естественного языка | Примеры глубокого обучения |
| Обработка естественного языка с трансформаторами | Записные книжки и материалы для книги О'Рейли «Обработка естественного языка с трансформаторами» |
| Потрясающие ссылки на НЛП | Куративный список ресурсов, посвященных дистилляции знаний, системы рекомендаций, особенно обработки естественного языка (NLP) |
| NLP - Учебное пособие | |
| Учебные пособия по естественному языку | |
| NLP с Python | Scikit-learn, nltk, spacy, gensim, textblob и многое другое ... |
| NLP и наука о данных | Ежедневные прожекторы некоторых недооцененных репозиториев NLP и Data Science Github. |
| NLP 101: Репозиторий ресурса для глубокого обучения и обработки естественного языка | Этот документ составлен для тех, кто испытывает энтузиазм по поводу глубокого обучения в обработке естественного языка. Если есть хорошие рекомендации или предложения, я постараюсь добавить больше. |
| NLP-Progress | Репозиторий для отслеживания прогресса в обработке естественного языка (NLP), включая наборы данных и текущее состояние для наиболее распространенных задач NLP. |
| Обнимающееся лицо | Public Repo для сообщений в блоге HF |
| Allennlp | Исследовательская библиотека NLP с открытым исходным кодом, построенная на Pytorch. Allenai.org |
Библиотеки NLP, рамки, модули
| Заголовок | Описание |
|---|---|
| Натуральный язык инструментарий (NLTK) | NLTK - The Natural Language Toolkit - представляет собой набор модулей, наборов данных и учебных пособий с открытым исходным кодом, поддерживающими исследования и разработки в области обработки естественного языка. |
| талант |
Очень простая структура для современной обработки естественного языка (NLP). Стол: это: |
| текстовое судно | textacy -это библиотека Python для выполнения различных задач обработки естественного языка (NLP), построенных на высокопроизводительной библиотеке Spacy. С основами-токенами, частью тегации речи, диаграммой зависимости и т. Д. --- делегированная в другую библиотеку, textacy фокусируется в первую очередь на задачах, которые приходят раньше и следуют после. |
| Allennlp | Исследовательская библиотека НЛП, построенная на Pytorch, для разработки современных моделей глубокого обучения на широком спектре языковых задач. |
| Nlpgym | NLPGYM - это инструментарий для преодоления разрыва между применениями RL и NLP. Это направлено на содействие исследованиям и сравнению применения DRL по задачам обработки естественного языка. Toolkit предоставляет интерактивные среды для стандартных задач NLP, таких как тегинг последовательностей, ответ на вопросы и классификация последовательности. |
| Генсим |
| Заголовок | Описание |
|---|---|
| NLP-Tutorial | Учебник по обработке естественного языка для исследователей глубокого обучения |
| Обработка естественного языка в учебном пособии Python | Сравнение Stand Up Comedians с использованием обработки естественного языка |
? 100 обязательных документов НЛП
? Sci-Hub (документы)
? Стэнфорд, расписание семинаров НЛП
? CS224N: обработка естественного языка с глубоким обучением
? CIS 700-008 - Интерактивная фантастика и генерация текста
? Гарвардский НЛП
? Иллюстрированный трансформатор
Внедрил нейронную сеть с двунаправленным потоком внимания в качестве базовой линии отряда, улучшая реализацию модели Криса Шута, добавив входы-символ, как описано в исходной статье, и улучшая код Gauthierdmns.