Потрясающая инженерия функций для машинного обучения
Куратор ресурсов, посвященный методам инженерии функций для машинного обучения
Содействия - Андрей Хобния
Эта страница лицензирована в соответствии с Creative Commons Attribution-Noncommercial-Sharealike 3.0 Unported License
Пожалуйста, не стесняйтесь создавать запросы на притяжение.
Содержимое
- Числовые данные
- Масштабирование
- Рейтинг
- Квантование и биннинг
- Преобразование коробки-кокса
- Yeo-johnson transformation
- Функции взаимодействия
- Кластеризационные функции
- Функции T-SNE
- Функции PCA
- Текстовые данные
- Пакет слов
- Фразы обнаружения
- TFIDF
- Слово встраивание
- Подотровью подводных слов
- Особенности шаблона
- Лексиконские особенности
- POS -функции
- Данные изображения
- Функции алгоритма компьютерного зрения
- Особенности статистики изображения
- Особенности OCR
- Глубокие функции обучения
- Категориальные данные
- Одна горячая кодировка
- Считайте кодирование
- Кодирование ярлыка
- Фиктивная кодировка
- Среднее кодирование
- Хешинг
- Данные временных рядов
- Особенности прокатного окна
- Особенности задержки
- Геопространственные данные
Числовые данные
- Понимание инженерии функций (часть 1) - непрерывные числовые данные
Масштабирование
- sklearn.preprocessing.minmaxscaler
- sklearn.preprocessing.standartscaler
Рейтинг
- Рейтинг
- scipy.stats.rankdata
Квантование и биннинг
- Биннинг данных
- Ведение непрерывных переменных в пандах
- Pandas.cat
Преобразование коробки-кокса
- scipy.stats.boxcox
-
np.log (x + const)
Yeo-johnson transformation
- Yeo-johnson transformation
Функции взаимодействия
- FeatureTools
- sklearn.preprocessing.polynomialfeatures
- Подразделения
- Другие взаимодействия
Кластеризационные функции
- Как создать новые функции с помощью кластеризации !!
Функции T-SNE
- T-Sne
- Автоматическое извлечение функций с помощью t-sne
Функции PCA
- Анализ основных компонентов (PCA)
- Sklearn.decomposition.pca
Текстовые данные
- Понимание инженерии функций (часть 3) - традиционные методы для текстовых данных
Пакет слов
- Модель пакета слов
- Нежное введение в модель пакета слов
- sklearn.feature_extraction.text.countvectorizer
- sklearn.feature_extraction.dictvectorizer
- sklearn.feature_extraction.featurehasher
Фразы обнаружения
- sklearn_api.phrases - Scikit Learn Wrapper для обнаружения фразы (Collocation)
TFIDF
- TF-IDF
- sklearn.feature_extraction.text.tfidfvectorizer
Слово встраивание
- Слово внедрение
- Перчатка: глобальные векторы для представления слов
- Gensim: models.word2vec - word2vec intddings
- Фасттекст
- Word2VEC и FastText Word, встраиваемое с Gensim
- Подают ли предварительные встраиваемые встроения, дополнительное преимущество?
Подотровью подводных слов
- Предварительно обученные подвесные встроения на 275 языках, основанные на кодировании байтовой пары (BPE)
Особенности шаблона
- ClearTK - Учебное пособие по извлечению функций
- Регулярные выражения
Лексиконские особенности
- Названное признание организации с двунаправленным LSTM-CNNS (Arxiv: 1511.08308)
POS -функции
- Часть Speech_tagging
- NLTK категоризация и теги
- Как использовать POS -функции в Scikit Learning Classfiers
Данные изображения
Функции алгоритма компьютерного зрения
- Извлечение функций и аналогичный поиск изображений с OpenCV для новичков
- OpenCV - обнаружение и описание функций
- Simplecv.features Package
- Модуль функции Scikit-Image
Особенности статистики изображения
- Модуль Imagestat - подушка
Особенности OCR
- Обертка Python для Google Tesseract
Глубокие функции обучения
- Предварительно обученные модели Keras
- Использование предварительно обученных моделей Keras для извлечения функций в кластеризации изображений
Категориальные данные
- Понимание инженерии функций (часть 2) - категориальные данные
Одна горячая кодировка
- Зачем одножелательно кодировать данные в машинном обучении?
- Как получить один горячий данные последовательности кодирования в Python
- sklearn.preprocessing.onehotencoder
- Керас - TO_CATEGORICAL
Считайте кодирование
- Инженерная инженерия: кодирование графа
Кодирование ярлыка
- Кодировка метки в Scikit-learn
- Инженерная инженерия: кодирование метки
Фиктивная кодировка
- Фиктивное кодирование: как и почему
- pandas.get_dummies
- ОДНА-HOT против фиктивного кодирования
Среднее кодирование
- Вероятность кодирования категориальных особенностей
- Кодирование целевого значения Python для категориальных особенностей
- Добавление столбца дисперсии, когда среднее кодирование
Хешинг
- Особенность хешина на Википедии
- Хеширование и извлечение в Vowpalwabbit
- Функция хеширования в Scikit-learn
Данные временных рядов
- Автоматическое извлечение соответствующих функций из временных рядов
- Основная инженерия функций с данными временных рядов в Python
Особенности прокатного окна
Особенности задержки
- Используйте панды, чтобы отставать данные о времени, чтобы изучить причинно -следственные связи
Геопространственные данные
- Геопространственная инженерия и визуализация
- Вступление в геопространственные данные с использованием Python
Вернуться к вершине