Ingeniería de características impresionantes para el aprendizaje automático
Una lista curada de recursos dedicados a las técnicas de ingeniería para el aprendizaje automático
Mantenedores - Andrei Khobnia
Esta página tiene licencia bajo Creative Commons Attribution-No Commercial-Sharealike 3.0 Unported License
No dude en crear solicitudes de extracción.
Contenido
- Datos numéricos
- Escalada
- Categoría
- Cuantización y binning
- Transformación de la caja de la caja
- Transformación de Yeo-Johnson
- Interacciones de características
- Características de agrupación
- Características T-SNE
- Características de PCA
- Datos textuales
- Bolsa
- Características de detección de frases
- Tfidf
- Incrustaciones de palabras
- Incruscaciones de subvenciones
- Características del patrón
- Características del léxico
- Características de POS
- Datos de imágenes
- Características del algoritmo de visión por computadora
- Características de las estadísticas de imagen
- Características de OCR
- Características de aprendizaje profundo
- Datos categóricos
- Una codificación caliente
- Contar codificar
- Codificación de etiquetas
- Codificación ficticia
- Codificación media
- Chava
- Datos de series de tiempo
- Características de la ventana rodante
- Características de retraso
- Datos geoespaciales
Datos numéricos
- Comprensión de la ingeniería de características (Parte 1) - Datos numéricos continuos
Escalada
- sklearn.processing.minmaxscaler
- sklearn.processing.StandartScaler
Categoría
- Categoría
- scipy.stats.rankdata
Cuantización y binning
- Binning de datos
- Bulleting Variables continuas en Pandas
- pandas.cat
Transformación de la caja de la caja
- scipy.stats.boxcox
-
np.log (x + const)
Transformación de Yeo-Johnson
- Transformación de Yeo-Johnson
Interacciones de características
- Largometraje
- sklearn.processing.polynomialFeatures
- Divisiones
- Otras interacciones
Características de agrupación
- ¡Cómo crear nuevas características usando clúster!
Características T-SNE
- t-sne
- Extracción de características automáticas con T-SNE
Características de PCA
- Análisis de componentes principales (PCA)
- sklearn.decomposition.pca
Datos textuales
- Comprensión de la ingeniería de características (Parte 3) - Métodos tradicionales para datos de texto
Bolsa
- Modelo de bolsas de palabras
- Una suave introducción al modelo de la bolsa de las palabras
- sklearn.feature_extraction.text.countVectorizer
- sklearn.feature_extraction.dictVectorizer
- sklearn.feature_extraction.Featurehasher
Características de detección de frases
- sklearn_api.phrases - scikit Learn Wrapper para la detección de frases (colocación)
Tfidf
- TF-IDF
- sklearn.feature_extraction.text.tfidfvectorizer
Incrustaciones de palabras
- Incrustación de palabras
- Glove: vectores globales para la representación de palabras
- Gensim: Models.Word2Vec - Word2Vec Incrustaciones
- contenedor
- Word2Vec y FastText Word Incrustando con Gensim
- ¿Los incrustaciones previos a la aparición le dan la ventaja adicional?
Incruscaciones de subvenciones
- Incrustaciones de subvención previamente capacitadas en 275 idiomas, basados en la codificación de pares de bytes (BPE)
Características del patrón
- ClearTk - Tutorial de extracción de funciones
- Expresiones regulares
Características del léxico
- Reconocimiento de entidad nombrado con LSTM-CNNS bidireccional (ARXIV: 1511.08308)
Características de POS
- Parte del habla_tagging
- NLTK Categorizando y etiquetando palabras
- Cómo usar las características de POS en Scikit Learn ClassFiers
Datos de imágenes
Características del algoritmo de visión por computadora
- Extracción de características y búsqueda de imágenes similar con OpenCV para novatos
- OpenCV - Detección y descripción de características
- Paquete de SimpleCv.Features
- Módulo de características de imagen de ciencia ficción
Características de las estadísticas de imagen
- Módulo de ImageStat - Almohada
Características de OCR
- Un envoltorio de pitón para Google Tesseract
Características de aprendizaje profundo
- Los modelos previamente capacitados de Keras cuentan con extracción
- Uso de los modelos previamente capacitados de Keras para la extracción de características en la agrupación de imágenes
Datos categóricos
- Comprensión de la ingeniería de características (Parte 2) - Datos categóricos
Una codificación caliente
- ¿Por qué un solo codificación de datos en el aprendizaje automático?
- Cómo una secuencia de codificación en caliente en Python
- sklearn.processing.onehotencoder
- Keras - To_Categorical
Contar codificar
- Ingeniería de características: codificación de recuento
Codificación de etiquetas
- Etiqueta que codifica en Scikit-Learn
- Ingeniería de características: codificación de etiquetas
Codificación ficticia
- Codificación ficticia: el cómo y por qué
- pandas.get_dummies
- Codificación de un solo estado vs ficticio
Codificación media
- Codificación de probabilidad de características categóricas
- Python Target Codificación para características categóricas
- Agregar columna de varianza cuando la codificación media
Chava
- Funciones de hashing en Wikipedia
- Cuenta con hashing y extracción en Vowpalwabbit
- Certificado de hashing en Scikit-Learn
Datos de series de tiempo
- Extracción automática de características relevantes de series de tiempo
- Ingeniería de características básicas con datos de series de tiempo en Python
Características de la ventana rodante
Características de retraso
- Use pandas para retrasar sus datos de Timeseries para examinar las relaciones causales
Datos geoespaciales
- Ingeniería y visualización de características geoespaciales
- Introducción a datos geoespaciales usando Python
Volver arriba