Rekayasa fitur yang luar biasa untuk pembelajaran mesin
Daftar sumber daya yang dikuratori yang didedikasikan untuk teknik rekayasa fitur untuk pembelajaran mesin
Pemelihara - Andrei Khobnia
Halaman ini dilisensikan di bawah Lisensi Creative Commons Attribution-NonCommercial-Sharealike 3.0
Silakan membuat permintaan tarik.
Isi
- Data numerik
- Penskalaan
- Peringkat
- Kuantisasi dan binning
- Transformasi kotak-cox
- Transformasi Yeo-Johnson
- Interaksi fitur
- Fitur Clustering
- Fitur T-SNE
- Fitur PCA
- Data tekstual
- Tas kata -kata
- Fitur Deteksi Frase
- Tfidf
- Kata embeddings
- Subword Embeddings
- Fitur pola
- Fitur Leksikon
- Fitur POS
- Data gambar
- Fitur Algoritma Visi Komputer
- Fitur Statistik Gambar
- Fitur OCR
- Fitur pembelajaran yang mendalam
- Data kategorikal
- Satu penyandian panas
- Hitung Pengkodean
- Pengkodean Label
- Pengkodean boneka
- Pengkodean berarti
- Hashing
- Data deret waktu
- Fitur jendela bergulir
- Fitur Lag
- Data geospasial
Data numerik
- Memahami Rekayasa Fitur (Bagian 1) - Data Numerik Berkelanjutan
Penskalaan
- sklearn.preprocessing.minmaxscaler
- sklearn.preprocessing.standartscaler
Peringkat
- Peringkat
- scipy.stats.rankdata
Kuantisasi dan binning
- Data Binning
- Variabel kontinu ember di panda
- pandas.cat
Transformasi kotak-cox
- scipy.stats.boxcox
-
np.log (x + const)
Transformasi Yeo-Johnson
Interaksi fitur
- FeatureTools
- sklearn.preprocessing.polynomialfeatures
- Divisi
- Interaksi lainnya
Fitur Clustering
- Cara membuat fitur baru menggunakan clustering !!
Fitur T-SNE
- t-sne
- Ekstraksi fitur otomatis dengan T-SNE
Fitur PCA
- Analisis Komponen Utama (PCA)
- sklearn.decomposition.pca
Data tekstual
- Memahami Rekayasa Fitur (Bagian 3) - Metode Tradisional untuk Data Teks
Tas kata -kata
- Model Bag-of-Words
- Pengantar Model Tag-of-Word yang Lembut
- sklearn.feature_extraction.text.countVectorizer
- sklearn.feature_extraction.dictvectorizer
- sklearn.feature_extraction.featureHasher
Fitur Deteksi Frase
- sklearn_api.phrases - scikit belajar pembungkus untuk frase (kolokasi) deteksi
Tfidf
- tf-idf
- sklearn.feature_extraction.text.tfidfvectorizer
Kata embeddings
- Kata embedding
- Sarung Tangan: Vektor Global untuk Representasi Kata
- Gensim: model.word2vec - embeddings word2vec
- FastText
- Word2vec dan fasttext word embedding dengan gensim
- Apakah embeddings pretrained memberi Anda keunggulan ekstra?
Subword Embeddings
- Embeddings subword pra-terlatih dalam 275 bahasa, berdasarkan encoding byte-pair (BPE)
Fitur pola
- Cleartk - Tutorial Ekstraksi Fitur
- Ekspresi reguler
Fitur Leksikon
- Pengakuan Entitas yang Dinamai dengan dua arah LSTM-CNNS (ARXIV: 1511.08308)
Fitur POS
- Part-of-speech_tagging
- NLTK mengkategorikan dan menandai kata
- Cara menggunakan fitur POS di scikit Learn Classfiers
Data gambar
Fitur Algoritma Visi Komputer
- Ekstraksi fitur dan pencarian gambar serupa dengan OpenCV untuk pemula
- OpenCV - Deteksi dan Deskripsi Fitur
- Paket SimpleCv.Fitur
- Modul fitur scikit-image
Fitur Statistik Gambar
Fitur OCR
- Pembungkus Python untuk Google Tesseract
Fitur pembelajaran yang mendalam
- Ekstraksi Fitur Model Pra-Terlatih Keras
- Menggunakan model pra-terlatih Keras untuk ekstraksi fitur dalam pengelompokan gambar
Data kategorikal
- Memahami Rekayasa Fitur (Bagian 2) - Data Kategorikal
Satu penyandian panas
- Mengapa data enkode satu-panas dalam pembelajaran mesin?
- Cara satu data urutan enkode panas dalam python
- sklearn.preprocessing.oneHotencoder
- Keras - to_categorical
Hitung Pengkodean
- Teknik Fitur: Hitung Pengkodean
Pengkodean Label
- Pengkodean label dalam scikit-learn
- Teknik Fitur: Pengkodean Label
Pengkodean boneka
- Coding dummy: bagaimana dan mengapa
- PANDAS.GET_DUMMIES
- Pengkodean One-Hot vs Dummy
Pengkodean berarti
- Pengkodean kemungkinan fitur kategori
- Pengkodean target Python untuk fitur kategori
- Menambahkan kolom varians saat pengkodean rata -rata
Hashing
- Fitur hashing di wikipedia
- Fitur hashing dan ekstraksi di vowpalwabbit
- Fitur hashing di scikit-learn
Data deret waktu
- Ekstraksi otomatis fitur yang relevan dari deret waktu
- Teknik Fitur Dasar dengan Data Seri Waktu di Python
Fitur jendela bergulir
Fitur Lag
- Gunakan PANDAS untuk menuntut data waktu Anda untuk memeriksa hubungan sebab akibat
Data geospasial
- Teknik dan visualisasi fitur geospasial
- Intro ke data geospasial menggunakan Python
Kembali ke atas