วิศวกรรมคุณสมบัติที่ยอดเยี่ยมสำหรับการเรียนรู้ของเครื่องจักร
รายการทรัพยากรที่รวบรวมไว้เพื่อนำเสนอเทคนิคทางวิศวกรรมสำหรับการเรียนรู้ของเครื่องจักร
ผู้ดูแล - Andrei Khobnia
หน้านี้ได้รับใบอนุญาตภายใต้ Creative Commons Attribution-Noncommercial-Sharealike 3.0 ใบอนุญาตที่ไม่ได้พกพา
โปรดอย่าลังเลที่จะสร้างคำขอดึง
สารบัญ
- ข้อมูลตัวเลข
- การปรับขนาด
- การจัดอันดับ
- การหาปริมาณและการระเบิด
- การแปลง Box-cox
- การเปลี่ยนแปลงของ Yeo-Johnson
- คุณสมบัติการโต้ตอบ
- คุณสมบัติการจัดกลุ่ม
- ฟีเจอร์ T-Sne
- คุณสมบัติ PCA
- ข้อมูลข้อความ
- ถุงคำพูด
- คุณสมบัติการตรวจจับวลี
- TFIDF
- การฝังคำ
- subword embeddings
- คุณสมบัติลวดลาย
- คุณสมบัติพจนานุกรม
- คุณสมบัติ POS
- ข้อมูลภาพ
- คุณสมบัติอัลกอริทึมการมองเห็นคอมพิวเตอร์
- คุณสมบัติสถิติภาพ
- คุณสมบัติ OCR
- คุณสมบัติการเรียนรู้ลึก
- ข้อมูลหมวดหมู่
- การเข้ารหัสร้อนหนึ่งครั้ง
- นับการเข้ารหัส
- การเข้ารหัสฉลาก
- การเข้ารหัสจำลอง
- หมายถึงการเข้ารหัส
- การแฮม
- ข้อมูลอนุกรมเวลา
- คุณสมบัติหน้าต่างกลิ้ง
- คุณสมบัติล่าช้า
- ข้อมูลเชิงพื้นที่
ข้อมูลตัวเลข
- การทำความเข้าใจวิศวกรรมคุณลักษณะ (ตอนที่ 1) - ข้อมูลตัวเลขต่อเนื่อง
การปรับขนาด
- sklearn.preprocessing.minmaxscaler
- Sklearn.preprocessing.standartscaler
การจัดอันดับ
- การจัดอันดับ
- scipy.stats.rankdata
การหาปริมาณและการระเบิด
- ข้อมูล binning
- ตัวแปรต่อเนื่องในแพนด้า
- pandas.cat
การแปลง Box-cox
- scipy.stats.boxcox
-
np.log (x + const)
การเปลี่ยนแปลงของ Yeo-Johnson
- การเปลี่ยนแปลงของ Yeo-Johnson
คุณสมบัติการโต้ตอบ
- fileturetools
- sklearn.preprocessing.polynomialfeatures
- หน่วยงาน
- การโต้ตอบอื่น ๆ
คุณสมบัติการจัดกลุ่ม
- วิธีสร้างคุณสมบัติใหม่โดยใช้การจัดกลุ่ม !!
ฟีเจอร์ T-Sne
- T-Sne
- การแยกคุณสมบัติอัตโนมัติด้วย T-SNE
คุณสมบัติ PCA
- การวิเคราะห์องค์ประกอบหลัก (PCA)
- sklearn.decomposition.pca
ข้อมูลข้อความ
- การทำความเข้าใจวิศวกรรมคุณลักษณะ (ตอนที่ 3) - วิธีการดั้งเดิมสำหรับข้อมูลข้อความ
ถุงคำพูด
- โมเดลกระเป๋าคำ
- การแนะนำอย่างอ่อนโยนเกี่ยวกับโมเดลกระเป๋าคำ
- sklearn.feature_extraction.text.countVectorizer
- sklearn.feature_extraction.dictVectorizer
- sklearn.feature_extraction.featurehasher
คุณสมบัติการตรวจจับวลี
- sklearn_api.phrases - scikit เรียนรู้ wrapper สำหรับวลี (การจัดระเบียบ) การตรวจจับ
TFIDF
- TF-IDF
- sklearn.feature_extraction.text.tfidfVectorizer
การฝังคำ
- การฝังคำ
- ถุงมือ: เวกเตอร์ทั่วโลกสำหรับการเป็นตัวแทนคำ
- Gensim: models.word2vec - Word2vec Embeddings
- Fastext
- Word2vec และ fasttext คำที่ฝังด้วย gensim
- การฝังตัวก่อนหน้านี้ทำให้คุณมีขอบพิเศษหรือไม่?
subword embeddings
- การฝังคำย่อยที่ผ่านการฝึกอบรมมาล่วงหน้าใน 275 ภาษาโดยใช้การเข้ารหัสไบต์คู่ (BPE)
คุณสมบัติลวดลาย
- Cleartk - การสอนการแยกฟีเจอร์
- การแสดงออกปกติ
คุณสมบัติพจนานุกรม
- การรับรู้เอนทิตีที่มีชื่อว่า LSTM-CNNS แบบสองทิศทาง (ARXIV: 1511.08308)
คุณสมบัติ POS
- ส่วนหนึ่งของ speech_tagging
- NLTK จัดหมวดหมู่และการติดแท็กคำ
- วิธีใช้คุณสมบัติ POS ใน Scikit Learn Classfiers
ข้อมูลภาพ
คุณสมบัติอัลกอริทึมการมองเห็นคอมพิวเตอร์
- การแยกคุณสมบัติและการค้นหาภาพที่คล้ายกันด้วย OpenCV สำหรับมือใหม่
- OpenCV - การตรวจจับคุณสมบัติและคำอธิบาย
- แพ็คเกจ SimpleCv.Features
- โมดูลคุณสมบัติ Scikit-Image
คุณสมบัติสถิติภาพ
คุณสมบัติ OCR
- เสื้อคลุม Python สำหรับ Google Tesseract
คุณสมบัติการเรียนรู้ลึก
- Keras รุ่นที่ผ่านการฝึกอบรมมาก่อน
- การใช้โมเดลที่ผ่านการฝึกอบรมล่วงหน้าของ Keras สำหรับการแยกคุณสมบัติในการจัดกลุ่มรูปภาพ
ข้อมูลหมวดหมู่
- การทำความเข้าใจวิศวกรรมคุณลักษณะ (ส่วนที่ 2) - ข้อมูลหมวดหมู่
การเข้ารหัสร้อนหนึ่งครั้ง
- เหตุใดจึงต้องเข้ารหัสข้อมูลหนึ่งในการเรียนรู้ของเครื่อง
- วิธีหนึ่งข้อมูลลำดับการเข้ารหัสร้อนใน Python
- sklearn.preprocessing.onehotencoder
- keras - to_categorical
นับการเข้ารหัส
- วิศวกรรมคุณลักษณะ: การเข้ารหัสนับ
การเข้ารหัสฉลาก
- การเข้ารหัสฉลากใน scikit-learn
- วิศวกรรมคุณลักษณะ: การเข้ารหัสฉลาก
การเข้ารหัสจำลอง
- การเข้ารหัสจำลอง: อย่างไรและทำไม
- pandas.get_dummies
- หนึ่งร้อนกับการเข้ารหัสหุ่นจำลอง
หมายถึงการเข้ารหัส
- การเข้ารหัสความน่าจะเป็นของคุณสมบัติหมวดหมู่
- การเข้ารหัสเป้าหมาย Python สำหรับคุณสมบัติหมวดหมู่
- การเพิ่มคอลัมน์ความแปรปรวนเมื่อค่าเฉลี่ยการเข้ารหัส
การแฮม
- ฟีเจอร์แฮชบนวิกิพีเดีย
- คุณสมบัติการแฮชและการสกัดใน vowpalwabbit
- ฟีเจอร์แฮชใน scikit-learn
ข้อมูลอนุกรมเวลา
- การแยกคุณสมบัติที่เกี่ยวข้องโดยอัตโนมัติจากอนุกรมเวลา
- วิศวกรรมคุณสมบัติพื้นฐานพร้อมข้อมูลอนุกรมเวลาใน Python
คุณสมบัติหน้าต่างกลิ้ง
คุณสมบัติล่าช้า
- ใช้แพนด้าเพื่อล้าหลังข้อมูล Timeseries ของคุณเพื่อตรวจสอบความสัมพันธ์เชิงสาเหตุ
ข้อมูลเชิงพื้นที่
- วิศวกรรมคุณสมบัติเชิงพื้นที่และการสร้างภาพข้อมูล
- แนะนำข้อมูลเชิงพื้นที่โดยใช้ Python
กลับไปด้านบน