ดาวน์โหลด awesome datascience - ดาวน์โหลดซอร์สโค้ด awesome datascience

วิทยาศาสตร์ข้อมูลที่ยอดเยี่ยม

พื้นที่เก็บข้อมูลวิทยาศาสตร์โอเพนซอร์ซเพื่อเรียนรู้และนำไปใช้ในการแก้ปัญหาในโลกแห่งความเป็นจริง

นี่เป็นเส้นทางทางลัดในการเริ่มเรียน วิทยาศาสตร์ข้อมูล เพียงทำตามขั้นตอนเพื่อตอบคำถาม "วิทยาศาสตร์ข้อมูลคืออะไรและฉันควรเรียนรู้อะไรเพื่อเรียนรู้วิทยาศาสตร์ข้อมูล"

ผู้สนับสนุน

ผู้สนับสนุน	ขว้าง
-	เป็นคนแรกที่สปอนเซอร์! `[email protected]`

สารบัญ

วิทยาศาสตร์ข้อมูลคืออะไร?
ฉันจะเริ่มที่ไหน?
ทรัพยากรการฝึกอบรม
- บทเรียน
- หลักสูตรฟรี
- เปิดหลักสูตรออนไลน์อย่างหนาแน่น
- โปรแกรมเข้มข้น
- วิทยาลัย
กล่องเครื่องมือวิทยาศาสตร์ข้อมูล
- อัลกอริทึม
  - การเรียนรู้ภายใต้การดูแล
  - การเรียนรู้ที่ไม่ได้รับการดูแล
  - การเรียนรู้แบบกึ่งผู้ดูแล
  - การเรียนรู้เสริมแรง
  - อัลกอริทึมการขุดข้อมูล
  - สถาปัตยกรรมการเรียนรู้ลึก
- แพ็คเกจการเรียนรู้ของเครื่องทั่วไป
- แพ็คเกจการเรียนรู้ลึก
  - ระบบนิเวศ Pytorch
  - ระบบนิเวศ Tensorflow
  - ระบบนิเวศ Keras
- เครื่องมือสร้างภาพ
- เครื่องมือเบ็ดเตล็ด
วรรณกรรมและสื่อ
- หนังสือ
  - ข้อเสนอหนังสือ (ในเครือ)
- วารสารสิ่งพิมพ์และนิตยสาร
- จดหมายข่าว
- ผู้เขียนบล็อก
- การนำเสนอ
- พอดคาสต์
- วิดีโอและช่อง YouTube
เข้าสังคม
- บัญชี Facebook
- บัญชี Twitter
- ช่องโทรเลข
- ชุมชนหย่อน
- กลุ่ม GitHub
- การแข่งขันด้านวิทยาศาสตร์ข้อมูล
สนุก
- อินโฟกราฟิกส์
- ชุดข้อมูล
- การ์ตูน
รายการอื่น ๆ ที่ยอดเยี่ยม
- งานอดิเรก

วิทยาศาสตร์ข้อมูลคืออะไร?

^ back to top ^

Data Science เป็นหนึ่งในหัวข้อที่ร้อนแรงที่สุดในคอมพิวเตอร์และอินเทอร์เน็ตฟาร์มในปัจจุบัน ผู้คนได้รวบรวมข้อมูลจากแอปพลิเคชันและระบบจนถึงวันนี้และตอนนี้เป็นเวลาที่จะวิเคราะห์ ขั้นตอนต่อไปคือการสร้างคำแนะนำจากข้อมูลและสร้างการคาดการณ์เกี่ยวกับอนาคต ที่นี่คุณสามารถค้นหาคำถามที่ใหญ่ที่สุดสำหรับ วิทยาศาสตร์ข้อมูล และคำตอบหลายร้อยคำตอบจากผู้เชี่ยวชาญ

การเชื่อมโยง	ดูตัวอย่าง
Data Science @ O'Reilly คืออะไร	นักวิทยาศาสตร์ด้านข้อมูลรวมผู้ประกอบการด้วยความอดทนความเต็มใจที่จะสร้างผลิตภัณฑ์ข้อมูลเพิ่มขึ้นความสามารถในการสำรวจและความสามารถในการทำซ้ำผ่านโซลูชัน พวกเขาเป็นสหวิทยาการโดยเนื้อแท้ พวกเขาสามารถแก้ไขปัญหาได้ทุกด้านตั้งแต่การรวบรวมข้อมูลเริ่มต้นและการปรับอากาศข้อมูลไปจนถึงการสรุปข้อสรุป พวกเขาสามารถคิดนอกกรอบเพื่อหาวิธีใหม่ ๆ ในการดูปัญหาหรือทำงานกับปัญหาที่กำหนดไว้อย่างกว้างขวาง:“ นี่คือข้อมูลจำนวนมากคุณสามารถทำอะไรได้บ้าง”
Data Science @ Quora คืออะไร	Data Science เป็นการรวมกันของข้อมูลหลายแง่มุมเช่นเทคโนโลยีการพัฒนาอัลกอริทึมและการรบกวนข้อมูลเพื่อศึกษาข้อมูลวิเคราะห์และค้นหาวิธีแก้ปัญหาที่เป็นนวัตกรรมสำหรับปัญหาที่ยากลำบาก โดยทั่วไปวิทยาศาสตร์ข้อมูลคือทั้งหมดที่เกี่ยวกับการวิเคราะห์ข้อมูลและผลักดันการเติบโตของธุรกิจโดยการหาวิธีที่สร้างสรรค์
งานที่เซ็กซี่ที่สุดของศตวรรษที่ 21	นักวิทยาศาสตร์ด้านข้อมูลในปัจจุบันคล้ายกับ“ quants” ของ Wall Street ในปี 1980 และ 1990 ในสมัยนั้นผู้คนที่มีภูมิหลังทางฟิสิกส์และคณิตศาสตร์สตรีมไปยังธนาคารเพื่อการลงทุนและกองทุนป้องกันความเสี่ยงซึ่งพวกเขาสามารถกำหนดอัลกอริทึมใหม่และกลยุทธ์ข้อมูลทั้งหมด จากนั้นมหาวิทยาลัยที่หลากหลายได้พัฒนาโปรแกรมปริญญาโทด้านวิศวกรรมการเงินซึ่งทำให้ความสามารถรุ่นที่สองสามารถเข้าถึงได้มากขึ้นสำหรับ บริษัท หลัก รูปแบบถูกทำซ้ำในภายหลังในปี 1990 กับวิศวกรการค้นหาซึ่งมีทักษะที่หายากมาเร็ว ๆ นี้ได้รับการสอนในโปรแกรมวิทยาศาสตร์คอมพิวเตอร์
วิกิพีเดีย	Data Science เป็นสาขาวิชาสหวิทยาการที่ใช้วิธีการทางวิทยาศาสตร์กระบวนการอัลกอริทึมและระบบเพื่อแยกความรู้และข้อมูลเชิงลึกจากข้อมูลโครงสร้างและไม่มีโครงสร้างจำนวนมาก วิทยาศาสตร์ข้อมูลเกี่ยวข้องกับการขุดข้อมูลการเรียนรู้ของเครื่องและข้อมูลขนาดใหญ่
วิธีการเป็นนักวิทยาศาสตร์ข้อมูล	นักวิทยาศาสตร์ด้านข้อมูลเป็น Wranglers ข้อมูลขนาดใหญ่รวบรวมและวิเคราะห์ชุดข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างขนาดใหญ่ บทบาทของนักวิทยาศาสตร์ข้อมูลรวมวิทยาศาสตร์คอมพิวเตอร์สถิติและคณิตศาสตร์ พวกเขาวิเคราะห์ประมวลผลและข้อมูลแบบจำลองจากนั้นตีความผลลัพธ์เพื่อสร้างแผนการดำเนินการสำหรับ บริษัท และองค์กรอื่น ๆ
ประวัติความเป็นมาสั้น ๆ ของ #datascience	เรื่องราวของวิธีการที่นักวิทยาศาสตร์ข้อมูลกลายเป็นเซ็กซี่ส่วนใหญ่เป็นเรื่องราวของการมีเพศสัมพันธ์ของวินัยที่เป็นผู้ใหญ่ของสถิติด้วยวิทยาศาสตร์ที่อายุน้อยมาก-คอมพิวเตอร์ คำว่า "วิทยาศาสตร์ข้อมูล" ได้เกิดขึ้นเมื่อเร็ว ๆ นี้เพื่อกำหนดอาชีพใหม่ที่คาดว่าจะทำให้เข้าใจถึงร้านค้าขนาดใหญ่ที่กว้างใหญ่ แต่การทำความเข้าใจกับข้อมูลมีประวัติอันยาวนานและได้รับการพูดคุยกันโดยนักวิทยาศาสตร์นักสถิติบรรณารักษ์นักวิทยาศาสตร์คอมพิวเตอร์และคนอื่น ๆ มานานหลายปี ไทม์ไลน์ต่อไปนี้ติดตามวิวัฒนาการของคำว่า "วิทยาศาสตร์ข้อมูล" และการใช้งานพยายามกำหนดและคำที่เกี่ยวข้อง
ทรัพยากรการพัฒนาซอฟต์แวร์สำหรับนักวิทยาศาสตร์ข้อมูล	นักวิทยาศาสตร์ด้านข้อมูลให้ความสำคัญกับการทำความเข้าใจกับข้อมูลผ่านการวิเคราะห์เชิงสำรวจสถิติและแบบจำลอง นักพัฒนาซอฟต์แวร์ใช้ชุดความรู้แยกต่างหากด้วยเครื่องมือต่าง ๆ แม้ว่าการมุ่งเน้นของพวกเขาอาจดูเหมือนไม่เกี่ยวข้อง แต่ทีมวิทยาศาสตร์ข้อมูลจะได้รับประโยชน์จากการใช้แนวทางปฏิบัติที่ดีที่สุดในการพัฒนาซอฟต์แวร์ การควบคุมเวอร์ชันการทดสอบอัตโนมัติและทักษะการพัฒนาอื่น ๆ ช่วยสร้างรหัสและเครื่องมือที่ทำซ้ำได้
แผนงานนักวิทยาศาสตร์ด้านข้อมูล	Data Science เป็นตัวเลือกอาชีพที่ยอดเยี่ยมในโลกที่ขับเคลื่อนด้วยข้อมูลในปัจจุบันซึ่งมีการสร้างข้อมูลประมาณ 328.77 ล้านเทราไบต์ทุกวัน และจำนวนนี้เพิ่มขึ้นทุกวันซึ่งจะเพิ่มความต้องการนักวิทยาศาสตร์ข้อมูลที่มีทักษะซึ่งสามารถใช้ข้อมูลนี้เพื่อผลักดันการเติบโตของธุรกิจ
การนำทางของคุณไปสู่การเป็นนักวิทยาศาสตร์ข้อมูล	_data Science เป็นหนึ่งในอาชีพที่เป็นที่ต้องการมากที่สุดในปัจจุบัน ด้วยธุรกิจที่ต้องพึ่งพาข้อมูลมากขึ้นในการตัดสินใจความต้องการนักวิทยาศาสตร์ข้อมูลที่มีทักษะได้เติบโตขึ้นอย่างรวดเร็ว ไม่ว่าจะเป็น บริษัท เทคโนโลยีองค์กรด้านการดูแลสุขภาพหรือแม้แต่สถาบันรัฐบาลนักวิทยาศาสตร์ด้านข้อมูลมีบทบาทสำคัญในการเปลี่ยนข้อมูลดิบให้เป็นข้อมูลเชิงลึกที่มีค่า แต่คุณจะเป็นนักวิทยาศาสตร์ข้อมูลได้อย่างไรโดยเฉพาะอย่างยิ่งถ้าคุณเพิ่งเริ่มต้น? -

ฉันจะเริ่มที่ไหน?

^ back to top ^

ในขณะที่ไม่จำเป็นอย่างเคร่งครัดการมีภาษาการเขียนโปรแกรมเป็นทักษะที่สำคัญที่จะมีประสิทธิภาพในฐานะนักวิทยาศาสตร์ด้านข้อมูล ปัจจุบันภาษาที่ได้รับความนิยมมากที่สุดคือ Python ตามด้วย R Python เป็นภาษาสคริปต์ที่มีวัตถุประสงค์ทั่วไปที่เห็นแอปพลิเคชันในหลากหลายสาขา R เป็นภาษาเฉพาะโดเมนสำหรับสถิติซึ่งมีเครื่องมือสถิติทั่วไปจำนวนมากนอกกรอบ

Python เป็นภาษาที่ได้รับความนิยมมากที่สุดในด้านวิทยาศาสตร์เนื่องจากไม่ได้เป็นส่วนเล็ก ๆ ที่สามารถใช้งานได้และระบบนิเวศที่มีชีวิตชีวาของแพ็คเกจที่ผู้ใช้สร้างขึ้น ในการติดตั้งแพ็คเกจมีสองวิธีหลัก: PIP (เรียกใช้เป็น pip install ) ตัวจัดการแพ็คเกจที่มาพร้อมกับ Python และ Anaconda (เรียกใช้เป็น conda install ) ตัวจัดการแพ็คเกจที่ทรงพลังที่สามารถติดตั้งแพ็คเกจสำหรับ Python, R และสามารถดาวน์โหลด

แตกต่างจาก R, Python ไม่ได้ถูกสร้างขึ้นจากพื้นดินโดยคำนึงถึงวิทยาศาสตร์ข้อมูล แต่มีห้องสมุดบุคคลที่สามมากมายที่จะทำสิ่งนี้ รายการแพ็คเกจที่ละเอียดถี่ถ้วนยิ่งขึ้นสามารถพบได้ในภายหลังในเอกสารนี้ แต่แพ็คเกจทั้งสี่นี้เป็นชุดของตัวเลือกที่ดีในการเริ่มต้นการเดินทางทางวิทยาศาสตร์ข้อมูลของคุณด้วย: Scikit-Learn เป็นแพ็คเกจวิทยาศาสตร์ข้อมูลวัตถุประสงค์ทั่วไปซึ่งใช้อัลกอริทึมที่ได้รับความนิยมมากที่สุด แม้ว่าคุณต้องการเขียนการใช้งานของคุณเอง Scikit-Learn เป็นข้อมูลอ้างอิงที่มีค่าสำหรับถั่วและโบลท์ที่อยู่เบื้องหลังอัลกอริทึมทั่วไปที่คุณจะพบ ด้วย pandas หนึ่งสามารถรวบรวมและวิเคราะห์ข้อมูลของพวกเขาในรูปแบบตารางที่สะดวก Numpy ให้เครื่องมือที่รวดเร็วมากสำหรับการดำเนินการทางคณิตศาสตร์โดยมุ่งเน้นไปที่เวกเตอร์และเมทริกซ์ Seborn ซึ่งขึ้นอยู่กับแพ็คเกจ Matplotlib เป็นวิธีที่รวดเร็วในการสร้างการสร้างภาพข้อมูลที่สวยงามของข้อมูลของคุณโดยมีค่าเริ่มต้นที่ดีมากมายที่มีอยู่นอกกรอบรวมถึงแกลเลอรี่ที่แสดงวิธีการสร้างการสร้างภาพข้อมูลทั่วไปของข้อมูลของคุณ

เมื่อเริ่มต้นการเดินทางของคุณเพื่อเป็นนักวิทยาศาสตร์ข้อมูลการเลือกภาษาไม่สำคัญอย่างยิ่งและทั้ง Python และ R มีข้อดีและข้อเสียของพวกเขา เลือกภาษาที่คุณชอบและตรวจสอบหนึ่งในหลักสูตรฟรีที่เราระบุไว้ด้านล่าง!

โลกแห่งความจริง

^ back to top ^

Data Science เป็นเครื่องมือที่ทรงพลังที่ใช้ในสาขาต่าง ๆ เพื่อแก้ปัญหาในโลกแห่งความเป็นจริงโดยการแยกข้อมูลเชิงลึกและรูปแบบจากข้อมูลที่ซับซ้อน

ภัยพิบัติ

^ back to top ^

DEPREM-ML AYA: AçıkYazılımAğı (+นักพัฒนา+25K) กำลังพยายามช่วยตอบสนองต่อภัยพิบัติโดยใช้ปัญญาประดิษฐ์ ทุกอย่างเปิดกว้าง AFET.org

ทรัพยากรการฝึกอบรม

^ back to top ^

คุณเรียนรู้วิทยาศาสตร์ข้อมูลได้อย่างไร? โดยการทำวิทยาศาสตร์ข้อมูลแน่นอน! โอเคโอเค - นั่นอาจไม่เป็นประโยชน์อย่างยิ่งเมื่อคุณเริ่มต้นครั้งแรก ในส่วนนี้เราได้ระบุแหล่งข้อมูลการเรียนรู้บางอย่างตามลำดับจากความมุ่งมั่นอย่างน้อยไปจนถึงความมุ่งมั่นที่ยิ่งใหญ่ที่สุด - แบบฝึกหัดหลักสูตรออนไลน์ที่เปิดกว้าง (MOOCs) โปรแกรมที่เข้มข้นและวิทยาลัย

บทเรียน

^ back to top ^

โครงการวิทยาศาสตร์ข้อมูล 1,000 โครงการคุณสามารถทำงานบนเบราว์เซอร์ด้วย ipython
#tidytuesday โครงการข้อมูลรายสัปดาห์มุ่งเป้าไปที่ระบบนิเวศ R
วิทยาศาสตร์ข้อมูลในแบบของคุณ
Pyspark Cheatsheet
การเรียนรู้ของเครื่องวิทยาศาสตร์ข้อมูลและการเรียนรู้อย่างลึกซึ้งกับ Python
วิธีการติดฉลากข้อมูล
คำแนะนำของคุณเกี่ยวกับการจัดสรร Dirichlet แฝง
หลักสูตรวิทยาศาสตร์ข้อมูลวิทยาศาสตร์มากกว่า 1,000 หลักสูตรที่เครื่องมือค้นหาออนไลน์ Classpert
บทเรียนของซอร์สโค้ดจากอัลกอริทึมทางพันธุกรรมของหนังสือกับ Python โดย Clinton Sheppard
บทเรียนเพื่อเริ่มต้นการประมวลผลสัญญาณสำหรับการเรียนรู้ของเครื่องจักร
บทช่วยสอนการปรับใช้แบบเรียลไทม์เกี่ยวกับการปรับใช้แบบจำลองอนุกรมเวลา Python
Python for Data Science: คู่มือผู้เริ่มต้น
แผนการศึกษาขั้นต่ำที่เป็นไปได้สำหรับการสัมภาษณ์การเรียนรู้ของเครื่องจักร
เข้าใจและรู้จักวิศวกรรมการเรียนรู้ของเครื่องโดยการสร้างโครงการที่เป็นของแข็ง
12 โครงการวิทยาศาสตร์ข้อมูลฟรีเพื่อฝึก Python และ Pandas
CV/ประวัติย่อที่ดีที่สุดสำหรับนักวิทยาศาสตร์ข้อมูล Freshers
ทำความเข้าใจหลักสูตรวิทยาศาสตร์ข้อมูลใน Java
คำถามสัมภาษณ์ Data Analytics (เริ่มต้นสู่ขั้นสูง)
คำถามและคำตอบทางวิทยาศาสตร์ข้อมูล 100+ อันดับแรก

หลักสูตรฟรี

^ back to top ^

นักวิทยาศาสตร์ข้อมูลด้วย R
นักวิทยาศาสตร์ด้านข้อมูลด้วย Python
อัลกอริทึมทางพันธุกรรมหลักสูตร OCW
แผนงาน AI ผู้เชี่ยวชาญ - แผนงานเพื่อเป็นผู้เชี่ยวชาญด้านปัญญาประดิษฐ์
การเพิ่มประสิทธิภาพนูน - การเพิ่มประสิทธิภาพแบบนูน (พื้นฐานของการวิเคราะห์นูน; กำลังสองน้อยที่สุด, โปรแกรมเชิงเส้นและกำลังสอง, การเขียนโปรแกรม semidefinite, minimax, ปริมาณมากและปัญหาอื่น ๆ ; เงื่อนไขการเพิ่มประสิทธิภาพ, ทฤษฎีคู่ ... )
Skillcombo - วิทยาศาสตร์ข้อมูล - หลักสูตรวิทยาศาสตร์ข้อมูลออนไลน์ฟรี 1,000 รายการ
การเรียนรู้จากข้อมูล - บทนำสู่การเรียนรู้ของเครื่องครอบคลุมทฤษฎีพื้นฐานอัลกอริทึมและแอปพลิเคชัน
Kaggle - เรียนรู้เกี่ยวกับวิทยาศาสตร์ข้อมูลการเรียนรู้ของเครื่อง Python ฯลฯ
พื้นฐานการสังเกต ML - เรียนรู้วิธีการตรวจสอบและการผลิตรูตสาเหตุของปัญหา ML
น้ำหนักและอคติ Mlops ที่มีประสิทธิภาพ: การพัฒนาแบบจำลอง-หลักสูตรฟรีและการรับรองสำหรับการสร้างเครื่องจักรแบบครบวงจรโดยใช้ W & B
Python for Machine Learning - เริ่มต้นการเดินทางไปเรียนรู้ด้วยเครื่องด้วย Python ซึ่งเป็นหนึ่งในภาษาการเขียนโปรแกรมที่ทรงพลังที่สุด
Python for Data Science โดย Scaler - หลักสูตรนี้ได้รับการออกแบบมาเพื่อเพิ่มขีดความสามารถให้กับผู้เริ่มต้นด้วยทักษะที่จำเป็นในการเก่งในโลกที่ขับเคลื่อนด้วยข้อมูลในปัจจุบัน หลักสูตรที่ครอบคลุมจะช่วยให้คุณมีรากฐานที่แข็งแกร่งในด้านสถิติการเขียนโปรแกรมการสร้างภาพข้อมูลและการเรียนรู้ของเครื่อง
MLSYS-NYU-20122-สไลด์สคริปต์และวัสดุสำหรับการเรียนรู้ของเครื่องจักรในหลักสูตรการเงินที่ NYU Tandon, 2022
รถไฟบนรถไฟและปรับใช้ ML-หลักสูตรบนมือเพื่อฝึกอบรมและปรับใช้ API Serverless ที่ทำนายราคา crypto
LLMOPS: การสร้างแอพพลิเคชั่นในโลกแห่งความเป็นจริงด้วยรูปแบบภาษาขนาดใหญ่ - เรียนรู้ที่จะสร้างซอฟต์แวร์ที่ทันสมัยด้วย LLMS โดยใช้เครื่องมือและเทคนิคใหม่ล่าสุดในสนาม
วิศวกรรมที่รวดเร็วสำหรับโมเดลการมองเห็น - เรียนรู้ที่จะแจ้งให้โมเดลการมองเห็นคอมพิวเตอร์ที่ทันสมัยพร้อมภาษาธรรมชาติ, จุดประสานงาน, กล่องขอบเขต, มาสก์การแบ่งส่วนและแม้แต่ภาพอื่น ๆ ในหลักสูตรฟรีนี้จาก deeplearning.ai
หลักสูตรวิทยาศาสตร์ข้อมูลโดย IBM - ทรัพยากรฟรีและเรียนรู้ว่าวิทยาศาสตร์ข้อมูลคืออะไรและใช้ในอุตสาหกรรมที่แตกต่างกันอย่างไร

MOOC's

^ back to top ^

Coursera บทนำสู่วิทยาศาสตร์ข้อมูล
วิทยาศาสตร์ข้อมูล - หลักสูตร 9 ขั้นตอนความเชี่ยวชาญใน Coursera
Data Mining - 5 ขั้นตอนหลักสูตรความเชี่ยวชาญใน Coursera
การเรียนรู้ของเครื่อง - หลักสูตร 5 ขั้นตอนความเชี่ยวชาญเกี่ยวกับ Coursera
วิทยาศาสตร์ข้อมูล CS 109
OpenIntro
CS 171 การสร้างภาพข้อมูล
กระบวนการขุด: วิทยาศาสตร์ข้อมูลในการดำเนินการ
การเรียนรู้อย่างลึกซึ้งออกซ์ฟอร์ด
Oxford Deep Learning - วิดีโอ
การเรียนรู้ของเครื่องออกซ์ฟอร์ด
การเรียนรู้ของเครื่อง UBC - วิดีโอ
ความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูล
ความเชี่ยวชาญด้านข้อมูลขนาดใหญ่ของ Coursera
การคิดเชิงสถิติสำหรับวิทยาศาสตร์ข้อมูลและการวิเคราะห์โดย EDX
ความรู้ความเข้าใจระดับ AI โดย IBM
Udacity - การเรียนรู้อย่างลึกซึ้ง
Keras ในการเคลื่อนไหว
โปรแกรม Microsoft Professional สำหรับวิทยาศาสตร์ข้อมูล
comp3222/comp6246 - เทคโนโลยีการเรียนรู้ของเครื่อง
CS 231 - เครือข่ายประสาทเทียมสำหรับการจดจำภาพ
Coursera tensorflow ในทางปฏิบัติ
ความเชี่ยวชาญในการเรียนรู้อย่างลึกซึ้งของ Coursera
365 หลักสูตรวิทยาศาสตร์ข้อมูล
ความเชี่ยวชาญด้านการประมวลผลภาษาธรรมชาติของ Coursera
ความเชี่ยวชาญเฉพาะด้านของ Coursera Gan
วิทยาศาสตร์ข้อมูลของ Codecademy
พีชคณิตเชิงเส้น - หลักสูตรพีชคณิตเชิงเส้นโดย Gilbert Strang
วิสัยทัศน์ของพีชคณิตเชิงเส้นปี 2020 (G. Strang)
Python สำหรับหลักสูตรมูลนิธิวิทยาศาสตร์ข้อมูล
วิทยาศาสตร์ข้อมูล: สถิติและการเรียนรู้ของเครื่องจักร
วิศวกรรมการเรียนรู้ของเครื่องจักรเพื่อการผลิต (MLOPS)
ความเชี่ยวชาญของระบบแนะนำจาก University of Minnesota เป็นความเชี่ยวชาญระดับกลาง/ระดับสูงที่มุ่งเน้นไปที่ระบบผู้แนะนำบนแพลตฟอร์ม Coursera
โปรแกรมวิชาชีพปัญญาประดิษฐ์ของสแตนฟอร์ด
นักวิทยาศาสตร์ด้านข้อมูลด้วย Python
การเขียนโปรแกรมกับจูเลีย
Scaler Data Science & Program
แผนผังทักษะวิทยาศาสตร์ข้อมูล
วิทยาศาสตร์ข้อมูลสำหรับผู้เริ่มต้น - เรียนรู้กับครูสอนพิเศษ AI
การเรียนรู้ของเครื่องจักรสำหรับผู้เริ่มต้น - เรียนรู้ด้วย AI Tutor

โปรแกรมเข้มข้น

^ back to top ^

S2DS

วิทยาลัย

^ back to top ^

รายชื่อวิทยาลัยและมหาวิทยาลัยที่เปิดสอนสาขาวิทยาศาสตร์ข้อมูล
ข้อมูลวิทยาศาสตร์ข้อมูล @ Berkeley
ปริญญาวิทยาศาสตร์ข้อมูล @ UVA
ปริญญาวิทยาศาสตร์ข้อมูล @ Wisconsin
BS ในด้านวิทยาศาสตร์ข้อมูลและแอปพลิเคชัน
MS ในระบบข้อมูลคอมพิวเตอร์ @ Boston University
MS ใน Business Analytics @ ASU ออนไลน์
MS ใน Science Data Applied @ Syracuse
MS Management & Data Science @ Leuphana
Master of Data Science @ Melbourne University
MSC ใน Data Science @ University of Edinburgh
Master of Management Analytics @ Queen's University
Master of Data Science @ Illinois Institute of Technology
ปริญญาโทสาขาวิทยาศาสตร์ประยุกต์ @ มหาวิทยาลัยมิชิแกน
วิทยาศาสตร์ข้อมูลหลักและปัญญาประดิษฐ์ @ Eindhoven University of Technology
ปริญญาโทสาขาวิทยาศาสตร์ข้อมูลและวิศวกรรมคอมพิวเตอร์ @ University of Granada

กล่องเครื่องมือวิทยาศาสตร์ข้อมูล

^ back to top ^

ส่วนนี้เป็นชุดของแพ็คเกจเครื่องมืออัลกอริทึมและรายการที่มีประโยชน์อื่น ๆ ในโลกวิทยาศาสตร์ข้อมูล

อัลกอริทึม

^ back to top ^

นี่คืออัลกอริทึมการเรียนรู้ของเครื่องและการขุดข้อมูลและแบบจำลองช่วยให้คุณเข้าใจข้อมูลของคุณและได้รับความหมายจากมัน

ระบบการเรียนรู้ของเครื่องสามชนิด

ขึ้นอยู่กับการฝึกอบรมกับการกำกับดูแลของมนุษย์
ขึ้นอยู่กับการเรียนรู้ที่เพิ่มขึ้นอย่างต่อเนื่อง
ขึ้นอยู่กับการเปรียบเทียบจุดข้อมูลและการตรวจจับรูปแบบ

การเปรียบเทียบ

Datacompy - Datacompy เป็นแพ็คเกจที่จะเปรียบเทียบสองแพนด้า dataframes

การเรียนรู้ภายใต้การดูแล

การถดถอย
การถดถอยเชิงเส้น
กำลังสองน้อยที่สุด
การถดถอยโลจิสติก
การถดถอยแบบขั้นตอน
เส้นโค้งการถดถอยแบบปรับตัวหลายตัวแปร
การถดถอย Softmax
การกระจายแบบ scatterplot โดยประมาณในพื้นที่
การจำแนกประเภท
- เพื่อนบ้าน k-nearest
- สนับสนุนเครื่องเวกเตอร์
- ต้นไม้ตัดสินใจ
- อัลกอริทึม ID3
- อัลกอริทึม C4.5
การเรียนรู้ทั้งมวล
- การสนับสนุน
- การซ้อนกัน
- การใส่กระเป๋า
- ป่าสุ่ม
- adaboost

การเรียนรู้ที่ไม่ได้รับการดูแล

การจัดกลุ่ม
- การจัดกลุ่ม
- k-means
- การจัดกลุ่มตามความหนาแน่น
- การจัดกลุ่มที่คลุมเครือ
- รุ่นผสม
การลดขนาด
- การวิเคราะห์องค์ประกอบหลัก (PCA)
- T-Sne; T-Distributed Stochastic Neighbor Embedding
- การวิเคราะห์ปัจจัย
- การจัดสรร Dirichlet แฝง (LDA)
เครือข่ายประสาท
แผนที่จัดระเบียบตนเอง
ทฤษฎีการสั่นพ้องแบบปรับตัว
Hidden Markov Models (HMM)

การเรียนรู้แบบกึ่งผู้ดูแล

S3VM
การจัดกลุ่ม
แบบจำลองการกำเนิด
การแยกความหนาแน่นต่ำ
การทำให้เป็นมาตรฐานของ Laplacian
วิธีการแก้ปัญหา

การเรียนรู้เสริมแรง

Q การเรียนรู้
อัลกอริทึม SARSA (การกระทำของรัฐ-การกระทำ
การเรียนรู้ที่แตกต่างชั่วคราว

อัลกอริทึมการขุดข้อมูล

C4.5
k-means
SVM (เครื่องเวกเตอร์รองรับ)
apriori
EM (ความคาดหวังสูงสุด)
เพกเกอร์
adaboost
KNN (เพื่อนบ้าน K-nearest)
เบย์ไร้เดียงสา
รถเข็น (การจำแนกประเภทและต้นไม้ถดถอย)

สถาปัตยกรรมการเรียนรู้ลึก

หลายชั้น perceptron
เครือข่ายประสาท Convolutional (CNN)
เครือข่ายประสาทกำเริบ (RNN)
เครื่อง Boltzmann
เครื่องดนตรีอัตโนมัติ
เครือข่ายฝ่ายตรงข้าม (GAN)
แผนที่ตนเอง
หม้อแปลงไฟฟ้า
เขตข้อมูลแบบสุ่มแบบมีเงื่อนไข (CRF)
การออกแบบระบบ ML)

แพ็คเกจการเรียนรู้ของเครื่องทั่วไป

^ back to top ^

Scikit-learn
Scikit-multilearn
Sklearn-Expertsys
รูปปั้น
การฟื้นฟู
seqlearn
Sklearn-Bayes
Sklearn-crfsuite
sklearn-deap
sigopt_sklearn
การประเมินผล Sklearn
scikit-image
scikit-opt
Scikit-Posthocs
เครื่องพาย
โชกุน
Xlearn
เคาะ
สาเหตุ
mlpack
mlxtend
เป็นโมฆะ
ประกายไฟ
hyperlearn
dlib
Imodels
กฎเกณฑ์
พาย
DeepChecks
ผู้รอดชีวิต
ตีความได้
xgboost
LightGBM
catboost
คนขี้ขลาด

แพ็คเกจการเรียนรู้ลึก

ระบบนิเวศ Pytorch

pytorch
คบเพลิง
Torchtext
ทอร์ชูดิโอ
ติดไฟ
Pytorchnet
คนขี้เกียจ
skorch
pyvarinf
pytorch_geometric
Gpytorch
ปัสสาวะ
ตัวเร่งปฏิกิริยา
pytorch_tabular
YOLOV3
YOLOV5
YOLOV8

ระบบนิเวศ Tensorflow

เทนเซอร์โฟลว์
เทนเซอร์เลย์
tflearn
โคลง
เทนเซอร์แพ็ค
trfl
polyaxon
คนใหม่
tfdeploy
Tensorflow-upstream
tensorflow พับ
เทนซอร์ลม
เทนเซอร์ไลท์
ตาข่าย
ลุดวิก
ตัวแทน TF
Tensorforce

ระบบนิเวศ Keras

เครส
Keras-Contrib
hyperas
ช้าง
Hera
สไปร์ทรัล
qkeras
Keras-RL
Talos

เครื่องมือสร้างภาพ

^ back to top ^

Altair
การเพิ่ม
Amcharts
anychart
โบเก้
ดาวหาง
Slemma
CartoDB
ลูกบาศก์
d3plus
เอกสารที่ขับเคลื่อนด้วยข้อมูล (D3JS)
Dygraphs
เสียงก้อง
จัดแสดง
Gephi
ggplot2
กาว
Google Chart Gallery
รถเข็น
นำเข้า.
jqplot
matplotlib
NVD3
Netron
Openrefine
พล็อต
ดิบ
resseract lite
สัตว์ทะเล
techanjs
เส้นเวลา
Variancecharts
Vida
Vizzu
ผู้เล่น
R2D3
Networkx
ทำซ้ำ
C3
Tensorwatch
Geomap
พุ่ง

เครื่องมือเบ็ดเตล็ด

^ back to top ^

การเชื่อมโยง	คำอธิบาย
กระบวนการวงจรชีวิตวิทยาศาสตร์ข้อมูล	กระบวนการ Lifecycle Data Science เป็นกระบวนการในการนำทีมวิทยาศาสตร์ข้อมูลจากแนวคิดไปสู่การให้ความสำคัญซ้ำ ๆ และยั่งยืน กระบวนการนี้ได้รับการบันทึกไว้ใน repo นี้
ข้อมูลวงจรชีวิตวิทยาศาสตร์ข้อมูล repo	ที่เก็บแม่แบบสำหรับโครงการวงจรชีวิตวิทยาศาสตร์ข้อมูล
rexmex	ห้องสมุดตัวชี้วัดผู้แนะนำผู้แนะนำวัตถุประสงค์เพื่อการประเมินผลอย่างเป็นธรรม
สารเคมี	ห้องสมุดการเรียนรู้เชิงลึกที่ใช้ Pytorch สำหรับการให้คะแนนคู่ยา
Pytorch Geometric ชั่วคราว	การเป็นตัวแทนการเรียนรู้บนกราฟแบบไดนามิก
ลูกบอลเล็ก ๆ	ไลบรารีการสุ่มตัวอย่างกราฟสำหรับ NetworkX ที่มี scikit-learn เช่น API
คาราเต้คลับ	ไลบรารีส่วนขยายการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแลสำหรับ NetworkX ด้วย Scikit-learn เช่น API
ML Workspace	IDE บนเว็บทั้งหมดสำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล เวิร์กสเปซถูกปรับใช้เป็นคอนเทนเนอร์ Docker และโหลดไว้ล่วงหน้าด้วยห้องสมุดวิทยาศาสตร์ข้อมูลยอดนิยมที่หลากหลาย (เช่น TensorFlow, Pytorch) และเครื่องมือ Dev (เช่น Jupyter, VS Code)
neptune.ai	แพลตฟอร์มที่เป็นมิตรกับชุมชนสนับสนุนนักวิทยาศาสตร์ด้านข้อมูลในการสร้างและแบ่งปันรูปแบบการเรียนรู้ของเครื่อง ดาวเนปจูนอำนวยความสะดวกในการทำงานเป็นทีมการจัดการโครงสร้างพื้นฐานการเปรียบเทียบแบบจำลองและการทำซ้ำ
แอบ	Lightweight, Python Library สำหรับการทดลองการเรียนรู้ของเครื่องที่รวดเร็วและทำซ้ำได้ แนะนำอินเทอร์เฟซที่ง่ายมากที่ช่วยให้การออกแบบท่อเรียนรู้ของเครื่องจักรที่สะอาด
Steppy-Toolkit	คอลเลกชันที่รวบรวมไว้ของเครือข่ายประสาทหม้อแปลงและโมเดลที่ทำให้การเรียนรู้ของเครื่องของคุณทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น
Datalab จาก Google	สำรวจสร้างภาพวิเคราะห์และแปลงข้อมูลได้อย่างง่ายดายโดยใช้ภาษาที่คุ้นเคยเช่น Python และ SQL แบบโต้ตอบ
Hortonworks Sandbox	เป็นสภาพแวดล้อม Hadoop แบบพกพาที่มาพร้อมกับบทช่วยสอน Hadoop แบบโต้ตอบหลายสิบ
R	เป็นสภาพแวดล้อมซอฟต์แวร์ฟรีสำหรับการคำนวณทางสถิติและกราฟิก
เป็นระเบียบ	เป็นคอลเลกชันที่มีความคิดเห็นของแพ็คเกจ R ที่ออกแบบมาสำหรับวิทยาศาสตร์ข้อมูล แพ็คเกจทั้งหมดมีปรัชญาการออกแบบพื้นฐานไวยากรณ์และโครงสร้างข้อมูล
rstudio	IDE - อินเทอร์เฟซผู้ใช้ที่ทรงพลังสำหรับ R เป็นฟรีและโอเพ่นซอร์สและทำงานบน Windows, Mac และ Linux
Python - Pandas - Anaconda	การกระจายงูหลามที่พร้อมใช้งานขององค์กรฟรีสำหรับการประมวลผลข้อมูลขนาดใหญ่การวิเคราะห์เชิงพยากรณ์และการคำนวณทางวิทยาศาสตร์
แพนด้า GUI	แพนด้า GUI
Scikit-learn	การเรียนรู้ของเครื่องจักรใน Python
นม	Numpy เป็นพื้นฐานสำหรับการคำนวณทางวิทยาศาสตร์กับ Python รองรับอาร์เรย์และเมทริกซ์ขนาดใหญ่หลายมิติและรวมถึงฟังก์ชั่นทางคณิตศาสตร์ระดับสูงเพื่อใช้งานในอาร์เรย์เหล่านี้
Vaex	VAEX เป็นไลบรารี Python ที่ให้คุณเห็นภาพชุดข้อมูลขนาดใหญ่และคำนวณสถิติด้วยความเร็วสูง
คนขี้เกียจ	Scipy ทำงานร่วมกับอาร์เรย์ NumPy และให้รูทีนที่มีประสิทธิภาพสำหรับการรวมตัวเลขและการเพิ่มประสิทธิภาพ
กล่องเครื่องมือวิทยาศาสตร์ข้อมูล	หลักสูตร Coursera
กล่องเครื่องมือวิทยาศาสตร์ข้อมูล	บล็อก
แพลตฟอร์มวิทยาศาสตร์ข้อมูล Wolfram	รับข้อมูลเชิงตัวเลขข้อความภาพ GIS หรือข้อมูลอื่น ๆ และให้การรักษา Wolfram ดำเนินการวิเคราะห์ข้อมูลวิทยาศาสตร์และการสร้างภาพข้อมูลอย่างเต็มรูปแบบ
ดาต้าด็อก	โซลูชันรหัสและ DevOps สำหรับวิทยาศาสตร์ข้อมูลระดับสูง
ความแปรปรวน	สร้างการสร้างภาพข้อมูลที่ทรงพลังสำหรับเว็บโดยไม่ต้องเขียน JavaScript
ชุดพัฒนาว่าว	ชุดพัฒนาซอฟต์แวร์ Kite (Apache License, Version 2.0) หรือ Kite สำหรับระยะสั้นคือชุดของห้องสมุดเครื่องมือตัวอย่างและเอกสารที่มุ่งเน้นไปที่การสร้างระบบบนระบบนิเวศ Hadoop ได้ง่ายขึ้น
Domino Data Labs	เรียกใช้สเกลแบ่งปันและปรับใช้โมเดลของคุณ - โดยไม่มีโครงสร้างพื้นฐานหรือการตั้งค่าใด ๆ
Apache Flink	แพลตฟอร์มสำหรับการประมวลผลข้อมูลที่มีประสิทธิภาพกระจายและมีวัตถุประสงค์ทั่วไป
Apache Hama	Apache Hama เป็นโครงการโอเพ่นซอร์สระดับบนสุดของ Apache ช่วยให้คุณทำการวิเคราะห์ขั้นสูงนอกเหนือจาก MapReduce
Weka	Weka เป็นชุดของอัลกอริทึมการเรียนรู้ของเครื่องสำหรับงานการขุดข้อมูล
อ็อกเทฟ	GNU Octave เป็นภาษาที่ตีความระดับสูงซึ่งส่วนใหญ่มีไว้สำหรับการคำนวณเชิงตัวเลข (ฟรี MATLAB)
Apache Spark	การคำนวณคลัสเตอร์ที่รวดเร็วฟ้าผ่า
Hydrosphere Mist	บริการสำหรับการเปิดเผยงาน Apache Spark Analytics และโมเดลการเรียนรู้ของเครื่องเป็นบริการแบบเรียลไทม์แบทช์หรือบริการเว็บแบบปฏิกิริยา
กลไกข้อมูล	แพลตฟอร์มวิทยาศาสตร์ข้อมูลและวิศวกรรมที่ทำให้ Apache จุดประกายให้นักพัฒนาเป็นมิตรและคุ้มค่ามากขึ้น
คาเฟอีน	กรอบการเรียนรู้ลึก
คบเพลิง	กรอบการคำนวณทางวิทยาศาสตร์สำหรับ luajit
กรอบการเรียนรู้เชิงลึกของ Python ของ Nervana	Intel® Nervana ™อ้างอิงกรอบการเรียนรู้ลึกที่มุ่งมั่นเพื่อประสิทธิภาพที่ดีที่สุดสำหรับฮาร์ดแวร์ทั้งหมด
สเก็ต	การประมวลผลข้อมูลแบบกระจายประสิทธิภาพสูงใน nodejs
ละอองลอย	แพ็คเกจการเรียนรู้ของเครื่องจักรที่สร้างขึ้นสำหรับมนุษย์
กรอบ Intel	กรอบการเรียนรู้ลึกIntel®
DataWrapper	แพลตฟอร์มการสร้างภาพข้อมูลโอเพ่นซอร์สช่วยให้ทุกคนสร้างแผนภูมิที่เรียบง่ายถูกต้องและฝังได้ นอกจากนี้ที่ github.com
เทนเซอร์	TensorFlow เป็นไลบรารีซอฟต์แวร์โอเพ่นซอร์สสำหรับ Machine Intelligence
ชุดเครื่องมือภาษาธรรมชาติ	ชุดเครื่องมือเบื้องต้น แต่ทรงพลังสำหรับการประมวลผลภาษาธรรมชาติและการจำแนกประเภท
ห้องปฏิบัติการคำอธิบายประกอบ	แพลตฟอร์ม No-Code แบบ end-to-end ฟรีสำหรับคำอธิบายประกอบข้อความและการฝึกอบรม/ปรับแต่งโมเดล DL การสนับสนุนนอกกรอบสำหรับการจดจำเอนทิตีที่มีชื่อการจำแนกการแยกความสัมพันธ์และสถานะการยืนยันจุดประกายโมเดล NLP การสนับสนุนไม่ จำกัด สำหรับผู้ใช้ทีมโครงการเอกสาร
nlp-toolkit สำหรับ node.js	โมดูลนี้ครอบคลุมหลักการและการใช้งาน NLP พื้นฐานบางอย่าง จุดสนใจหลักคือประสิทธิภาพ เมื่อเราจัดการกับตัวอย่างหรือข้อมูลการฝึกอบรมใน NLP เราจะหมดหน่วยความจำอย่างรวดเร็ว ดังนั้นการใช้งานทุกครั้งในโมดูลนี้จะถูกเขียนเป็นสตรีมเพื่อเก็บข้อมูลไว้ในหน่วยความจำที่ถูกประมวลผลในทุกขั้นตอน
จูเลีย	ภาษาการเขียนโปรแกรมแบบไดนามิกระดับสูงระดับสูงสำหรับการคำนวณทางเทคนิค
Ijulia	แบ็กเอนด์ภาษาจูเลียรวมกับสภาพแวดล้อมเชิงโต้ตอบของ Jupyter
Apache Zeppelin	สมุดบันทึกบนเว็บที่เปิดใช้งานการวิเคราะห์ข้อมูลแบบอินเทอร์แอคทีฟและเอกสารร่วมกันกับ SQL, Scala และอีกมากมาย
fileturetools	เฟรมเวิร์กโอเพ่นซอร์สสำหรับวิศวกรรมคุณลักษณะอัตโนมัติที่เขียนใน Python
Optimus	การทำความสะอาดการประมวลผลล่วงหน้าวิศวกรรมคุณลักษณะการวิเคราะห์ข้อมูลเชิงสำรวจและ ML ง่าย ๆ ด้วยแบ็กเอนด์ Pyspark
อัลบิวชั่น	ห้องสมุดการเสริมภาพที่รวดเร็วและเฟรมเวิร์กซึ่งใช้เทคนิคการเสริมที่หลากหลาย รองรับการจำแนกประเภทการแบ่งส่วนและการตรวจจับนอกกรอบ ถูกใช้เพื่อชนะการแข่งขันการเรียนรู้อย่างลึกซึ้งจำนวนมากที่ Kaggle, Topcoder และผู้ที่เป็นส่วนหนึ่งของการประชุมเชิงปฏิบัติการ CVPR
ดีวีดี	ระบบควบคุมเวอร์ชัน Data Science โอเพนซอร์ซ ช่วยติดตามจัดระเบียบและทำให้โครงการวิทยาศาสตร์ข้อมูลทำซ้ำได้ ในสถานการณ์พื้นฐานที่มากมันจะช่วยควบคุมเวอร์ชันและแบ่งปันไฟล์ข้อมูลขนาดใหญ่และโมเดล
ลัมโด	เป็นเอ็นจิ้นเวิร์กโฟลว์ที่ทำให้การวิเคราะห์ข้อมูลง่ายขึ้นอย่างมีนัยสำคัญโดยการรวมในการวิเคราะห์หนึ่งไปป์ไลน์ (I) คุณลักษณะวิศวกรรมและการเรียนรู้ของเครื่อง (II) การฝึกอบรมแบบจำลองและการทำนาย (III) ประชากรตารางและการประเมินคอลัมน์
งานเลี้ยง	ร้านค้าคุณลักษณะสำหรับการจัดการการค้นพบและการเข้าถึงคุณสมบัติการเรียนรู้ของเครื่อง งานเลี้ยงให้มุมมองที่สอดคล้องกันของข้อมูลคุณสมบัติสำหรับทั้งการฝึกอบรมแบบจำลองและการให้บริการแบบจำลอง
polyaxon	แพลตฟอร์มสำหรับการเรียนรู้ของเครื่องที่ทำซ้ำได้และปรับขนาดได้และการเรียนรู้อย่างลึกซึ้ง
แท็กเบา ๆ	เครื่องมือคำอธิบายประกอบข้อความสำหรับทีม
Ubiai	เครื่องมือคำอธิบายประกอบข้อความที่ใช้งานง่ายสำหรับทีมที่มีฟีเจอร์ Auto-Annotation ที่ครอบคลุมมากที่สุด สนับสนุน NER, ความสัมพันธ์และการจำแนกเอกสารรวมถึงคำอธิบายประกอบ OCR สำหรับการติดฉลากใบแจ้งหนี้
รถไฟ	ตัวจัดการการทดลองแบบ Auto-Magical, Version Control & DevOps สำหรับ AI
Hopsworks	แพลตฟอร์มการเรียนรู้ของเครื่องจักรที่ใช้ข้อมูลแบบโอเพนซอร์ซพร้อมร้านค้าคุณลักษณะ การบริโภคและจัดการคุณสมบัติสำหรับทั้งออนไลน์ (MySQL คลัสเตอร์) และออฟไลน์ (Apache Hive) การเข้าถึงฝึกอบรมและให้บริการรุ่นในระดับ
MindSDB	MindSDB เป็นเฟรมเวิร์ก AutomL ที่อธิบายได้สำหรับนักพัฒนา ด้วย MindSDB คุณสามารถสร้างฝึกอบรมและใช้โมเดล State of Art ML ได้ง่ายเหมือนรหัสบรรทัดเดียว
ไม้ชนิดหนึ่ง	เฟรมเวิร์กที่ใช้ Pytorch ซึ่งแบ่งปัญหาการเรียนรู้ของเครื่องออกเป็นบล็อกขนาดเล็กที่สามารถติดกันได้อย่างราบรื่นโดยมีวัตถุประสงค์เพื่อสร้างแบบจำลองการทำนายด้วยรหัสหนึ่งบรรทัด
aws data wrangler	แพ็คเกจ Python โอเพนซอร์ซที่ขยายพลังของไลบรารี Pandas ไปยัง AWS ที่เชื่อมต่อ DataFrames และบริการที่เกี่ยวข้องกับข้อมูล AWS (Amazon Redshift, AWS Glue, Amazon Athena, Amazon EMR ฯลฯ )
Amazon Rekognition	AWS Rekognition เป็นบริการที่ให้นักพัฒนาทำงานกับ Amazon Web Services เพิ่มการวิเคราะห์ภาพลงในแอปพลิเคชันของพวกเขา สินทรัพย์แคตตาล็อกเวิร์กโฟลว์อัตโนมัติและแยกความหมายออกจากสื่อและแอปพลิเคชันของคุณ
Amazon Textract	แยกข้อความที่พิมพ์ด้วยลายมือและข้อมูลจากเอกสารใด ๆ โดยอัตโนมัติ
Amazon Lookout for Vision	สปอตผลิตภัณฑ์ข้อบกพร่องโดยใช้วิสัยทัศน์คอมพิวเตอร์เพื่อตรวจสอบคุณภาพโดยอัตโนมัติ ระบุส่วนประกอบผลิตภัณฑ์ที่ขาดหายไปความเสียหายจากยานพาหนะและโครงสร้างและความผิดปกติสำหรับการควบคุมคุณภาพที่ครอบคลุม
Amazon Codeguru	ทำการตรวจสอบรหัสโดยอัตโนมัติและเพิ่มประสิทธิภาพแอปพลิเคชันด้วยคำแนะนำที่ขับเคลื่อนด้วย ML
CML	ชุดเครื่องมือโอเพ่นซอร์สสำหรับการใช้การรวมอย่างต่อเนื่องในโครงการวิทยาศาสตร์ข้อมูล ฝึกอบรมโมเดลและทดสอบโดยอัตโนมัติในสภาพแวดล้อมที่มีการผลิตด้วยการกระทำของ GitHub & Gitlab CI และรายงานการมองเห็นแบบอัตโนมัติเกี่ยวกับคำขอดึง/ผสาน
ผ้าคลุม	ไลบรารี Python โอเพนซอร์สเพื่อเปลี่ยนรหัสการวิเคราะห์ของคุณอย่างไม่เจ็บปวดไปเป็นระบบคอมพิวเตอร์แบบกระจาย (ข้อมูลขนาดใหญ่)
รูปแบบ	สถิติเชิงอนุมานแบบงูเหลือมการทดสอบสมมติฐานและกรอบการถดถอย
เครื่องถ่อมตัว	ห้องสมุดโอเพนซอร์ซสำหรับการสร้างแบบจำลองหัวข้อของข้อความภาษาธรรมชาติ
เครื่องราง	ชุดเครื่องมือประมวลผลภาษาธรรมชาติที่มีประสิทธิภาพ
สตูดิโอกริด	Grid Studio เป็นแอปพลิเคชั่นสเปรดชีตบนเว็บที่มีการรวมภาษาการเขียนโปรแกรม Python เต็มรูปแบบ
คู่มือวิทยาศาสตร์ข้อมูล Python	คู่มือวิทยาศาสตร์ข้อมูล Python: ข้อความเต็มในสมุดบันทึก Jupyter
ซีด	เฟรมเวิร์กที่ขับเคลื่อนด้วยข้อมูลเพื่อหาปริมาณของตัวแยกประเภทในชุดการเรียนรู้ของเครื่อง
dagshub	แพลตฟอร์มที่สร้างขึ้นบนเครื่องมือโอเพ่นซอร์สสำหรับข้อมูลโมเดลและการจัดการท่อ
ลึกล้ำ	สมุดบันทึกวิทยาศาสตร์ข้อมูลรูปแบบใหม่ เข้ากันได้กับ Jupyter ด้วยการทำงานร่วมกันแบบเรียลไทม์และทำงานในระบบคลาวด์
Valohai	แพลตฟอร์ม MLOPS ที่จัดการการจัดแต่งเครื่องจักรการทำซ้ำโดยอัตโนมัติและการปรับใช้
PYMC3	ไลบรารี Python สำหรับการเขียนโปรแกรม probabalistic (การอนุมานแบบเบย์และการเรียนรู้ของเครื่อง)
Pystan	อินเทอร์เฟซ Python ไปยัง Stan (การอนุมานแบบเบย์และการสร้างแบบจำลอง)
อืมม	การเรียนรู้ที่ไม่ได้รับการดูแลและการอนุมานของโมเดล Markov ที่ซ่อนอยู่
ความโกลาหลอัจฉริยะ	ML Powered Analytics Engine สำหรับการตรวจจับค่าผิดปกติ/ความผิดปกติและการวิเคราะห์สาเหตุรูต
nimblebox	แพลตฟอร์ม MLOPS แบบเต็มรูปแบบที่ออกแบบมาเพื่อช่วยนักวิทยาศาสตร์ด้านข้อมูลและผู้ปฏิบัติงานการเรียนรู้ของเครื่องทั่วโลกค้นพบสร้างและเปิดตัวแอพพลิเคชั่นหลายคลาวด์จากเว็บเบราว์เซอร์ของพวกเขา
พ่วง	ไลบรารี Python ที่ช่วยให้คุณเข้ารหัสข้อมูลที่ไม่มีโครงสร้างของคุณเป็น Embeddings
มีเส้นสาย	เคยผิดหวังกับการทำความสะอาดสมุดบันทึก Jupyter ที่ยุ่งเหยิงมานานหรือไม่? ด้วย Lineapy ไลบรารี Python โอเพ่นซอร์สใช้รหัสเพียงสองบรรทัดในการแปลงรหัสการพัฒนาที่ยุ่งเหยิงให้เป็นท่อผลิต
envd	️สภาพแวดล้อมการพัฒนาการเรียนรู้ของเครื่องจักรสำหรับวิทยาศาสตร์ข้อมูลและทีมวิศวกรรม AI/ML
สำรวจห้องสมุดวิทยาศาสตร์ข้อมูล	เครื่องมือค้นหา? เครื่องมือในการค้นพบและค้นหารายการห้องสมุดยอดนิยมและใหม่ผู้เขียนชั้นนำชุดโครงการที่ได้รับความนิยมการอภิปรายการสอนและแหล่งเรียนรู้
mlem	- เวอร์ชันและปรับใช้โมเดล ML ของคุณตามหลักการ Gitops
mlflow	MLOPS Framework สำหรับการจัดการโมเดล ML ในวงจรชีวิตเต็มรูปแบบของพวกเขา
ทำความสะอาด	Library Python สำหรับ AI ที่เน้นข้อมูลเป็นศูนย์กลางและตรวจจับปัญหาต่าง ๆ ในชุดข้อมูล ML โดยอัตโนมัติ
autogluon	AutomL เพื่อสร้างการคาดการณ์ที่แม่นยำสำหรับภาพข้อความตารางเวลาอนุกรมเวลาและข้อมูลหลายโหมด
arize ai	เครื่องมือการสังเกตระดับชุมชน AI AI สำหรับการตรวจสอบรูปแบบการเรียนรู้ของเครื่องในการผลิตและปัญหาที่ทำให้เกิดรากเช่นคุณภาพข้อมูลและการดริฟท์ประสิทธิภาพ
aureo.io	aureo.io เป็นแพลตฟอร์มรหัสต่ำที่มุ่งเน้นไปที่การสร้างปัญญาประดิษฐ์ มันให้ความสามารถแก่ผู้ใช้ในการสร้างท่อระบบอัตโนมัติและรวมเข้ากับโมเดลปัญญาประดิษฐ์ - ทั้งหมดด้วยข้อมูลพื้นฐานของพวกเขา
ห้องแล็บ ERD	เครื่องมือไดอะแกรมความสัมพันธ์เอนทิตีบนคลาวด์ฟรี (ERD) ที่สร้างขึ้นสำหรับนักพัฒนา
arize-phoenix	Mlops ในสมุดบันทึก - เปิดเผยข้อมูลเชิงลึกปัญหาพื้นผิวการตรวจสอบและปรับแต่งโมเดลของคุณอย่างละเอียด
ดาวหาง	แพลตฟอร์ม MLOPS พร้อมการติดตามการทดลองการจัดการการผลิตแบบจำลองรีจิสทรีแบบจำลองและสายเลือดข้อมูลเต็มรูปแบบเพื่อรองรับเวิร์กโฟลว์ ML ของคุณตั้งแต่การฝึกอบรมตรงไปจนถึงการผลิต
opik	ประเมินทดสอบและจัดส่งแอปพลิเคชั่น LLM ในวงจรชีวิตและการผลิตของคุณ
สังเคราะห์	สภาพแวดล้อมการทำงานร่วมกันของ AI ที่ใช้พลังงานสำหรับการวิจัย ค้นหาเอกสารที่เกี่ยวข้องสร้างคอลเลกชันเพื่อจัดการบรรณานุกรมและสรุปเนื้อหา - ทั้งหมดในที่เดียว
ลูกผู้ชาย	เครื่องมือเวิร์กโฟลว์เพื่อจัดระเบียบเอาต์พุตการสร้างภาพข้อมูลโดยอัตโนมัติ
มีแสงสว่าง	Framework App สำหรับการเรียนรู้ของเครื่องและโครงการวิทยาศาสตร์ข้อมูล
Gradeio	สร้างส่วนประกอบ UI ที่ปรับแต่งได้รอบรูปแบบการเรียนรู้ของเครื่องจักร
น้ำหนักและอคติ	การติดตามการทดลองการกำหนดเวอร์ชันชุดข้อมูลและการจัดการแบบจำลอง
ดีวีดี	ระบบควบคุมเวอร์ชันโอเพนซอร์ซสำหรับโครงการเรียนรู้ของเครื่องจักร
Optuna	เฟรมเวิร์กการเพิ่มประสิทธิภาพของพารามิเตอร์ hyperparameter อัตโนมัติ
เพลงเรย์	ไลบรารีปรับแต่งพารามิเตอร์ hyperparameter ที่ปรับขนาดได้
Apache Airflow	แพลตฟอร์มไปยังผู้เขียนกำหนดเวลาและตรวจสอบเวิร์กโฟลว์โดยทางโปรแกรม
นายอำเภอ	ระบบการจัดการเวิร์กโฟลว์สำหรับสแต็คข้อมูลที่ทันสมัย
Kedro	Framework Python โอเพนซอร์ซสำหรับการสร้างรหัสวิทยาศาสตร์ข้อมูลที่ทำซ้ำได้และบำรุงรักษาได้
แฮมิลตัน	ห้องสมุดที่มีน้ำหนักเบาเพื่อแต่งและจัดการการแปลงข้อมูลที่เชื่อถือได้
ผัด	แนวทางทฤษฎีเกมเพื่ออธิบายผลลัพธ์ของรูปแบบการเรียนรู้ของเครื่องใด ๆ
มะนาว	การอธิบายการคาดการณ์ของตัวจําแนกการเรียนรู้ของเครื่องใด ๆ
แมลงวัน	แพลตฟอร์มระบบอัตโนมัติเวิร์กโฟลว์สำหรับการเรียนรู้ของเครื่อง
DBT	เครื่องมือสร้างข้อมูล
ผัด	แนวทางทฤษฎีเกมเพื่ออธิบายผลลัพธ์ของรูปแบบการเรียนรู้ของเครื่องใด ๆ
มะนาว	การอธิบายการคาดการณ์ของตัวจําแนกการเรียนรู้ของเครื่องใด ๆ

วรรณกรรมและสื่อ

^ back to top ^

ส่วนนี้รวมถึงเนื้อหาการอ่านเพิ่มเติมช่องทางที่จะดูและพูดคุยเพื่อฟัง

หนังสือ

^ back to top ^

วิทยาศาสตร์ข้อมูลตั้งแต่เริ่มต้น: หลักการแรกที่มี Python
ปัญญาประดิษฐ์กับ Python - TutorialSpoint
การเรียนรู้ของเครื่องตั้งแต่เริ่มต้น
การเรียนรู้ของเครื่องจักรความน่าจะเป็น: บทนำ
คู่มือที่ครอบคลุมเกี่ยวกับการเรียนรู้ของเครื่องจักร
วิธีนำในวิทยาศาสตร์ข้อมูล - การเข้าถึงก่อน
Fighting Churn With Data
Data Science at Scale with Python and Dask
Python Data Science Handbook
The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists
Think Like a Data Scientist
Introducing Data Science
Practical Data Science with R
Everyday Data Science & (cheaper PDF version)
Exploring Data Science - free eBook sampler
Exploring the Data Jungle - free eBook sampler
Classic Computer Science Problems in Python
Math for Programmers Early access
R in Action, Third Edition Early Access
Data Science Bookcamp Early access
Data Science Thinking: The Next Scientific, Technological and Economic Revolution
Applied Data Science: Lessons Learned for the Data-Driven Business
The Data Science Handbook
Essential Natural Language Processing - Early access
Mining Massive Datasets - free e-book comprehended by an online course
Pandas in Action - Early access
Genetic Algorithms and Genetic Programming
Advances in Evolutionary Algorithms - Free Download
Genetic Programming: New Approaches and Successful Applications - Free Download
Evolutionary Algorithms - Free Download
Advances in Genetic Programming, Vol. 3 - Free Download
Global Optimization Algorithms: Theory and Application - Free Download
Genetic Algorithms and Evolutionary Computation - Free Download
Convex Optimization - Convex Optimization book by Stephen Boyd - Free Download
Data Analysis with Python and PySpark - Early Access
R for Data Science
Build a Career in Data Science
Machine Learning Bookcamp - Early access
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition
Effective Data Science Infrastructure
Practical MLOps: How to Get Ready for Production Models
Data Analysis with Python and PySpark
Regression, a Friendly guide - Early Access
Streaming Systems: The What, Where, When, and How of Large-Scale Data Processing
Data Science at the Command Line: Facing the Future with Time-Tested Tools
Machine Learning - CIn UFPE
Machine Learning with Python - Tutorialspoint
Deep Learning
Designing Cloud Data Platforms - Early Access
An Introduction to Statistical Learning with Applications in R
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
Deep Learning with PyTorch
Neural Networks and Deep Learning
Deep Learning Cookbook
Introduction to Machine Learning with Python
Artificial Intelligence: Foundations of Computational Agents, 2nd Edition - Free HTML version
The Quest for Artificial Intelligence: A History of Ideas and Achievements - Free Download
Graph Algorithms for Data Science - Early Access
Data Mesh in Action - Early Access
Julia for Data Analysis - Early Access
Casual Inference for Data Science - Early Access
Regular Expression Puzzles and AI Coding Assistants by David Mertz
Dive into Deep Learning
Data for All
Interpretable Machine Learning: A Guide for Making Black Box Models Explainable - Free GitHub version
Foundations of Data Science Free Download
Comet for DataScience: Enhance your ability to manage and optimize the life cycle of your data science project
Software Engineering for Data Scientists - Early Access
Julia for Data Science - Early Access
An Introduction to Statistical Learning - Download Page
Machine Learning For Absolute Beginners
Unifying Business, Data, and Code: Designing Data Products with JSON Schema

Book Deals (Affiliated) ?

eBook sale - Save up to 45% on eBooks!
Causal Machine Learning
Managing ML Projects
Causal Inference for Data Science
Data for All

Journals, Publications and Magazines

^ back to top ^

ICML - International Conference on Machine Learning
GECCO - The Genetic and Evolutionary Computation Conference (GECCO)
epjdatascience
Journal of Data Science - an international journal devoted to applications of statistical methods at large
Big Data Research
Journal of Big Data
Big Data & Society
Data Science Journal
datatau.com/news - Like Hacker News, but for data
Data Science Trello Board
Medium Data Science Topic - Data Science related publications on medium
Towards Data Science Genetic Algorithm Topic -Genetic Algorithm related Publications towards Data Science
all AI news - The AI/ML/Big Data news aggregator platform

Newsletters

^ back to top ^

AI Digest. A weekly newsletter to keep up to date with AI, machine learning, and data science. คลังเก็บเอกสารสำคัญ.
DataTalks.Club. A weekly newsletter about data-related things. คลังเก็บเอกสารสำคัญ.
The Analytics Engineering Roundup. A newsletter about data science. คลังเก็บเอกสารสำคัญ.

Bloggers

^ back to top ^

Wes McKinney - Wes McKinney Archives.
Matthew Russell - Mining The Social Web.
Greg Reda - Greg Reda Personal Blog
Kevin Davenport - Kevin Davenport Personal Blog
Julia Evans - Recurse Center alumna
Hakan Kardas - Personal Web Page
Sean J. Taylor - Personal Web Page
Drew Conway - Personal Web Page
Hilary Mason - Personal Web Page
Noah Iliinsky - Personal Blog
Matt Harrison - Personal Blog
Vamshi Ambati - AllThings Data Sciene
Prash Chan - Tech Blog on Master Data Management And Every Buzz Surrounding It
Clare Corthell - The Open Source Data Science Masters
Paul Miller Based in the UK and working globally, Cloud of Data's consultancy services help clients understand the implications of taking data and more to the Cloud.
Data Science London Data Science London is a non-profit organization dedicated to the free, open, dissemination of data science. We are the largest data science community in Europe. We are more than 3,190 data scientists and data geeks in our community.
Datawrangling by Peter Skomoroch. MACHINE LEARNING, DATA MINING, AND MORE
Quora Data Science - Data Science Questions and Answers from experts
Siah a PhD student at Berkeley
Louis Dorard a technology guy with a penchant for the web and for data, big and small
Machine Learning Mastery about helping professional programmers confidently apply machine learning algorithms to address complex problems.
Daniel Forsyth - Personal Blog
Data Science Weekly - Weekly News Blog
Revolution Analytics - Data Science Blog
R Bloggers - R Bloggers
The Practical Quant Big data
Yet Another Data Blog Yet Another Data Blog
Spenczar a data scientist at Twitch . I handle the whole data pipeline, from tracking to model-building to reporting.
KD Nuggets Data Mining, Analytics, Big Data, Data, Science not a blog a portal
Meta Brown - Personal Blog
Data Scientist is building the data scientist culture.
WhatSTheBigData is some of, all of, or much more than the above and this blog explores its impact on information technology, the business world, government agencies, and our lives.
Tevfik Kosar - Magnus Notitia
New Data Scientist How a Social Scientist Jumps into the World of Big Data
Harvard Data Science - Thoughts on Statistical Computing and Visualization
Data Science 101 - Learning To Be A Data Scientist
Kaggle Past Solutions
DataScientistJourney
NYC Taxi Visualization Blog
Learning Lover
Dataists
Data-Mania
Data-Magnum
P-value - Musings on data science, machine learning, and stats.
datascopeanalytics
Digital transformation
datascientistjourney
Data Mania Blog - The File Drawer - Chris Said's science blog
Emilio Ferrara's web page
DataNews
Reddit TextMining
Periscopic
Hilary Parker
Data Stories
Data Science Lab
Meaning of
Adventures in Data Land
DATA MINERS BLOG
Dataclysm
FlowingData - Visualization and Statistics
Calculated Risk
O'reilly Learning Blog
Dominodatalab
i am trask - A Machine Learning Craftsmanship Blog
Vademecum of Practical Data Science - Handbook and recipes for data-driven solutions of real-world problems
Dataconomy - A blog on the newly emerging data economy
Springboard - A blog with resources for data science learners
Analytics Vidhya - A full-fledged website about data science and analytics study material.
Occam's Razor - Focused on Web Analytics.
Data School - Data science tutorials for beginners!
Colah's Blog - Blog for understanding Neural Networks!
Sebastian's Blog - Blog for NLP and transfer learning!
Distill - Dedicated to clear explanations of machine learning!
Chris Albon's Website - Data Science and AI notes
Andrew Carr - Data Science with Esoteric programming languages
floydhub - Blog for Evolutionary Algorithms
Jingles - Review and extract key concepts from academic papers
nbshare - Data Science notebooks
Deep and Shallow - All things Deep and Shallow in Data Science
Loic Tetrel - Data science blog
Chip Huyen's Blog - ML Engineering, MLOps, and the use of ML in startups
Maria Khalusova - Data science blog
Aditi Rastogi - ML,DL,Data Science blog
Santiago Basulto - Data Science with Python
Akhil Soni - ML, DL and Data Science
Akhil Soni - ML, DL and Data Science

Presentations

^ back to top ^

How to Become a Data Scientist
Introduction to Data Science
Intro to Data Science for Enterprise Big Data
How to Interview a Data Scientist
How to Share Data with a Statistician
The Science of a Great Career in Data Science
What Does a Data Scientist Do?
Building Data Start-Ups: Fast, Big, and Focused
How to win data science competitions with Deep Learning
Full-Stack Data Scientist

Podcasts

^ back to top ^

AI at Home
AI Today
Adversarial Learning
Becoming a Data Scientist
Chai time Data Science
Data Crunch
Data Engineering Podcast
Data Science at Home
Data Science Mixer
Data Skeptic
Data Stories
Datacast
DataFramed
DataTalks.Club
Gradient Descent
Learning Machines 101
Let's Data (Brazil)
Linear Digressions
Not So Standard Deviations
O'Reilly Data Show Podcast
Partially Derivative
Superdatascience
The Data Engineering Show
The Radical AI Podcast
The Robot Brains Podcast
What's The Point
How AI Built This
The Analytics Engineering Podcast

YouTube Videos & Channels

^ back to top ^

What is machine learning?
Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning
Data36 - Data Science for Beginners by Tomi Mester
Deep Learning: Intelligence from Big Data
Interview with Google's AI and Deep Learning 'Godfather' Geoffrey Hinton
Introduction to Deep Learning with Python
What is machine learning, and how does it work?
Data School - Data Science Education
Neural Nets for Newbies by Melanie Warrick (May 2015)
Neural Networks video series by Hugo Larochelle
Google DeepMind co-founder Shane Legg - Machine Super Intelligence
Data Science Primer
Data Science with Genetic Algorithms
Data Science for Beginners
DataTalks.Club
Mildlyoverfitted - Tutorials on intermediate ML/DL topics
mlops.community - Interviews of industry experts about production ML
ML Street Talk - Unabashedly technical and non-commercial, so you will hear no annoying pitches.
Neural networks by 3Blue1Brown
Neural networks from scratch by Sentdex
Manning Publications YouTube channel
Ask Dr Chong: How to Lead in Data Science - Part 1
Ask Dr Chong: How to Lead in Data Science - Part 2
Ask Dr Chong: How to Lead in Data Science - Part 3
Ask Dr Chong: How to Lead in Data Science - Part 4
Ask Dr Chong: How to Lead in Data Science - Part 5
Ask Dr Chong: How to Lead in Data Science - Part 6
Regression Models: Applying simple Poisson regression
Deep Learning Architectures
Time Series Modelling and Analysis

Socialize

^ back to top ^

Below are some Social Media links. Connect with other data scientists!

Facebook Accounts
Twitter Accounts
Telegram Channels
Slack Communities
GitHub Groups
Data Science Competitions

Facebook Accounts

^ back to top ^

ข้อมูล
Big Data Scientist
Data Science Day
Data Science Academy
Facebook Data Science Page
Data Science London
Data Science Technology and Corporation
Data Science - Closed Group
Center for Data Science
Big data hadoop NOSQL Hive Hbase
Analytics, Data Mining, Predictive Modeling, Artificial Intelligence
Big Data Analytics using R
Big Data Analytics with R and Hadoop
Big Data Learnings
Big Data, Data Science, Data Mining & Statistics
BigData/Hadoop Expert
Data Mining / Machine Learning / AI
Data Mining/Big Data - Social Network Ana
Vademecum of Practical Data Science
Veri Bilimi Istanbul
The Data Science Blog

Twitter Accounts

^ back to top ^

Twitter	คำอธิบาย
Big Data Combine	Rapid-fire, live tryouts for data scientists seeking to monetize their models as trading strategies
Big Data Mania	Data Viz Wiz, Data Journalist, Growth Hacker, Author of Data Science for Dummies (2015)
Big Data Science	Big Data, Data Science, Predictive Modeling, Business Analytics, Hadoop, Decision and Operations Research.
Charlie Greenbacker	Director of Data Science at @ExploreAltamira
Chris Said	Data scientist at Twitter
Clare Corthell	Dev, Design, Data Science @mattermark #hackerei
DADI Charles-Abner	#datascientist @Ekimetrics. , #machinelearning #dataviz #DynamicCharts #Hadoop #R #Python #NLP #Bitcoin #dataenthousiast
Data Science Central	Data Science Central is the industry's single resource for Big Data practitioners.
Data Science London	Data Science. Big Data. Data Hacks. Data Junkies. Data Startups. Open Data
Data Science Renee	Documenting my path from SQL Data Analyst pursuing an Engineering Master's Degree to Data Scientist
Data Science Report	Mission is to help guide & advance careers in Data Science & Analytics
Data Science Tips	Tips and Tricks for Data Scientists around the world! #datascience #bigdata
Data Vizzard	DataViz, Security, Military
DataScienceX
deeplearning4j
DJ Patil	White House Data Chief, VP @ RelateIQ.
Domino Data Lab
Drew Conway	Data nerd, hacker, student of conflict.
Emilio Ferrara	#Networks, #MachineLearning and #DataScience. I work on #Social Media. Postdoc at @IndianaUniv
Erin Bartolo	Running with #BigData--enjoying a love/hate relationship with its hype. @iSchoolSU #DataScience Program Mgr.
Greg Reda	Working @ GrubHub about data and pandas
Gregory Piatetsky	KDnuggets President, Analytics/Big Data/Data Mining/Data Science expert, KDD & SIGKDD co-founder, was Chief Scientist at 2 startups, part-time philosopher.
Hadley Wickham	Chief Scientist at RStudio, and an Adjunct Professor of Statistics at the University of Auckland, Stanford University, and Rice University.
Hakan Kardas	Data Scientist
Hilary Mason	Data Scientist in Residence at @accel.
Jeff Hammerbacher	ReTweeting about data science
John Myles White	Scientist at Facebook and Julia developer. Author of Machine Learning for Hackers and Bandit Algorithms for Website Optimization. Tweets reflect my views only.
Juan Miguel Lavista	Principal Data Scientist @ Microsoft Data Science Team
Julia Evans	Hacker - Pandas - Data Analyze
Kenneth Cukier	The Economist's Data Editor and co-author of Big Data (http://www.big-data-book.com/).
Kevin Davenport	Organizer of https://www.meetup.com/San-Diego-Data-Science-R-Users-Group/
Kevin Markham	Data science instructor, and founder of Data School
Kim Rees	Interactive data visualization and tools. Data flaneur.
Kirk Borne	DataScientist, PhD Astrophysicist, Top #BigData Influencer.
Linda Regber	Data storyteller, visualizations.
Luis Rei	PhD Student. Programming, Mobile, Web. Artificial Intelligence, Intelligent Robotics Machine Learning, Data Mining, Natural Language Processing, Data Science.
Mark Stevenson	Data Analytics Recruitment Specialist at Salt (@SaltJobs) Analytics - Insight - Big Data - Data science
Matt Harrison	Opinions of full-stack Python guy, author, instructor, currently playing Data Scientist. Occasional fathering, husbanding, organic gardening.
Matthew Russell	Mining the Social Web.
Mert Nuhoğlu	Data Scientist at BizQualify, Developer
Monica Rogati	Data @ Jawbone. Turned data into stories & products at LinkedIn. Text mining, applied machine learning, recommender systems. Ex-gamer, ex-machine coder; namer.
Noah Iliinsky	Visualization & interaction designer. Practical cyclist. Author of vis books: https://www.oreilly.com/pub/au/4419
Paul Miller	Cloud Computing/ Big Data/ Open Data Analyst & Consultant. Writer, Speaker & Moderator. Gigaom Research Analyst.
Peter Skomoroch	Creating intelligent systems to automate tasks & improve decisions. Entrepreneur, ex-Principal Data Scientist @LinkedIn. Machine Learning, ProductRei, Networks
Prash Chan	Solution Architect @ IBM, Master Data Management, Data Quality & Data Governance Blogger. Data Science, Hadoop, Big Data & Cloud.
Quora Data Science	Quora's data science topic
R-Bloggers	Tweet blog posts from the R blogosphere, data science conferences, and (!) open jobs for data scientists.
Rand Hindi
Randy Olson	Computer scientist researching artificial intelligence. Data tinkerer. Community leader for @DataIsBeautiful. #OpenScience advocate.
Recep Erol	Data Science geek @ UALR
Ryan Orban	Data scientist, genetic origamist, hardware aficionado
Sean J. Taylor	Social Scientist. Hacker. Facebook Data Science Team. Keywords: Experiments, Causal Inference, Statistics, Machine Learning, Economics.
Silvia K. Spiva	#DataScience at Cisco
Harsh B. Gupta	Data Scientist at BBVA Compass
Spencer Nelson	Data nerd
Talha Oz	Enjoys ABM, SNA, DM, ML, NLP, HI, Python, Java. Top percentile Kaggler/data scientist
Tasos Skarlatidis	Complex Event Processing, Big Data, Artificial Intelligence and Machine Learning. Passionate about programming and open-source.
Terry Timko	InfoGov; Bigdata; Data as a Service; Data Science; Open, Social & Business Data Convergence
Tony Baer	IT analyst with Ovum covering Big Data & data management with some systems engineering thrown in.
Tony Ojeda	Data Scientist , Author , Entrepreneur. Co-founder @DataCommunityDC. Founder @DistrictDataLab. #DataScience #BigData #DataDC
Vamshi Ambati	Data Science @ PayPal. #NLP, #machinelearning; PhD, Carnegie Mellon alumni (Blog: https://allthingsds.wordpress.com )
Wes McKinney	Pandas (Python Data Analysis library).
WileyEd	Senior Manager - @Seagate Big Data Analytics @McKinsey Alum #BigData + #Analytics Evangelist #Hadoop, #Cloud, #Digital, & #R Enthusiast
WNYC Data News Team	The data news crew at @WNYC. Practicing data-driven journalism, making it visual, and showing our work.
Alexey Grigorev	Data science author
İlker Arslan	Data science author. Shares mostly about Julia programming
หลีกเลี่ยงไม่ได้	AI & Data Science Start-up Company based in England, UK

Telegram Channels

^ back to top ^

Open Data Science – First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former.
Loss function porn — Beautiful posts on DS/ML theme with video or graphic visualization.
Machinelearning – Daily ML news.

Slack Communities

สูงสุด

DataTalks.Club
Women Who Code - Data Science

GitHub Groups

Berkeley Institute for Data Science

Data Science Competitions

Some data mining competition platforms

Kaggle
DrivenData
Analytics Vidhya
InnoCentive
Microprediction

สนุก

Infographic
Datasets
Comics

Infographics

^ back to top ^

ดูตัวอย่าง	คำอธิบาย
	Key differences of a data scientist vs. data engineer
	A visual guide to Becoming a Data Scientist in 8 Steps by DataCamp (img)
	Mindmap on required skills (img)
	Swami Chandrasekaran made a Curriculum via Metro map.
	by @kzawadz via twitter
	By Data Science Central
	Data Science Wars: R vs Python
	How to select statistical or machine learning techniques
	Choosing the Right Estimator
	The Data Science Industry: Who Does What
	วิทยาศาสตร์ข้อมูล ~~Venn~~ Euler Diagram
	Different Data Science Skills and Roles from this article by Springboard
	A simple and friendly way of teaching your non-data scientist/non-statistician colleagues how to avoid mistakes with data. From Geckoboard's Data Literacy Lessons.

Datasets

^ back to top ^

Academic Torrents
ADS-B Exchange - Specific datasets for aircraft and Automatic Dependent Surveillance-Broadcast (ADS-B) sources.
hadoopilluminated.com
data.gov - The home of the US Government's open data
United States Census Bureau
usgovxml.com
enigma.com - Navigate the world of public data - Quickly search and analyze billions of public records published by governments, companies and organizations.
datahub.io
aws.amazon.com/datasets
datacite.org
The official portal for European data
NASDAQ:DATA - Nasdaq Data Link A premier source for financial, economic and alternative datasets.
figshare.com
GeoLite Legacy Downloadable Databases
Quora's Big Datasets Answer
Public Big Data Sets
Kaggle Datasets
A Deep Catalog of Human Genetic Variation
A community-curated database of well-known people, places, and things
Google Public Data
World Bank Data
NYC Taxi data
Open Data Philly Connecting people with data for Philadelphia
grouplens.org Sample movie (with ratings), book and wiki datasets
UC Irvine Machine Learning Repository - contains data sets good for machine learning
research-quality data sets by Hilary Mason
National Centers for Environmental Information
ClimateData.us (related: US Climate Resilience Toolkit)
r/datasets
MapLight - provides a variety of data free of charge for uses that are freely available to the general public. Click on a data set below to learn more
GHDx - Institute for Health Metrics and Evaluation - a catalog of health and demographic datasets from around the world and including IHME results
St. Louis Federal Reserve Economic Data - FRED
New Zealand Institute of Economic Research – Data1850
Open Data Sources
UNICEF Data
undata
NASA SocioEconomic Data and Applications Center - SEDAC
The GDELT Project
Sweden, Statistics
StackExchange Data Explorer - an open source tool for running arbitrary queries against public data from the Stack Exchange network.
SocialGrep - a collection of open Reddit datasets.
San Fransisco Government Open Data
IBM Asset Dataset
Open data Index
Public Git Archive
GHTorrent
Microsoft Research Open Data
Open Government Data Platform India
Google Dataset Search (beta)
NAYN.CO Turkish News with categories
โควิด 19
Covid-19 Google
Enron Email Dataset
5000 Images of Clothes
IBB Open Portal
The Humanitarian Data Exchange

Comics

^ back to top ^

Comic compilation
Cartoons
Data Science Cartoons
Data Science: The XKCD Edition

Other Awesome Lists

Other amazingly awesome lists can be found in the awesome-awesomeness
Awesome Machine Learning
lists
awesome-dataviz
awesome-python
Data Science IPython Notebooks.
awesome-r
awesome-datasets
awesome-Machine Learning & Deep Learning Tutorials
Awesome Data Science Ideas
Machine Learning for Software Engineers
Community Curated Data Science Resources
Awesome Machine Learning On Source Code
Awesome Community Detection
Awesome Graph Classification
Awesome Decision Tree Papers
Awesome Fraud Detection Papers
Awesome Gradient Boosting Papers
Awesome Computer Vision Models
Awesome Monte Carlo Tree Search
Glossary of common statistics and ML terms
100 NLP Papers
Awesome Game Datasets
Data Science Interviews Questions
Awesome Explainable Graph Reasoning
Top Data Science Interview Questions
Awesome Drug Synergy, Interaction and Polypharmacy Prediction
Deep Learning Interview Questions
Top Future Trends in Data Science in 2023
How Generative AI Is Changing Creative Work
What is generative AI?
Top 100+ Machine Learning Interview Questions (Beginner to Advanced)

งานอดิเรก

Awesome Music Production

ขยาย