
พื้นที่เก็บข้อมูลวิทยาศาสตร์โอเพนซอร์ซเพื่อเรียนรู้และนำไปใช้ในการแก้ปัญหาในโลกแห่งความเป็นจริง
นี่เป็นเส้นทางทางลัดในการเริ่มเรียน วิทยาศาสตร์ข้อมูล เพียงทำตามขั้นตอนเพื่อตอบคำถาม "วิทยาศาสตร์ข้อมูลคืออะไรและฉันควรเรียนรู้อะไรเพื่อเรียนรู้วิทยาศาสตร์ข้อมูล"
| ผู้สนับสนุน | ขว้าง |
|---|---|
| - | เป็นคนแรกที่สปอนเซอร์! [email protected] |
^ back to top ^
Data Science เป็นหนึ่งในหัวข้อที่ร้อนแรงที่สุดในคอมพิวเตอร์และอินเทอร์เน็ตฟาร์มในปัจจุบัน ผู้คนได้รวบรวมข้อมูลจากแอปพลิเคชันและระบบจนถึงวันนี้และตอนนี้เป็นเวลาที่จะวิเคราะห์ ขั้นตอนต่อไปคือการสร้างคำแนะนำจากข้อมูลและสร้างการคาดการณ์เกี่ยวกับอนาคต ที่นี่คุณสามารถค้นหาคำถามที่ใหญ่ที่สุดสำหรับ วิทยาศาสตร์ข้อมูล และคำตอบหลายร้อยคำตอบจากผู้เชี่ยวชาญ
| การเชื่อมโยง | ดูตัวอย่าง |
|---|---|
| Data Science @ O'Reilly คืออะไร | นักวิทยาศาสตร์ด้านข้อมูลรวมผู้ประกอบการด้วยความอดทนความเต็มใจที่จะสร้างผลิตภัณฑ์ข้อมูลเพิ่มขึ้นความสามารถในการสำรวจและความสามารถในการทำซ้ำผ่านโซลูชัน พวกเขาเป็นสหวิทยาการโดยเนื้อแท้ พวกเขาสามารถแก้ไขปัญหาได้ทุกด้านตั้งแต่การรวบรวมข้อมูลเริ่มต้นและการปรับอากาศข้อมูลไปจนถึงการสรุปข้อสรุป พวกเขาสามารถคิดนอกกรอบเพื่อหาวิธีใหม่ ๆ ในการดูปัญหาหรือทำงานกับปัญหาที่กำหนดไว้อย่างกว้างขวาง:“ นี่คือข้อมูลจำนวนมากคุณสามารถทำอะไรได้บ้าง” |
| Data Science @ Quora คืออะไร | Data Science เป็นการรวมกันของข้อมูลหลายแง่มุมเช่นเทคโนโลยีการพัฒนาอัลกอริทึมและการรบกวนข้อมูลเพื่อศึกษาข้อมูลวิเคราะห์และค้นหาวิธีแก้ปัญหาที่เป็นนวัตกรรมสำหรับปัญหาที่ยากลำบาก โดยทั่วไปวิทยาศาสตร์ข้อมูลคือทั้งหมดที่เกี่ยวกับการวิเคราะห์ข้อมูลและผลักดันการเติบโตของธุรกิจโดยการหาวิธีที่สร้างสรรค์ |
| งานที่เซ็กซี่ที่สุดของศตวรรษที่ 21 | นักวิทยาศาสตร์ด้านข้อมูลในปัจจุบันคล้ายกับ“ quants” ของ Wall Street ในปี 1980 และ 1990 ในสมัยนั้นผู้คนที่มีภูมิหลังทางฟิสิกส์และคณิตศาสตร์สตรีมไปยังธนาคารเพื่อการลงทุนและกองทุนป้องกันความเสี่ยงซึ่งพวกเขาสามารถกำหนดอัลกอริทึมใหม่และกลยุทธ์ข้อมูลทั้งหมด จากนั้นมหาวิทยาลัยที่หลากหลายได้พัฒนาโปรแกรมปริญญาโทด้านวิศวกรรมการเงินซึ่งทำให้ความสามารถรุ่นที่สองสามารถเข้าถึงได้มากขึ้นสำหรับ บริษัท หลัก รูปแบบถูกทำซ้ำในภายหลังในปี 1990 กับวิศวกรการค้นหาซึ่งมีทักษะที่หายากมาเร็ว ๆ นี้ได้รับการสอนในโปรแกรมวิทยาศาสตร์คอมพิวเตอร์ |
| วิกิพีเดีย | Data Science เป็นสาขาวิชาสหวิทยาการที่ใช้วิธีการทางวิทยาศาสตร์กระบวนการอัลกอริทึมและระบบเพื่อแยกความรู้และข้อมูลเชิงลึกจากข้อมูลโครงสร้างและไม่มีโครงสร้างจำนวนมาก วิทยาศาสตร์ข้อมูลเกี่ยวข้องกับการขุดข้อมูลการเรียนรู้ของเครื่องและข้อมูลขนาดใหญ่ |
| วิธีการเป็นนักวิทยาศาสตร์ข้อมูล | นักวิทยาศาสตร์ด้านข้อมูลเป็น Wranglers ข้อมูลขนาดใหญ่รวบรวมและวิเคราะห์ชุดข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างขนาดใหญ่ บทบาทของนักวิทยาศาสตร์ข้อมูลรวมวิทยาศาสตร์คอมพิวเตอร์สถิติและคณิตศาสตร์ พวกเขาวิเคราะห์ประมวลผลและข้อมูลแบบจำลองจากนั้นตีความผลลัพธ์เพื่อสร้างแผนการดำเนินการสำหรับ บริษัท และองค์กรอื่น ๆ |
| ประวัติความเป็นมาสั้น ๆ ของ #datascience | เรื่องราวของวิธีการที่นักวิทยาศาสตร์ข้อมูลกลายเป็นเซ็กซี่ส่วนใหญ่เป็นเรื่องราวของการมีเพศสัมพันธ์ของวินัยที่เป็นผู้ใหญ่ของสถิติด้วยวิทยาศาสตร์ที่อายุน้อยมาก-คอมพิวเตอร์ คำว่า "วิทยาศาสตร์ข้อมูล" ได้เกิดขึ้นเมื่อเร็ว ๆ นี้เพื่อกำหนดอาชีพใหม่ที่คาดว่าจะทำให้เข้าใจถึงร้านค้าขนาดใหญ่ที่กว้างใหญ่ แต่การทำความเข้าใจกับข้อมูลมีประวัติอันยาวนานและได้รับการพูดคุยกันโดยนักวิทยาศาสตร์นักสถิติบรรณารักษ์นักวิทยาศาสตร์คอมพิวเตอร์และคนอื่น ๆ มานานหลายปี ไทม์ไลน์ต่อไปนี้ติดตามวิวัฒนาการของคำว่า "วิทยาศาสตร์ข้อมูล" และการใช้งานพยายามกำหนดและคำที่เกี่ยวข้อง |
| ทรัพยากรการพัฒนาซอฟต์แวร์สำหรับนักวิทยาศาสตร์ข้อมูล | นักวิทยาศาสตร์ด้านข้อมูลให้ความสำคัญกับการทำความเข้าใจกับข้อมูลผ่านการวิเคราะห์เชิงสำรวจสถิติและแบบจำลอง นักพัฒนาซอฟต์แวร์ใช้ชุดความรู้แยกต่างหากด้วยเครื่องมือต่าง ๆ แม้ว่าการมุ่งเน้นของพวกเขาอาจดูเหมือนไม่เกี่ยวข้อง แต่ทีมวิทยาศาสตร์ข้อมูลจะได้รับประโยชน์จากการใช้แนวทางปฏิบัติที่ดีที่สุดในการพัฒนาซอฟต์แวร์ การควบคุมเวอร์ชันการทดสอบอัตโนมัติและทักษะการพัฒนาอื่น ๆ ช่วยสร้างรหัสและเครื่องมือที่ทำซ้ำได้ |
| แผนงานนักวิทยาศาสตร์ด้านข้อมูล | Data Science เป็นตัวเลือกอาชีพที่ยอดเยี่ยมในโลกที่ขับเคลื่อนด้วยข้อมูลในปัจจุบันซึ่งมีการสร้างข้อมูลประมาณ 328.77 ล้านเทราไบต์ทุกวัน และจำนวนนี้เพิ่มขึ้นทุกวันซึ่งจะเพิ่มความต้องการนักวิทยาศาสตร์ข้อมูลที่มีทักษะซึ่งสามารถใช้ข้อมูลนี้เพื่อผลักดันการเติบโตของธุรกิจ |
| การนำทางของคุณไปสู่การเป็นนักวิทยาศาสตร์ข้อมูล | _data Science เป็นหนึ่งในอาชีพที่เป็นที่ต้องการมากที่สุดในปัจจุบัน ด้วยธุรกิจที่ต้องพึ่งพาข้อมูลมากขึ้นในการตัดสินใจความต้องการนักวิทยาศาสตร์ข้อมูลที่มีทักษะได้เติบโตขึ้นอย่างรวดเร็ว ไม่ว่าจะเป็น บริษัท เทคโนโลยีองค์กรด้านการดูแลสุขภาพหรือแม้แต่สถาบันรัฐบาลนักวิทยาศาสตร์ด้านข้อมูลมีบทบาทสำคัญในการเปลี่ยนข้อมูลดิบให้เป็นข้อมูลเชิงลึกที่มีค่า แต่คุณจะเป็นนักวิทยาศาสตร์ข้อมูลได้อย่างไรโดยเฉพาะอย่างยิ่งถ้าคุณเพิ่งเริ่มต้น? - |
^ back to top ^
ในขณะที่ไม่จำเป็นอย่างเคร่งครัดการมีภาษาการเขียนโปรแกรมเป็นทักษะที่สำคัญที่จะมีประสิทธิภาพในฐานะนักวิทยาศาสตร์ด้านข้อมูล ปัจจุบันภาษาที่ได้รับความนิยมมากที่สุดคือ Python ตามด้วย R Python เป็นภาษาสคริปต์ที่มีวัตถุประสงค์ทั่วไปที่เห็นแอปพลิเคชันในหลากหลายสาขา R เป็นภาษาเฉพาะโดเมนสำหรับสถิติซึ่งมีเครื่องมือสถิติทั่วไปจำนวนมากนอกกรอบ
Python เป็นภาษาที่ได้รับความนิยมมากที่สุดในด้านวิทยาศาสตร์เนื่องจากไม่ได้เป็นส่วนเล็ก ๆ ที่สามารถใช้งานได้และระบบนิเวศที่มีชีวิตชีวาของแพ็คเกจที่ผู้ใช้สร้างขึ้น ในการติดตั้งแพ็คเกจมีสองวิธีหลัก: PIP (เรียกใช้เป็น pip install ) ตัวจัดการแพ็คเกจที่มาพร้อมกับ Python และ Anaconda (เรียกใช้เป็น conda install ) ตัวจัดการแพ็คเกจที่ทรงพลังที่สามารถติดตั้งแพ็คเกจสำหรับ Python, R และสามารถดาวน์โหลด
แตกต่างจาก R, Python ไม่ได้ถูกสร้างขึ้นจากพื้นดินโดยคำนึงถึงวิทยาศาสตร์ข้อมูล แต่มีห้องสมุดบุคคลที่สามมากมายที่จะทำสิ่งนี้ รายการแพ็คเกจที่ละเอียดถี่ถ้วนยิ่งขึ้นสามารถพบได้ในภายหลังในเอกสารนี้ แต่แพ็คเกจทั้งสี่นี้เป็นชุดของตัวเลือกที่ดีในการเริ่มต้นการเดินทางทางวิทยาศาสตร์ข้อมูลของคุณด้วย: Scikit-Learn เป็นแพ็คเกจวิทยาศาสตร์ข้อมูลวัตถุประสงค์ทั่วไปซึ่งใช้อัลกอริทึมที่ได้รับความนิยมมากที่สุด แม้ว่าคุณต้องการเขียนการใช้งานของคุณเอง Scikit-Learn เป็นข้อมูลอ้างอิงที่มีค่าสำหรับถั่วและโบลท์ที่อยู่เบื้องหลังอัลกอริทึมทั่วไปที่คุณจะพบ ด้วย pandas หนึ่งสามารถรวบรวมและวิเคราะห์ข้อมูลของพวกเขาในรูปแบบตารางที่สะดวก Numpy ให้เครื่องมือที่รวดเร็วมากสำหรับการดำเนินการทางคณิตศาสตร์โดยมุ่งเน้นไปที่เวกเตอร์และเมทริกซ์ Seborn ซึ่งขึ้นอยู่กับแพ็คเกจ Matplotlib เป็นวิธีที่รวดเร็วในการสร้างการสร้างภาพข้อมูลที่สวยงามของข้อมูลของคุณโดยมีค่าเริ่มต้นที่ดีมากมายที่มีอยู่นอกกรอบรวมถึงแกลเลอรี่ที่แสดงวิธีการสร้างการสร้างภาพข้อมูลทั่วไปของข้อมูลของคุณ
เมื่อเริ่มต้นการเดินทางของคุณเพื่อเป็นนักวิทยาศาสตร์ข้อมูลการเลือกภาษาไม่สำคัญอย่างยิ่งและทั้ง Python และ R มีข้อดีและข้อเสียของพวกเขา เลือกภาษาที่คุณชอบและตรวจสอบหนึ่งในหลักสูตรฟรีที่เราระบุไว้ด้านล่าง!
^ back to top ^
Data Science เป็นเครื่องมือที่ทรงพลังที่ใช้ในสาขาต่าง ๆ เพื่อแก้ปัญหาในโลกแห่งความเป็นจริงโดยการแยกข้อมูลเชิงลึกและรูปแบบจากข้อมูลที่ซับซ้อน
^ back to top ^
^ back to top ^
คุณเรียนรู้วิทยาศาสตร์ข้อมูลได้อย่างไร? โดยการทำวิทยาศาสตร์ข้อมูลแน่นอน! โอเคโอเค - นั่นอาจไม่เป็นประโยชน์อย่างยิ่งเมื่อคุณเริ่มต้นครั้งแรก ในส่วนนี้เราได้ระบุแหล่งข้อมูลการเรียนรู้บางอย่างตามลำดับจากความมุ่งมั่นอย่างน้อยไปจนถึงความมุ่งมั่นที่ยิ่งใหญ่ที่สุด - แบบฝึกหัดหลักสูตรออนไลน์ที่เปิดกว้าง (MOOCs) โปรแกรมที่เข้มข้นและวิทยาลัย
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
ส่วนนี้เป็นชุดของแพ็คเกจเครื่องมืออัลกอริทึมและรายการที่มีประโยชน์อื่น ๆ ในโลกวิทยาศาสตร์ข้อมูล
^ back to top ^
นี่คืออัลกอริทึมการเรียนรู้ของเครื่องและการขุดข้อมูลและแบบจำลองช่วยให้คุณเข้าใจข้อมูลของคุณและได้รับความหมายจากมัน
^ back to top ^
^ back to top ^
^ back to top ^
| การเชื่อมโยง | คำอธิบาย |
|---|---|
| กระบวนการวงจรชีวิตวิทยาศาสตร์ข้อมูล | กระบวนการ Lifecycle Data Science เป็นกระบวนการในการนำทีมวิทยาศาสตร์ข้อมูลจากแนวคิดไปสู่การให้ความสำคัญซ้ำ ๆ และยั่งยืน กระบวนการนี้ได้รับการบันทึกไว้ใน repo นี้ |
| ข้อมูลวงจรชีวิตวิทยาศาสตร์ข้อมูล repo | ที่เก็บแม่แบบสำหรับโครงการวงจรชีวิตวิทยาศาสตร์ข้อมูล |
| rexmex | ห้องสมุดตัวชี้วัดผู้แนะนำผู้แนะนำวัตถุประสงค์เพื่อการประเมินผลอย่างเป็นธรรม |
| สารเคมี | ห้องสมุดการเรียนรู้เชิงลึกที่ใช้ Pytorch สำหรับการให้คะแนนคู่ยา |
| Pytorch Geometric ชั่วคราว | การเป็นตัวแทนการเรียนรู้บนกราฟแบบไดนามิก |
| ลูกบอลเล็ก ๆ | ไลบรารีการสุ่มตัวอย่างกราฟสำหรับ NetworkX ที่มี scikit-learn เช่น API |
| คาราเต้คลับ | ไลบรารีส่วนขยายการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแลสำหรับ NetworkX ด้วย Scikit-learn เช่น API |
| ML Workspace | IDE บนเว็บทั้งหมดสำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล เวิร์กสเปซถูกปรับใช้เป็นคอนเทนเนอร์ Docker และโหลดไว้ล่วงหน้าด้วยห้องสมุดวิทยาศาสตร์ข้อมูลยอดนิยมที่หลากหลาย (เช่น TensorFlow, Pytorch) และเครื่องมือ Dev (เช่น Jupyter, VS Code) |
| neptune.ai | แพลตฟอร์มที่เป็นมิตรกับชุมชนสนับสนุนนักวิทยาศาสตร์ด้านข้อมูลในการสร้างและแบ่งปันรูปแบบการเรียนรู้ของเครื่อง ดาวเนปจูนอำนวยความสะดวกในการทำงานเป็นทีมการจัดการโครงสร้างพื้นฐานการเปรียบเทียบแบบจำลองและการทำซ้ำ |
| แอบ | Lightweight, Python Library สำหรับการทดลองการเรียนรู้ของเครื่องที่รวดเร็วและทำซ้ำได้ แนะนำอินเทอร์เฟซที่ง่ายมากที่ช่วยให้การออกแบบท่อเรียนรู้ของเครื่องจักรที่สะอาด |
| Steppy-Toolkit | คอลเลกชันที่รวบรวมไว้ของเครือข่ายประสาทหม้อแปลงและโมเดลที่ทำให้การเรียนรู้ของเครื่องของคุณทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น |
| Datalab จาก Google | สำรวจสร้างภาพวิเคราะห์และแปลงข้อมูลได้อย่างง่ายดายโดยใช้ภาษาที่คุ้นเคยเช่น Python และ SQL แบบโต้ตอบ |
| Hortonworks Sandbox | เป็นสภาพแวดล้อม Hadoop แบบพกพาที่มาพร้อมกับบทช่วยสอน Hadoop แบบโต้ตอบหลายสิบ |
| R | เป็นสภาพแวดล้อมซอฟต์แวร์ฟรีสำหรับการคำนวณทางสถิติและกราฟิก |
| เป็นระเบียบ | เป็นคอลเลกชันที่มีความคิดเห็นของแพ็คเกจ R ที่ออกแบบมาสำหรับวิทยาศาสตร์ข้อมูล แพ็คเกจทั้งหมดมีปรัชญาการออกแบบพื้นฐานไวยากรณ์และโครงสร้างข้อมูล |
| rstudio | IDE - อินเทอร์เฟซผู้ใช้ที่ทรงพลังสำหรับ R เป็นฟรีและโอเพ่นซอร์สและทำงานบน Windows, Mac และ Linux |
| Python - Pandas - Anaconda | การกระจายงูหลามที่พร้อมใช้งานขององค์กรฟรีสำหรับการประมวลผลข้อมูลขนาดใหญ่การวิเคราะห์เชิงพยากรณ์และการคำนวณทางวิทยาศาสตร์ |
| แพนด้า GUI | แพนด้า GUI |
| Scikit-learn | การเรียนรู้ของเครื่องจักรใน Python |
| นม | Numpy เป็นพื้นฐานสำหรับการคำนวณทางวิทยาศาสตร์กับ Python รองรับอาร์เรย์และเมทริกซ์ขนาดใหญ่หลายมิติและรวมถึงฟังก์ชั่นทางคณิตศาสตร์ระดับสูงเพื่อใช้งานในอาร์เรย์เหล่านี้ |
| Vaex | VAEX เป็นไลบรารี Python ที่ให้คุณเห็นภาพชุดข้อมูลขนาดใหญ่และคำนวณสถิติด้วยความเร็วสูง |
| คนขี้เกียจ | Scipy ทำงานร่วมกับอาร์เรย์ NumPy และให้รูทีนที่มีประสิทธิภาพสำหรับการรวมตัวเลขและการเพิ่มประสิทธิภาพ |
| กล่องเครื่องมือวิทยาศาสตร์ข้อมูล | หลักสูตร Coursera |
| กล่องเครื่องมือวิทยาศาสตร์ข้อมูล | บล็อก |
| แพลตฟอร์มวิทยาศาสตร์ข้อมูล Wolfram | รับข้อมูลเชิงตัวเลขข้อความภาพ GIS หรือข้อมูลอื่น ๆ และให้การรักษา Wolfram ดำเนินการวิเคราะห์ข้อมูลวิทยาศาสตร์และการสร้างภาพข้อมูลอย่างเต็มรูปแบบ |
| ดาต้าด็อก | โซลูชันรหัสและ DevOps สำหรับวิทยาศาสตร์ข้อมูลระดับสูง |
| ความแปรปรวน | สร้างการสร้างภาพข้อมูลที่ทรงพลังสำหรับเว็บโดยไม่ต้องเขียน JavaScript |
| ชุดพัฒนาว่าว | ชุดพัฒนาซอฟต์แวร์ Kite (Apache License, Version 2.0) หรือ Kite สำหรับระยะสั้นคือชุดของห้องสมุดเครื่องมือตัวอย่างและเอกสารที่มุ่งเน้นไปที่การสร้างระบบบนระบบนิเวศ Hadoop ได้ง่ายขึ้น |
| Domino Data Labs | เรียกใช้สเกลแบ่งปันและปรับใช้โมเดลของคุณ - โดยไม่มีโครงสร้างพื้นฐานหรือการตั้งค่าใด ๆ |
| Apache Flink | แพลตฟอร์มสำหรับการประมวลผลข้อมูลที่มีประสิทธิภาพกระจายและมีวัตถุประสงค์ทั่วไป |
| Apache Hama | Apache Hama เป็นโครงการโอเพ่นซอร์สระดับบนสุดของ Apache ช่วยให้คุณทำการวิเคราะห์ขั้นสูงนอกเหนือจาก MapReduce |
| Weka | Weka เป็นชุดของอัลกอริทึมการเรียนรู้ของเครื่องสำหรับงานการขุดข้อมูล |
| อ็อกเทฟ | GNU Octave เป็นภาษาที่ตีความระดับสูงซึ่งส่วนใหญ่มีไว้สำหรับการคำนวณเชิงตัวเลข (ฟรี MATLAB) |
| Apache Spark | การคำนวณคลัสเตอร์ที่รวดเร็วฟ้าผ่า |
| Hydrosphere Mist | บริการสำหรับการเปิดเผยงาน Apache Spark Analytics และโมเดลการเรียนรู้ของเครื่องเป็นบริการแบบเรียลไทม์แบทช์หรือบริการเว็บแบบปฏิกิริยา |
| กลไกข้อมูล | แพลตฟอร์มวิทยาศาสตร์ข้อมูลและวิศวกรรมที่ทำให้ Apache จุดประกายให้นักพัฒนาเป็นมิตรและคุ้มค่ามากขึ้น |
| คาเฟอีน | กรอบการเรียนรู้ลึก |
| คบเพลิง | กรอบการคำนวณทางวิทยาศาสตร์สำหรับ luajit |
| กรอบการเรียนรู้เชิงลึกของ Python ของ Nervana | Intel® Nervana ™อ้างอิงกรอบการเรียนรู้ลึกที่มุ่งมั่นเพื่อประสิทธิภาพที่ดีที่สุดสำหรับฮาร์ดแวร์ทั้งหมด |
| สเก็ต | การประมวลผลข้อมูลแบบกระจายประสิทธิภาพสูงใน nodejs |
| ละอองลอย | แพ็คเกจการเรียนรู้ของเครื่องจักรที่สร้างขึ้นสำหรับมนุษย์ |
| กรอบ Intel | กรอบการเรียนรู้ลึกIntel® |
| DataWrapper | แพลตฟอร์มการสร้างภาพข้อมูลโอเพ่นซอร์สช่วยให้ทุกคนสร้างแผนภูมิที่เรียบง่ายถูกต้องและฝังได้ นอกจากนี้ที่ github.com |
| เทนเซอร์ | TensorFlow เป็นไลบรารีซอฟต์แวร์โอเพ่นซอร์สสำหรับ Machine Intelligence |
| ชุดเครื่องมือภาษาธรรมชาติ | ชุดเครื่องมือเบื้องต้น แต่ทรงพลังสำหรับการประมวลผลภาษาธรรมชาติและการจำแนกประเภท |
| ห้องปฏิบัติการคำอธิบายประกอบ | แพลตฟอร์ม No-Code แบบ end-to-end ฟรีสำหรับคำอธิบายประกอบข้อความและการฝึกอบรม/ปรับแต่งโมเดล DL การสนับสนุนนอกกรอบสำหรับการจดจำเอนทิตีที่มีชื่อการจำแนกการแยกความสัมพันธ์และสถานะการยืนยันจุดประกายโมเดล NLP การสนับสนุนไม่ จำกัด สำหรับผู้ใช้ทีมโครงการเอกสาร |
| nlp-toolkit สำหรับ node.js | โมดูลนี้ครอบคลุมหลักการและการใช้งาน NLP พื้นฐานบางอย่าง จุดสนใจหลักคือประสิทธิภาพ เมื่อเราจัดการกับตัวอย่างหรือข้อมูลการฝึกอบรมใน NLP เราจะหมดหน่วยความจำอย่างรวดเร็ว ดังนั้นการใช้งานทุกครั้งในโมดูลนี้จะถูกเขียนเป็นสตรีมเพื่อเก็บข้อมูลไว้ในหน่วยความจำที่ถูกประมวลผลในทุกขั้นตอน |
| จูเลีย | ภาษาการเขียนโปรแกรมแบบไดนามิกระดับสูงระดับสูงสำหรับการคำนวณทางเทคนิค |
| Ijulia | แบ็กเอนด์ภาษาจูเลียรวมกับสภาพแวดล้อมเชิงโต้ตอบของ Jupyter |
| Apache Zeppelin | สมุดบันทึกบนเว็บที่เปิดใช้งานการวิเคราะห์ข้อมูลแบบอินเทอร์แอคทีฟและเอกสารร่วมกันกับ SQL, Scala และอีกมากมาย |
| fileturetools | เฟรมเวิร์กโอเพ่นซอร์สสำหรับวิศวกรรมคุณลักษณะอัตโนมัติที่เขียนใน Python |
| Optimus | การทำความสะอาดการประมวลผลล่วงหน้าวิศวกรรมคุณลักษณะการวิเคราะห์ข้อมูลเชิงสำรวจและ ML ง่าย ๆ ด้วยแบ็กเอนด์ Pyspark |
| อัลบิวชั่น | ห้องสมุดการเสริมภาพที่รวดเร็วและเฟรมเวิร์กซึ่งใช้เทคนิคการเสริมที่หลากหลาย รองรับการจำแนกประเภทการแบ่งส่วนและการตรวจจับนอกกรอบ ถูกใช้เพื่อชนะการแข่งขันการเรียนรู้อย่างลึกซึ้งจำนวนมากที่ Kaggle, Topcoder และผู้ที่เป็นส่วนหนึ่งของการประชุมเชิงปฏิบัติการ CVPR |
| ดีวีดี | ระบบควบคุมเวอร์ชัน Data Science โอเพนซอร์ซ ช่วยติดตามจัดระเบียบและทำให้โครงการวิทยาศาสตร์ข้อมูลทำซ้ำได้ ในสถานการณ์พื้นฐานที่มากมันจะช่วยควบคุมเวอร์ชันและแบ่งปันไฟล์ข้อมูลขนาดใหญ่และโมเดล |
| ลัมโด | เป็นเอ็นจิ้นเวิร์กโฟลว์ที่ทำให้การวิเคราะห์ข้อมูลง่ายขึ้นอย่างมีนัยสำคัญโดยการรวมในการวิเคราะห์หนึ่งไปป์ไลน์ (I) คุณลักษณะวิศวกรรมและการเรียนรู้ของเครื่อง (II) การฝึกอบรมแบบจำลองและการทำนาย (III) ประชากรตารางและการประเมินคอลัมน์ |
| งานเลี้ยง | ร้านค้าคุณลักษณะสำหรับการจัดการการค้นพบและการเข้าถึงคุณสมบัติการเรียนรู้ของเครื่อง งานเลี้ยงให้มุมมองที่สอดคล้องกันของข้อมูลคุณสมบัติสำหรับทั้งการฝึกอบรมแบบจำลองและการให้บริการแบบจำลอง |
| polyaxon | แพลตฟอร์มสำหรับการเรียนรู้ของเครื่องที่ทำซ้ำได้และปรับขนาดได้และการเรียนรู้อย่างลึกซึ้ง |
| แท็กเบา ๆ | เครื่องมือคำอธิบายประกอบข้อความสำหรับทีม |
| Ubiai | เครื่องมือคำอธิบายประกอบข้อความที่ใช้งานง่ายสำหรับทีมที่มีฟีเจอร์ Auto-Annotation ที่ครอบคลุมมากที่สุด สนับสนุน NER, ความสัมพันธ์และการจำแนกเอกสารรวมถึงคำอธิบายประกอบ OCR สำหรับการติดฉลากใบแจ้งหนี้ |
| รถไฟ | ตัวจัดการการทดลองแบบ Auto-Magical, Version Control & DevOps สำหรับ AI |
| Hopsworks | แพลตฟอร์มการเรียนรู้ของเครื่องจักรที่ใช้ข้อมูลแบบโอเพนซอร์ซพร้อมร้านค้าคุณลักษณะ การบริโภคและจัดการคุณสมบัติสำหรับทั้งออนไลน์ (MySQL คลัสเตอร์) และออฟไลน์ (Apache Hive) การเข้าถึงฝึกอบรมและให้บริการรุ่นในระดับ |
| MindSDB | MindSDB เป็นเฟรมเวิร์ก AutomL ที่อธิบายได้สำหรับนักพัฒนา ด้วย MindSDB คุณสามารถสร้างฝึกอบรมและใช้โมเดล State of Art ML ได้ง่ายเหมือนรหัสบรรทัดเดียว |
| ไม้ชนิดหนึ่ง | เฟรมเวิร์กที่ใช้ Pytorch ซึ่งแบ่งปัญหาการเรียนรู้ของเครื่องออกเป็นบล็อกขนาดเล็กที่สามารถติดกันได้อย่างราบรื่นโดยมีวัตถุประสงค์เพื่อสร้างแบบจำลองการทำนายด้วยรหัสหนึ่งบรรทัด |
| aws data wrangler | แพ็คเกจ Python โอเพนซอร์ซที่ขยายพลังของไลบรารี Pandas ไปยัง AWS ที่เชื่อมต่อ DataFrames และบริการที่เกี่ยวข้องกับข้อมูล AWS (Amazon Redshift, AWS Glue, Amazon Athena, Amazon EMR ฯลฯ ) |
| Amazon Rekognition | AWS Rekognition เป็นบริการที่ให้นักพัฒนาทำงานกับ Amazon Web Services เพิ่มการวิเคราะห์ภาพลงในแอปพลิเคชันของพวกเขา สินทรัพย์แคตตาล็อกเวิร์กโฟลว์อัตโนมัติและแยกความหมายออกจากสื่อและแอปพลิเคชันของคุณ |
| Amazon Textract | แยกข้อความที่พิมพ์ด้วยลายมือและข้อมูลจากเอกสารใด ๆ โดยอัตโนมัติ |
| Amazon Lookout for Vision | สปอตผลิตภัณฑ์ข้อบกพร่องโดยใช้วิสัยทัศน์คอมพิวเตอร์เพื่อตรวจสอบคุณภาพโดยอัตโนมัติ ระบุส่วนประกอบผลิตภัณฑ์ที่ขาดหายไปความเสียหายจากยานพาหนะและโครงสร้างและความผิดปกติสำหรับการควบคุมคุณภาพที่ครอบคลุม |
| Amazon Codeguru | ทำการตรวจสอบรหัสโดยอัตโนมัติและเพิ่มประสิทธิภาพแอปพลิเคชันด้วยคำแนะนำที่ขับเคลื่อนด้วย ML |
| CML | ชุดเครื่องมือโอเพ่นซอร์สสำหรับการใช้การรวมอย่างต่อเนื่องในโครงการวิทยาศาสตร์ข้อมูล ฝึกอบรมโมเดลและทดสอบโดยอัตโนมัติในสภาพแวดล้อมที่มีการผลิตด้วยการกระทำของ GitHub & Gitlab CI และรายงานการมองเห็นแบบอัตโนมัติเกี่ยวกับคำขอดึง/ผสาน |
| ผ้าคลุม | ไลบรารี Python โอเพนซอร์สเพื่อเปลี่ยนรหัสการวิเคราะห์ของคุณอย่างไม่เจ็บปวดไปเป็นระบบคอมพิวเตอร์แบบกระจาย (ข้อมูลขนาดใหญ่) |
| รูปแบบ | สถิติเชิงอนุมานแบบงูเหลือมการทดสอบสมมติฐานและกรอบการถดถอย |
| เครื่องถ่อมตัว | ห้องสมุดโอเพนซอร์ซสำหรับการสร้างแบบจำลองหัวข้อของข้อความภาษาธรรมชาติ |
| เครื่องราง | ชุดเครื่องมือประมวลผลภาษาธรรมชาติที่มีประสิทธิภาพ |
| สตูดิโอกริด | Grid Studio เป็นแอปพลิเคชั่นสเปรดชีตบนเว็บที่มีการรวมภาษาการเขียนโปรแกรม Python เต็มรูปแบบ |
| คู่มือวิทยาศาสตร์ข้อมูล Python | คู่มือวิทยาศาสตร์ข้อมูล Python: ข้อความเต็มในสมุดบันทึก Jupyter |
| ซีด | เฟรมเวิร์กที่ขับเคลื่อนด้วยข้อมูลเพื่อหาปริมาณของตัวแยกประเภทในชุดการเรียนรู้ของเครื่อง |
| dagshub | แพลตฟอร์มที่สร้างขึ้นบนเครื่องมือโอเพ่นซอร์สสำหรับข้อมูลโมเดลและการจัดการท่อ |
| ลึกล้ำ | สมุดบันทึกวิทยาศาสตร์ข้อมูลรูปแบบใหม่ เข้ากันได้กับ Jupyter ด้วยการทำงานร่วมกันแบบเรียลไทม์และทำงานในระบบคลาวด์ |
| Valohai | แพลตฟอร์ม MLOPS ที่จัดการการจัดแต่งเครื่องจักรการทำซ้ำโดยอัตโนมัติและการปรับใช้ |
| PYMC3 | ไลบรารี Python สำหรับการเขียนโปรแกรม probabalistic (การอนุมานแบบเบย์และการเรียนรู้ของเครื่อง) |
| Pystan | อินเทอร์เฟซ Python ไปยัง Stan (การอนุมานแบบเบย์และการสร้างแบบจำลอง) |
| อืมม | การเรียนรู้ที่ไม่ได้รับการดูแลและการอนุมานของโมเดล Markov ที่ซ่อนอยู่ |
| ความโกลาหลอัจฉริยะ | ML Powered Analytics Engine สำหรับการตรวจจับค่าผิดปกติ/ความผิดปกติและการวิเคราะห์สาเหตุรูต |
| nimblebox | แพลตฟอร์ม MLOPS แบบเต็มรูปแบบที่ออกแบบมาเพื่อช่วยนักวิทยาศาสตร์ด้านข้อมูลและผู้ปฏิบัติงานการเรียนรู้ของเครื่องทั่วโลกค้นพบสร้างและเปิดตัวแอพพลิเคชั่นหลายคลาวด์จากเว็บเบราว์เซอร์ของพวกเขา |
| พ่วง | ไลบรารี Python ที่ช่วยให้คุณเข้ารหัสข้อมูลที่ไม่มีโครงสร้างของคุณเป็น Embeddings |
| มีเส้นสาย | เคยผิดหวังกับการทำความสะอาดสมุดบันทึก Jupyter ที่ยุ่งเหยิงมานานหรือไม่? ด้วย Lineapy ไลบรารี Python โอเพ่นซอร์สใช้รหัสเพียงสองบรรทัดในการแปลงรหัสการพัฒนาที่ยุ่งเหยิงให้เป็นท่อผลิต |
| envd | ️สภาพแวดล้อมการพัฒนาการเรียนรู้ของเครื่องจักรสำหรับวิทยาศาสตร์ข้อมูลและทีมวิศวกรรม AI/ML |
| สำรวจห้องสมุดวิทยาศาสตร์ข้อมูล | เครื่องมือค้นหา? เครื่องมือในการค้นพบและค้นหารายการห้องสมุดยอดนิยมและใหม่ผู้เขียนชั้นนำชุดโครงการที่ได้รับความนิยมการอภิปรายการสอนและแหล่งเรียนรู้ |
| mlem | - เวอร์ชันและปรับใช้โมเดล ML ของคุณตามหลักการ Gitops |
| mlflow | MLOPS Framework สำหรับการจัดการโมเดล ML ในวงจรชีวิตเต็มรูปแบบของพวกเขา |
| ทำความสะอาด | Library Python สำหรับ AI ที่เน้นข้อมูลเป็นศูนย์กลางและตรวจจับปัญหาต่าง ๆ ในชุดข้อมูล ML โดยอัตโนมัติ |
| autogluon | AutomL เพื่อสร้างการคาดการณ์ที่แม่นยำสำหรับภาพข้อความตารางเวลาอนุกรมเวลาและข้อมูลหลายโหมด |
| arize ai | เครื่องมือการสังเกตระดับชุมชน AI AI สำหรับการตรวจสอบรูปแบบการเรียนรู้ของเครื่องในการผลิตและปัญหาที่ทำให้เกิดรากเช่นคุณภาพข้อมูลและการดริฟท์ประสิทธิภาพ |
| aureo.io | aureo.io เป็นแพลตฟอร์มรหัสต่ำที่มุ่งเน้นไปที่การสร้างปัญญาประดิษฐ์ มันให้ความสามารถแก่ผู้ใช้ในการสร้างท่อระบบอัตโนมัติและรวมเข้ากับโมเดลปัญญาประดิษฐ์ - ทั้งหมดด้วยข้อมูลพื้นฐานของพวกเขา |
| ห้องแล็บ ERD | เครื่องมือไดอะแกรมความสัมพันธ์เอนทิตีบนคลาวด์ฟรี (ERD) ที่สร้างขึ้นสำหรับนักพัฒนา |
| arize-phoenix | Mlops ในสมุดบันทึก - เปิดเผยข้อมูลเชิงลึกปัญหาพื้นผิวการตรวจสอบและปรับแต่งโมเดลของคุณอย่างละเอียด |
| ดาวหาง | แพลตฟอร์ม MLOPS พร้อมการติดตามการทดลองการจัดการการผลิตแบบจำลองรีจิสทรีแบบจำลองและสายเลือดข้อมูลเต็มรูปแบบเพื่อรองรับเวิร์กโฟลว์ ML ของคุณตั้งแต่การฝึกอบรมตรงไปจนถึงการผลิต |
| opik | ประเมินทดสอบและจัดส่งแอปพลิเคชั่น LLM ในวงจรชีวิตและการผลิตของคุณ |
| สังเคราะห์ | สภาพแวดล้อมการทำงานร่วมกันของ AI ที่ใช้พลังงานสำหรับการวิจัย ค้นหาเอกสารที่เกี่ยวข้องสร้างคอลเลกชันเพื่อจัดการบรรณานุกรมและสรุปเนื้อหา - ทั้งหมดในที่เดียว |
| ลูกผู้ชาย | เครื่องมือเวิร์กโฟลว์เพื่อจัดระเบียบเอาต์พุตการสร้างภาพข้อมูลโดยอัตโนมัติ |
| มีแสงสว่าง | Framework App สำหรับการเรียนรู้ของเครื่องและโครงการวิทยาศาสตร์ข้อมูล |
| Gradeio | สร้างส่วนประกอบ UI ที่ปรับแต่งได้รอบรูปแบบการเรียนรู้ของเครื่องจักร |
| น้ำหนักและอคติ | การติดตามการทดลองการกำหนดเวอร์ชันชุดข้อมูลและการจัดการแบบจำลอง |
| ดีวีดี | ระบบควบคุมเวอร์ชันโอเพนซอร์ซสำหรับโครงการเรียนรู้ของเครื่องจักร |
| Optuna | เฟรมเวิร์กการเพิ่มประสิทธิภาพของพารามิเตอร์ hyperparameter อัตโนมัติ |
| เพลงเรย์ | ไลบรารีปรับแต่งพารามิเตอร์ hyperparameter ที่ปรับขนาดได้ |
| Apache Airflow | แพลตฟอร์มไปยังผู้เขียนกำหนดเวลาและตรวจสอบเวิร์กโฟลว์โดยทางโปรแกรม |
| นายอำเภอ | ระบบการจัดการเวิร์กโฟลว์สำหรับสแต็คข้อมูลที่ทันสมัย |
| Kedro | Framework Python โอเพนซอร์ซสำหรับการสร้างรหัสวิทยาศาสตร์ข้อมูลที่ทำซ้ำได้และบำรุงรักษาได้ |
| แฮมิลตัน | ห้องสมุดที่มีน้ำหนักเบาเพื่อแต่งและจัดการการแปลงข้อมูลที่เชื่อถือได้ |
| ผัด | แนวทางทฤษฎีเกมเพื่ออธิบายผลลัพธ์ของรูปแบบการเรียนรู้ของเครื่องใด ๆ |
| มะนาว | การอธิบายการคาดการณ์ของตัวจําแนกการเรียนรู้ของเครื่องใด ๆ |
| แมลงวัน | แพลตฟอร์มระบบอัตโนมัติเวิร์กโฟลว์สำหรับการเรียนรู้ของเครื่อง |
| DBT | เครื่องมือสร้างข้อมูล |
| ผัด | แนวทางทฤษฎีเกมเพื่ออธิบายผลลัพธ์ของรูปแบบการเรียนรู้ของเครื่องใด ๆ |
| มะนาว | การอธิบายการคาดการณ์ของตัวจําแนกการเรียนรู้ของเครื่องใด ๆ |
^ back to top ^
ส่วนนี้รวมถึงเนื้อหาการอ่านเพิ่มเติมช่องทางที่จะดูและพูดคุยเพื่อฟัง
^ back to top ^
eBook sale - Save up to 45% on eBooks!
Causal Machine Learning
Managing ML Projects
Causal Inference for Data Science
Data for All
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
^ back to top ^
Below are some Social Media links. Connect with other data scientists!
^ back to top ^
^ back to top ^
| คำอธิบาย | |
|---|---|
| Big Data Combine | Rapid-fire, live tryouts for data scientists seeking to monetize their models as trading strategies |
| Big Data Mania | Data Viz Wiz, Data Journalist, Growth Hacker, Author of Data Science for Dummies (2015) |
| Big Data Science | Big Data, Data Science, Predictive Modeling, Business Analytics, Hadoop, Decision and Operations Research. |
| Charlie Greenbacker | Director of Data Science at @ExploreAltamira |
| Chris Said | Data scientist at Twitter |
| Clare Corthell | Dev, Design, Data Science @mattermark #hackerei |
| DADI Charles-Abner | #datascientist @Ekimetrics. , #machinelearning #dataviz #DynamicCharts #Hadoop #R #Python #NLP #Bitcoin #dataenthousiast |
| Data Science Central | Data Science Central is the industry's single resource for Big Data practitioners. |
| Data Science London | Data Science. Big Data. Data Hacks. Data Junkies. Data Startups. Open Data |
| Data Science Renee | Documenting my path from SQL Data Analyst pursuing an Engineering Master's Degree to Data Scientist |
| Data Science Report | Mission is to help guide & advance careers in Data Science & Analytics |
| Data Science Tips | Tips and Tricks for Data Scientists around the world! #datascience #bigdata |
| Data Vizzard | DataViz, Security, Military |
| DataScienceX | |
| deeplearning4j | |
| DJ Patil | White House Data Chief, VP @ RelateIQ. |
| Domino Data Lab | |
| Drew Conway | Data nerd, hacker, student of conflict. |
| Emilio Ferrara | #Networks, #MachineLearning and #DataScience. I work on #Social Media. Postdoc at @IndianaUniv |
| Erin Bartolo | Running with #BigData--enjoying a love/hate relationship with its hype. @iSchoolSU #DataScience Program Mgr. |
| Greg Reda | Working @ GrubHub about data and pandas |
| Gregory Piatetsky | KDnuggets President, Analytics/Big Data/Data Mining/Data Science expert, KDD & SIGKDD co-founder, was Chief Scientist at 2 startups, part-time philosopher. |
| Hadley Wickham | Chief Scientist at RStudio, and an Adjunct Professor of Statistics at the University of Auckland, Stanford University, and Rice University. |
| Hakan Kardas | Data Scientist |
| Hilary Mason | Data Scientist in Residence at @accel. |
| Jeff Hammerbacher | ReTweeting about data science |
| John Myles White | Scientist at Facebook and Julia developer. Author of Machine Learning for Hackers and Bandit Algorithms for Website Optimization. Tweets reflect my views only. |
| Juan Miguel Lavista | Principal Data Scientist @ Microsoft Data Science Team |
| Julia Evans | Hacker - Pandas - Data Analyze |
| Kenneth Cukier | The Economist's Data Editor and co-author of Big Data (http://www.big-data-book.com/). |
| Kevin Davenport | Organizer of https://www.meetup.com/San-Diego-Data-Science-R-Users-Group/ |
| Kevin Markham | Data science instructor, and founder of Data School |
| Kim Rees | Interactive data visualization and tools. Data flaneur. |
| Kirk Borne | DataScientist, PhD Astrophysicist, Top #BigData Influencer. |
| Linda Regber | Data storyteller, visualizations. |
| Luis Rei | PhD Student. Programming, Mobile, Web. Artificial Intelligence, Intelligent Robotics Machine Learning, Data Mining, Natural Language Processing, Data Science. |
| Mark Stevenson | Data Analytics Recruitment Specialist at Salt (@SaltJobs) Analytics - Insight - Big Data - Data science |
| Matt Harrison | Opinions of full-stack Python guy, author, instructor, currently playing Data Scientist. Occasional fathering, husbanding, organic gardening. |
| Matthew Russell | Mining the Social Web. |
| Mert Nuhoğlu | Data Scientist at BizQualify, Developer |
| Monica Rogati | Data @ Jawbone. Turned data into stories & products at LinkedIn. Text mining, applied machine learning, recommender systems. Ex-gamer, ex-machine coder; namer. |
| Noah Iliinsky | Visualization & interaction designer. Practical cyclist. Author of vis books: https://www.oreilly.com/pub/au/4419 |
| Paul Miller | Cloud Computing/ Big Data/ Open Data Analyst & Consultant. Writer, Speaker & Moderator. Gigaom Research Analyst. |
| Peter Skomoroch | Creating intelligent systems to automate tasks & improve decisions. Entrepreneur, ex-Principal Data Scientist @LinkedIn. Machine Learning, ProductRei, Networks |
| Prash Chan | Solution Architect @ IBM, Master Data Management, Data Quality & Data Governance Blogger. Data Science, Hadoop, Big Data & Cloud. |
| Quora Data Science | Quora's data science topic |
| R-Bloggers | Tweet blog posts from the R blogosphere, data science conferences, and (!) open jobs for data scientists. |
| Rand Hindi | |
| Randy Olson | Computer scientist researching artificial intelligence. Data tinkerer. Community leader for @DataIsBeautiful. #OpenScience advocate. |
| Recep Erol | Data Science geek @ UALR |
| Ryan Orban | Data scientist, genetic origamist, hardware aficionado |
| Sean J. Taylor | Social Scientist. Hacker. Facebook Data Science Team. Keywords: Experiments, Causal Inference, Statistics, Machine Learning, Economics. |
| Silvia K. Spiva | #DataScience at Cisco |
| Harsh B. Gupta | Data Scientist at BBVA Compass |
| Spencer Nelson | Data nerd |
| Talha Oz | Enjoys ABM, SNA, DM, ML, NLP, HI, Python, Java. Top percentile Kaggler/data scientist |
| Tasos Skarlatidis | Complex Event Processing, Big Data, Artificial Intelligence and Machine Learning. Passionate about programming and open-source. |
| Terry Timko | InfoGov; Bigdata; Data as a Service; Data Science; Open, Social & Business Data Convergence |
| Tony Baer | IT analyst with Ovum covering Big Data & data management with some systems engineering thrown in. |
| Tony Ojeda | Data Scientist , Author , Entrepreneur. Co-founder @DataCommunityDC. Founder @DistrictDataLab. #DataScience #BigData #DataDC |
| Vamshi Ambati | Data Science @ PayPal. #NLP, #machinelearning; PhD, Carnegie Mellon alumni (Blog: https://allthingsds.wordpress.com ) |
| Wes McKinney | Pandas (Python Data Analysis library). |
| WileyEd | Senior Manager - @Seagate Big Data Analytics @McKinsey Alum #BigData + #Analytics Evangelist #Hadoop, #Cloud, #Digital, & #R Enthusiast |
| WNYC Data News Team | The data news crew at @WNYC. Practicing data-driven journalism, making it visual, and showing our work. |
| Alexey Grigorev | Data science author |
| İlker Arslan | Data science author. Shares mostly about Julia programming |
| หลีกเลี่ยงไม่ได้ | AI & Data Science Start-up Company based in England, UK |
^ back to top ^
สูงสุด
Some data mining competition platforms
^ back to top ^
| ดูตัวอย่าง | คำอธิบาย |
|---|---|
| Key differences of a data scientist vs. data engineer | |
| A visual guide to Becoming a Data Scientist in 8 Steps by DataCamp (img) | |
| Mindmap on required skills (img) | |
| Swami Chandrasekaran made a Curriculum via Metro map. | |
| by @kzawadz via twitter | |
| By Data Science Central | |
| Data Science Wars: R vs Python | |
| How to select statistical or machine learning techniques | |
| Choosing the Right Estimator | |
| The Data Science Industry: Who Does What | |
| วิทยาศาสตร์ข้อมูล | |
| Different Data Science Skills and Roles from this article by Springboard | |
| A simple and friendly way of teaching your non-data scientist/non-statistician colleagues how to avoid mistakes with data. From Geckoboard's Data Literacy Lessons. |
^ back to top ^
^ back to top ^