หลักสูตรการเรียนรู้ของเครื่องจักร
การเรียนรู้ของเครื่องเป็นสาขาของปัญญาประดิษฐ์ที่อุทิศให้กับการทำเครื่องจักรเรียนรู้จากข้อมูลเชิงสังเกตการณ์โดยไม่ได้รับการตั้งโปรแกรมอย่างชัดเจน
การเรียนรู้ของเครื่องจักรและ AI ไม่เหมือนกัน การเรียนรู้ของเครื่องเป็นเครื่องมือใน AI Symphony - ส่วนประกอบของ AI การเรียนรู้ของเครื่องคืออะไร - หรือ ML - แน่นอน? มันเป็นความสามารถสำหรับอัลกอริทึมในการเรียนรู้จากข้อมูลก่อนหน้าเพื่อสร้างพฤติกรรม ML กำลังสอนเครื่องจักรเพื่อตัดสินใจในสถานการณ์ที่พวกเขาไม่เคยเห็น
หลักสูตรนี้ทำขึ้นเพื่อแนะนำให้คุณเรียนรู้การเรียนรู้ของเครื่องแนะนำเครื่องมือและช่วยให้คุณยอมรับไลฟ์สไตล์ ML โดยแนะนำให้สื่อติดตาม ฉันอัปเดตเป็นประจำเพื่อรักษาความสดใหม่และกำจัดเนื้อหาที่ล้าสมัยและเครื่องมือที่เลิกใช้แล้ว
การเรียนรู้ของเครื่องโดยทั่วไป
ศึกษาส่วนนี้เพื่อทำความเข้าใจแนวคิดพื้นฐานและพัฒนาสัญชาตญาณก่อนที่จะลึกลงไป
โปรแกรมคอมพิวเตอร์ได้รับการกล่าวขานว่าเรียนรู้จากประสบการณ์ E เกี่ยวกับงานบางประเภทของงาน T และการวัดประสิทธิภาพ P หากประสิทธิภาพของงานในงาน T ซึ่งวัดโดย P , ปรับปรุงด้วยประสบการณ์ E
- องค์ประกอบของ AI หลักสูตรง่าย ๆ ที่สอน AI และการเรียนรู้ของเครื่องจักร
- Coms W4995 เครื่องประยุกต์การเรียนรู้สปริง 2020 วิดีโอและสไลด์ของหลักสูตร ML ที่ใช้จากมหาวิทยาลัยโคลัมเบีย
- หลักสูตรการเรียนรู้ของเครื่องจักรที่มีความคิดเห็นโดย fast.ai
- หลักสูตรการเรียนรู้การเรียนรู้ของเครื่องด้วย TensorFlow APIS ของ Google การแนะนำการเรียนรู้ของเครื่องจักรที่รวดเร็วและใช้งานได้จริง
- แนะนำการเรียนรู้ของเครื่อง - มือ Udacity บน Scikit -Learn (Python) การเรียนรู้การเขียนโปรแกรมเกี่ยวกับแนวคิดหลัก ML
- การเรียนรู้ของเครื่อง: ภายใต้การดูแล, ไม่ได้รับการสนับสนุนและการเสริมแรง - Udacity ผู้สอน 2 คนเป็นเฮฮา
- การเรียนรู้ของเครื่องจักรความเชี่ยวชาญอย่างรอบคอบจัดวางคู่มือทีละขั้นตอนสำหรับอัลกอริทึมบางอย่างโดยเฉพาะ
- ความเชี่ยวชาญเฉพาะด้านของ Andrew Ng ที่แนะนำสำหรับผู้ที่ต้องการทราบรายละเอียดของอัลกอริทึม ML ภายใต้ประทุนเข้าใจคณิตศาสตร์เพียงพอที่จะเป็นอันตรายและทำการเข้ารหัสใน Python
- สูตร ML - เพลย์ลิสต์ YouTube เนื้อหาที่ได้รับการออกแบบมาอย่างสวยงามสำหรับการแนะนำ ML
- การเรียนรู้ของเครื่องจักรเป็นความสนุกตอนที่ 1 แนวทางง่าย ๆ ในการเรียนรู้ของเครื่อง
- การเรียนรู้ด้วยเครื่องด้วย Python - เพลย์ลิสต์ YouTube
- การเรียนรู้ของเครื่องจักรการโหยหาโดย Andrew Ng
- การเชื่อมโยงไปถึงงานข้อมูล: หลักสูตรนี้เป็นแนวทางที่มีความคิดเห็นและเป็นประโยชน์สำหรับผู้ที่ต้องการมุ่งเน้นไปที่การลงจอด ตัวอย่างเช่นพวกเขาแนะนำว่าการรู้ว่าต้นไม้ตัดสินใจทำงานได้ดีพอที่จะดีพอคุณไม่จำเป็นต้องรู้ว่าโมเดลทั้งหมดทำงานอย่างไรซึ่งเป็นเรื่องจริง! แต่คำแนะนำนี้ส่วนใหญ่เป็นข้อมูลตาราง
- การเรียนรู้ด้วยเครื่องเซิร์ฟเวอร์สร้างบริการการทำนายแบบเซิร์ฟเวอร์การเรียนรู้ของเครื่องของคุณเอง
- MLOPs ที่มีประสิทธิภาพ: การพัฒนาแบบจำลองหลักสูตรฟรีโดยน้ำหนักและอคติพร้อมการรับรอง
- คณิตศาสตร์สำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูลวิชาความเชี่ยวชาญวิชาคณิตศาสตร์โดย Coursera
หนังสือ
- การเรียนรู้ของเครื่องด้วย Pytorch และ Scikit-Learn โดย Sebastian Raschka
- การเรียนรู้ด้วยเครื่องจักรด้วยการเรียนรู้ด้วย Scikit-Learn, Keras และ Tensorflow ฉบับที่ 2 โดยAurélienGéronเป็นหนังสือขายดีที่สุดเพราะมันยอดเยี่ยมมาก
- https://github.com/fastai/fastbook หนังสือ Fastai ตีพิมพ์เป็นสมุดบันทึก Jupyter
- https://www.deeplearningbook.org/ คณิตศาสตร์หนังสือหนักโดย Ian Goodfellow และ Yoshua Bengio และ Aaron Courville
- https://christophm.github.io/interpretable-ml-book/ คู่มือสำหรับการสร้างโมเดลกล่องดำอธิบายได้
- https://themlbook.com/ หนังสือการเรียนรู้ของเครื่องร้อยหน้าโดย Andriy Burkov
การเรียนรู้เสริมแรง
การสร้างเครื่องจักรที่รับรู้ถึงสภาพแวดล้อมแล้วเลือกนโยบายที่ดีที่สุด (การกระทำ) ให้ทำในสถานะใดก็ตามเพื่อเพิ่มรางวัลสเกลาร์ระยะยาวที่คาดหวังไว้เป็นเป้าหมายของการเรียนรู้การเสริมแรง
- Openai หมุนขึ้นนี้เป็นทรัพยากรทางการศึกษาที่ผลิตโดย OpenAI ซึ่งทำให้ง่ายต่อการเรียนรู้เกี่ยวกับการเรียนรู้การเสริมแรงอย่างลึกซึ้ง (Deep RL)
- การเสริมแรงขั้นพื้นฐานการเรียนรู้ชุดบทนำเพื่อการเรียนรู้การเสริมแรง (RL) ด้วยบทช่วยสอนทีละขั้นตอนที่ครอบคลุม
- หัวข้อขั้นสูง: RL 2015 (CompM050/CompGI13) โดย David Silver (คนที่อยู่เบื้องหลัง Alphago)
- หนังสือแนะนำโดย Richard S. Sutton และ Andrew G. Barto
- การเรียนรู้การเสริมแรงอย่างลึกซึ้ง: Pong จากพิกเซล
- การบรรยาย 10: การเรียนรู้การเสริมแรง - YouTube
- กระดาษสำรวจ
- การเรียนรู้การเสริมแรงอย่างลึกซึ้ง: บทช่วยสอน - Openai
- CS 294: การเรียนรู้การเสริมแรงลึก, ฤดูใบไม้ผลิ 2017
การเรียนรู้อย่างลึกซึ้ง
การเรียนรู้ลึกเป็นสาขาของการเรียนรู้ของเครื่องจักรที่เครือข่ายประสาทเทียมลึก (DNN) - อัลกอริทึมที่ได้รับแรงบันดาลใจจากวิธีการทำงานของเซลล์ประสาทในสมอง - ค้นหารูปแบบในข้อมูลดิบโดยการรวมเซลล์ประสาทเทียมหลายชั้น เมื่อเลเยอร์เพิ่มขึ้นความสามารถของเครือข่ายประสาทในการเรียนรู้แนวคิดที่เป็นนามธรรมมากขึ้น
DNN ชนิดที่ง่ายที่สุดคือ Multilayer Perceptron (MLP)

- หนังสือเล่มเล็ก ๆ ของการเรียนรู้ลึกหนังสือเล่มนี้เป็นการแนะนำสั้น ๆ เกี่ยวกับการเรียนรู้อย่างลึกซึ้งสำหรับผู้อ่านที่มีพื้นหลังต้นกำเนิดซึ่งออกแบบมาเพื่ออ่านบนหน้าจอโทรศัพท์ มีการแจกจ่ายภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ที่ไม่ใช่เชิงพาณิชย์และดาวน์โหลดได้ใกล้ถึง 250'000 ครั้งในเดือนหลังจากการเปิดตัวสาธารณะ
- สแต็คการเรียนรู้อย่างลึกซึ้งเรียนรู้การเรียนรู้ระดับการผลิตอย่างลึกซึ้งจากผู้ปฏิบัติงานชั้นนำ
- deeplearning.ai หลายหลักสูตรที่สอนโดย Andrew Ng ที่ Coursera; มันเป็นภาคต่อของหลักสูตรการเรียนรู้ของเครื่องที่ Coursera
- แนะนำการเรียนรู้อย่างลึกซึ้งกับ Pytorch หลักสูตรโดย Facebook AI ใน Udacity
- การแนะนำที่เป็นมิตรเกี่ยวกับการเรียนรู้อย่างลึกซึ้งและเครือข่ายประสาท
- ทิงเกอร์สนามเด็กเล่น Neural Network พร้อมเครือข่ายประสาทเรียบง่ายที่ออกแบบมาเพื่อช่วยให้คุณเห็นภาพกระบวนการเรียนรู้
- การเรียนรู้อย่างลึกซึ้ง demystified - YouTube อธิบายแรงบันดาลใจของการเรียนรู้อย่างลึกซึ้งจากเซลล์ประสาทจริงไปจนถึงเครือข่ายประสาทเทียม
- เรียนรู้ Tensorflow และการเรียนรู้อย่างลึกซึ้งโดยไม่ต้องเรียนปริญญาเอก หลักสูตร 3 ชั่วโมง (วิดีโอ + สไลด์) นี้ให้การแนะนำนักพัฒนาแนะนำพื้นฐานการเรียนรู้อย่างลึกซึ้งโดยมีเทนเซอร์โฟลว์บางตัวถูกโยนลงไปในการต่อรอง
- คู่มือการเรียนรู้อย่างลึกซึ้งโดย yn^2 คู่มือคณิตศาสตร์ที่ดูแลเพื่อการเรียนรู้ลึก
- การเรียนรู้อย่างลึกซึ้งสำหรับหลักสูตร Coders ที่ Fast.ai สอนโดย Jeremy Howard (คู่แข่งอันดับ 1 ของ Kaggle วิ่ง 2 ปีและผู้ก่อตั้ง Enlitic)
- การเรียนรู้อย่างลึกซึ้ง - แนะนำให้เรียนรู้ด้วยภาพที่รู้ ML บางหลักสูตรหลักสูตรนี้ให้แนวคิดระดับสูงเกี่ยวกับการเรียนรู้ลึกรายละเอียดที่ใช้งานง่ายในระยะเวลาอันสั้นคุณจะใช้ TensorFlow ภายในหลักสูตร
- โรงเรียนฤดูร้อนเรียนรู้ลึกมอนทรีออล 2015
- Neural Networks Class - YouTube Playlist
- http://neuralnetworksanddeeplearning.com/index.html หนังสือออนไลน์สำหรับการเรียนรู้เชิงลึกของสัญชาตญาณการเรียนรู้เชิงลึกฉันสามารถพูดได้ว่าหลังจากจบเรื่องนี้คุณจะสามารถอธิบายการเรียนรู้อย่างลึกซึ้งในรายละเอียดที่ดี
- สวนสัตว์ Neural Network กลุ่มเครือข่ายประสาทที่คุณควรรู้ (ฉันรู้ประมาณครึ่งหนึ่งดังนั้นไม่ต้องกังวลว่าคุณไม่รู้จักมากเพราะส่วนใหญ่ไม่เป็นที่นิยมหรือมีประโยชน์ในปัจจุบัน)
- แนะนำถึง tensorflow สำหรับการเรียนรู้ลึกที่สอนที่ Udacity
- ไพรเมอร์• AI นี่คือการเลือกบทความเกี่ยวกับพื้นฐาน/แนวคิดของ AI ที่ครอบคลุมกระบวนการทั้งหมดของการสร้างอวนประสาทเพื่อฝึกอบรมเพื่อประเมินผลลัพธ์ นอกจากนี้ยังมีคำอธิบายสถาปัตยกรรมหม้อแปลงรายละเอียดมาก
- การกอดแบบจำลองการแพร่กระจายของใบหน้าเรียนรู้ทฤษฎีฝึกอบรมแบบจำลองตั้งแต่เริ่มต้นและใช้เพื่อสร้างภาพและเสียง
- พื้นฐานการเรียนรู้ลึกโดย Lightning.ai กับ Sebastian Raschka
เครือข่ายประสาท
DNNs ที่ทำงานกับข้อมูลกริดเช่นรูปคลื่นเสียงรูปภาพและวิดีโอได้ดีกว่า DNN ทั่วไป พวกเขาจะขึ้นอยู่กับสมมติฐานที่ว่าหน่วยป้อนข้อมูลใกล้เคียงมีความเกี่ยวข้องมากกว่าหน่วยที่ห่างไกล พวกเขายังใช้ความแปรปรวนของการแปล ตัวอย่างเช่นเมื่อได้รับภาพอาจเป็นประโยชน์ในการตรวจจับขอบชนิดเดียวกันทุกที่บนภาพ บางครั้งพวกเขาเรียกว่า Convnets หรือ CNNs
- วิธีการทำงานของเครือข่ายประสาทแบบ convolutional - คำอธิบายทางเทคนิคของ YouTube รวมถึงการรวมการดำเนินงาน, relu, เลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์, การเพิ่มประสิทธิภาพโดยใช้ Descent การไล่ระดับสี
- เครือข่ายประสาทที่เปลี่ยนแปลงทุกอย่าง - Computerphile
- คู่มือผู้เริ่มต้นในการทำความเข้าใจเครือข่ายประสาทแบบ convolutional
- การเรียนรู้อย่างลึกซึ้งสำหรับการมองเห็นคอมพิวเตอร์ (Andrej Karparthy, Openai) นี่เป็นวิดีโอที่ฉันโปรดปรานที่สุดในการทำเน็ต Convolutional Andrej อธิบายอย่างละเอียดในการตอบคำถามที่น่าสงสัยทั้งหมดที่อาจมี ตัวอย่างเช่นบทความส่วนใหญ่พูดคุยเกี่ยวกับการ convolution ในภาพสีเทา แต่เขาอธิบายการ convolution ในภาพที่มีช่องสีเช่นกัน นอกจากนี้เขายังพูดถึงความกังวลและสมมติฐานที่ Convnets ทำ นี่คือการบรรยายที่ยอดเยี่ยม!
- การทำความเข้าใจเครือข่ายประสาทผ่านการสร้างภาพข้อมูลลึกอธิบายวิธีการมองเห็นภาพคอนเนตต์โดยใช้เทคนิคต่าง ๆ
เครือข่ายประสาทกำเริบ
DNN ที่มีรัฐ พวกเขายังเข้าใจลำดับที่มีความยาวแตกต่างกันไป บางครั้งพวกเขาเรียกว่า rnns
- http://karpathy.github.io/2015/05/21/rnn-effectiveness/
- http://colah.github.io/posts/2015-08-understanding-lstms/
- http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/
แนวทางปฏิบัติที่ดีที่สุด
- กฎของการเรียนรู้ของเครื่อง: แนวทางปฏิบัติที่ดีที่สุดสำหรับ ML Engineering มันเป็นเอกสารโดย Martin Zinkevich เกี่ยวกับแนวทางปฏิบัติที่ดีที่สุดของ Google ในการเรียนรู้ของเครื่อง
- สูตรสำหรับการฝึกอบรมเครือข่ายประสาทบล็อกของ Andrej เกี่ยวกับวิธีการฝึกอบรมตัวเองให้เป็นวิศวกรการเรียนรู้ของเครื่องหวาดระแวง
- วิธีการดีบักเครือข่ายประสาท คู่มือ.
- ภาพรวมของอัลกอริทึมการเพิ่มประสิทธิภาพ
- Playbook การเรียนรู้การเรียนรู้อย่างลึกล้ำเป็น playbook สำหรับการเพิ่มประสิทธิภาพของโมเดลการเรียนรู้ลึกอย่างเป็นระบบอย่างเป็นระบบ
เครื่องมือ
ห้องสมุดและเฟรมเวิร์กที่มีประโยชน์สำหรับการเรียนรู้ของเครื่องในทางปฏิบัติ
เฟรมเวิร์ก
การเรียนรู้ของเครื่องจักร
- ห้องสมุดการเรียนรู้ของเครื่องจักรทั่วไป Scikit-learn, abstraction ระดับสูง, มุ่งสู่ผู้เริ่มต้น
- Tensorflow; Tensorflow ที่ยอดเยี่ยม; กรอบกราฟการคำนวณที่สร้างโดย Google มีบอร์ดการสร้างภาพข้อมูลที่ดีซึ่งอาจเป็นกรอบการทำงานที่ได้รับความนิยมมากที่สุดในปัจจุบันสำหรับการเรียนรู้อย่างลึกซึ้ง
- Keras: การเรียนรู้อย่างลึกซึ้งสำหรับมนุษย์ Keras เป็น API การเรียนรู้เชิงลึกที่เขียนใน Python ซึ่งทำงานบน Tensorflow มันยังคงเป็นราชาแห่งนามธรรมระดับสูงสำหรับการเรียนรู้อย่างลึกซึ้ง อัปเดต: Keras พร้อมใช้งานสำหรับ TensorFlow, Jax และ Pytorch!
- Pytorch Tensors และ Neural Networks แบบไดนามิกใน Python ด้วยการเร่งความเร็ว GPU ที่แข็งแกร่ง มันมักใช้โดยนักวิจัยที่ทันสมัยรวมถึง OpenAI
- Lightning The Deep Learning Framework เพื่อฝึกอบรมปรับใช้และจัดส่งผลิตภัณฑ์ AI Lightning Fast (เคยเรียกว่า Pytorch Lightning)
- Jax เป็น Autograd และ XLA นำมารวมกันสำหรับการวิจัยการเรียนรู้การเรียนรู้ของเครื่องจักรสมรรถนะสูง
- OneFlow เป็นกรอบการเรียนรู้ที่ลึกซึ้งที่ออกแบบมาให้ใช้งานง่ายปรับขนาดได้และมีประสิทธิภาพ
- Apache MXNET (การบ่ม) สำหรับการเรียนรู้ลึก Apache MXNET เป็นกรอบการเรียนรู้ที่ลึกซึ้งที่ออกแบบมาสำหรับทั้งประสิทธิภาพและความยืดหยุ่น ช่วยให้คุณผสมผสานการเขียนโปรแกรมเชิงสัญลักษณ์และจำเป็นเพื่อเพิ่มประสิทธิภาพและผลผลิตสูงสุด
- Chainer A Framework ที่ยืดหยุ่นของเครือข่ายประสาทสำหรับการเรียนรู้อย่างลึกซึ้ง
- Vowpal Wabbit เป็นระบบการเรียนรู้ของเครื่องซึ่งผลักดันขอบเขตของการเรียนรู้ของเครื่องด้วยเทคนิคเช่นออนไลน์, hashing, allreduce, การลดการเรียนรู้ 2Search, Active และการเรียนรู้แบบโต้ตอบ มีการมุ่งเน้นเฉพาะเกี่ยวกับการเรียนรู้การเสริมแรงด้วยอัลกอริธึมโจรหลาย ๆ อย่างที่นำมาใช้และการให้ยืมธรรมชาติออนไลน์ให้กับปัญหาได้ดี
- H2O เป็นแพลตฟอร์มในหน่วยความจำสำหรับการเรียนรู้ของเครื่องจักรแบบกระจายที่ปรับขนาดได้
- SPEKTRAL กราฟเครือข่ายประสาทกับ keras และ tensorflow 2
- Ivy เป็นทั้ง ML Transpiler และ Framework ซึ่งปัจจุบันรองรับ Jax, Tensorflow, Pytorch และ Numpy Ivy Unifies ML Frameworks ทั้งหมด? การเปิดใช้งานคุณไม่เพียง แต่เขียนโค้ดที่สามารถใช้กับเฟรมเวิร์กเหล่านี้เป็นแบ็กเอนด์เท่านั้น แต่ยังสามารถแปลงฟังก์ชั่นโมเดลหรือห้องสมุดใด ๆ ที่เขียนไว้ในกรอบที่คุณต้องการ!
ไม่มีการเข้ารหัส
- Ludwig Ludwig เป็นกล่องเครื่องมือที่ช่วยให้ผู้ใช้สามารถฝึกอบรมและทดสอบโมเดลการเรียนรู้ลึกโดยไม่จำเป็นต้องเขียนโค้ด มันถูกสร้างขึ้นที่ด้านบนของ tensorflow
การเพิ่มความลาดชัน
แบบจำลองที่ใช้อย่างมากในการแข่งขันเนื่องจากประสิทธิภาพการวางนัยทั่วไปที่โดดเด่น
- https://github.com/dmlc/xgboost การไล่ระดับสีที่เพิ่มขึ้นมาก
- https://github.com/microsoft/lightgbm ทางเลือกน้ำหนักเบาเมื่อเทียบกับ xgboost
- https://github.com/catboost/catboost การไล่ระดับสีที่รวดเร็วและปรับขนาดได้ซึ่งเพิ่มประสิทธิภาพการเพิ่มประสิทธิภาพในห้องสมุดการตัดสินใจของ Trees Library ใช้สำหรับการจัดอันดับการจำแนกประเภทการถดถอยและงานการเรียนรู้ของเครื่องอื่น ๆ สำหรับ Python, R, Java, C ++ รองรับการคำนวณใน CPU และ GPU
- https://github.com/tensorflow/decision-forests การตัดสินใจของ Tensorflow Forests (TF-DF) เป็นชุดของอัลกอริทึมที่ทันสมัยสำหรับการฝึกอบรมการให้บริการและการตีความแบบจำลองป่าการตัดสินใจ
- การใช้งาน Pytorch/Tensorflow ของ Tabnet Paper อ่านเพิ่มเติม: แท็บยอดคงเหลือการอธิบายและประสิทธิภาพของแบบจำลองบนข้อมูลตาราง แต่มันสามารถเพิ่มโมเดลต้นไม้ได้หรือไม่?
การอนุมานอนุกรมเวลา
ข้อมูลอนุกรมเวลาต้องใช้กระบวนการสกัดคุณสมบัติที่ไม่ซ้ำกันเพื่อให้สามารถใช้งานได้ในรูปแบบการเรียนรู้ของเครื่องส่วนใหญ่เนื่องจากรุ่นส่วนใหญ่ต้องการข้อมูลในรูปแบบตาราง หรือคุณสามารถใช้สถาปัตยกรรมแบบจำลองพิเศษที่กำหนดเวลาอนุกรมเวลาเช่น LSTM, TCN ฯลฯ
- https://github.com/timeseriesai/tsai อนุกรมเวลา Timeseries การเรียนรู้ลึก pytorch Fastai-การเรียนรู้ลึกของการเรียนรู้อย่างลึกซึ้งด้วยอนุกรมเวลาและลำดับใน Pytorch/Fastai อ่านเพิ่มเติม: Tsai - การเรียนรู้ของเครื่องศิลปะที่ทันสมัยสำหรับอนุกรมเวลาตอนที่ 1
- https://github.com/alan-turing-institute/sktime A Unified Framework สำหรับการเรียนรู้ของเครื่องด้วยอนุกรมเวลา
- https://github.com/sktime/sktime-dl แพ็คเกจส่วนขยายสำหรับการเรียนรู้อย่างลึกซึ้งด้วย tensorflow/keras สำหรับ sktime
- https://github.com/tslearn-team/tslearn/ ชุดเครื่องมือการเรียนรู้ของเครื่องที่ทุ่มเทให้กับข้อมูลอนุกรมเวลา
- https://github.com/blue-yonder/tsfresh การสกัดโดยอัตโนมัติของคุณสมบัติที่เกี่ยวข้องจากอนุกรมเวลา
- https://github.com/johannfaouzi/pyts แพ็คเกจ Python สำหรับการจำแนกแบบอนุกรมเวลา
- https://github.com/facebook/Prophet Tool สำหรับการสร้างการคาดการณ์คุณภาพสูงสำหรับข้อมูลอนุกรมเวลาที่มีหลายฤดูกาลที่มีการเติบโตเชิงเส้นหรือไม่ใช่เชิงเส้น
- https://github.com/philipperemy/keras-tcn Keras Temporal Convolutional Network
- Rocket: การจำแนกอนุกรมเวลาที่รวดเร็วและแม่นยำเป็นพิเศษโดยใช้เมล็ดสุ่มตัวอย่างแบบสุ่ม; MINIROCKET: การแปลงที่กำหนดไว้อย่างรวดเร็ว (เกือบ) สำหรับการจำแนกแบบอนุกรมเวลา; เทคนิคทั้งสองเหล่านี้ใช้สำหรับการสกัดคุณสมบัติอนุกรมเวลา อ่านเพิ่มเติม: Rocket: การจำแนกซีรีย์เวลาที่รวดเร็วและแม่นยำ
วงจรชีวิต
ห้องสมุดที่ช่วยให้คุณพัฒนา/ดีบัก/ปรับใช้โมเดลในการผลิต (MLOPS) ML มีมากกว่าการฝึกอบรมแบบจำลอง
- https://huggingface.co/ เช่นเดียวกับ gitHub แต่สำหรับการจัดเก็บโมเดล ML ชุดข้อมูลและแอพ (พวกเขาเรียกแอพเป็นช่องว่าง) พวกเขามีไลบรารีให้คุณใช้แบบจำลอง/ชุดข้อมูลในรหัสของคุณได้อย่างง่ายดาย ที่เก็บข้อมูลฟรีและไม่ จำกัด สำหรับโครงการสาธารณะและภาคเอกชน
- https://wandb.ai/ สร้างโมเดลที่ดีขึ้นได้เร็วขึ้นด้วยการติดตามการทดลองเวอร์ชันชุดข้อมูลและการจัดการแบบจำลอง
- https://github.com/flyteorg/flyte Flyte ทำให้ง่ายต่อการสร้างเวิร์กโฟลว์ที่สามารถปรับขนาดได้และสามารถบำรุงรักษาได้สำหรับการเรียนรู้ของเครื่องและการประมวลผลข้อมูล
- https://github.com/allegroai/clearml ชุดเครื่องมืออัตโนมัติเพื่อปรับปรุงเวิร์กโฟลว์ ML ของคุณ Experiment Manager, ML-OPS และการจัดการข้อมูล
- https://github.com/quantumblacklabs/kedro กรอบ Python สำหรับการสร้างรหัสวิทยาศาสตร์ข้อมูลที่ทำซ้ำได้และแบบแยกส่วน
- https://github.com/determined-ai/determined ที่กำหนดไว้เป็นแพลตฟอร์มการฝึกอบรมการเรียนรู้เชิงลึกแบบโอเพนซอร์ซที่ทำให้โมเดลอาคารรวดเร็วและง่ายดาย ฉันใช้มันเป็นหลักสำหรับการปรับพารามิเตอร์ hyperparameters
- https://github.com/iterative/CML การเรียนรู้ของเครื่องจักรอย่างต่อเนื่อง (CML) เป็นห้องสมุดโอเพนซอร์ซสำหรับการใช้งานการรวมและการส่งมอบอย่างต่อเนื่อง (CI/CD) ในโครงการการเรียนรู้ของเครื่อง ใช้เพื่อทำให้ส่วนต่าง ๆ ของเวิร์กโฟลว์การพัฒนาของคุณเป็นไปโดยอัตโนมัติรวมถึงการฝึกอบรมและการประเมินผลการเปรียบเทียบการทดลอง ML ในประวัติโครงการของคุณและตรวจสอบชุดข้อมูลที่เปลี่ยนแปลง
- https://github.com/creme-ml/creme Python Library สำหรับ การเรียนรู้ของเครื่องออนไลน์ เครื่องมือทั้งหมดในไลบรารีสามารถอัปเดตด้วยการสังเกตครั้งละครั้งและสามารถใช้เพื่อเรียนรู้จากการสตรีมข้อมูล
- https://github.com/aimhubio/aim วิธีสุดพิเศษในการบันทึกค้นหาและเปรียบเทียบการฝึกอบรม ML 1,000 วินาที
- https://github.com/netflix/metaflow Metaflow เป็นห้องสมุด Python ที่เป็นมิตรกับมนุษย์ที่ช่วยให้นักวิทยาศาสตร์และวิศวกรสร้างและจัดการโครงการวิทยาศาสตร์ข้อมูลชีวิตจริง Metaflow ได้รับการพัฒนาที่ Netflix
- MLFLOW MLFLOW (ปัจจุบันอยู่ในเบต้า) เป็นแพลตฟอร์มโอเพ่นซอร์สเพื่อจัดการวงจรชีวิต ML รวมถึงการทดลองการทำซ้ำและการปรับใช้ ปัจจุบันมีสามองค์ประกอบ: การติดตาม MLFlow, โครงการ MLFLOW, MLFLOW รุ่น
- Floydhub a heroku สำหรับการเรียนรู้อย่างลึกซึ้ง (คุณมุ่งเน้นไปที่โมเดลพวกเขาจะปรับใช้)
- Comet.ml Comet ช่วยให้นักวิทยาศาสตร์ด้านข้อมูลและทีมสามารถติดตามเปรียบเทียบอธิบายและเพิ่มประสิทธิภาพการทดลองและโมเดลในวงจรชีวิตทั้งหมดของโมเดล จากการฝึกอบรมไปจนถึงการผลิต
- https://neptune.ai/ จัดการข้อมูลเมตาของอาคารทั้งหมดของคุณในที่เดียว
- https://github.com/fasti/nbdev สร้างโครงการ Python ที่น่ายินดีโดยใช้สมุดบันทึก Jupyter
- https://rapids.ai/ วิทยาศาสตร์ข้อมูลเกี่ยวกับ GPUs
- https://github.com/datarevenue-berlin/openmlops
- https://github.com/jacopotagliebue/you-dont-need-a-bigger-boat ไม่ใช่เครื่องมือ แต่เป็นแนวทางในการเขียนเครื่องมือมากมายเข้าด้วยกันในธุรกิจระดับที่สมเหตุสมผลในโลกแห่งความเป็นจริง
- https://www.modular.com/ บริษัท ที่มีเป้าหมายทะเยอทะยานในการออกแบบโครงสร้างพื้นฐาน AI ใหม่จากพื้นดิน พวกเขาแนะนำภาษาใหม่ที่เรียกว่า Mojo ซึ่งเป็น Superset of Python
คลาวด์ GPU
โปรดจำไว้ว่านี่เป็นรายการที่มีความคิดเห็น มีผู้ให้บริการคลาวด์หลายพันล้านคนอยู่ที่นั่น ฉันจะไม่แสดงรายการทั้งหมด ฉันแค่จะแสดงรายการที่ฉันคุ้นเคยและฉันคิดว่าดี
- https://lightning.ai/ Lightning Studio ทำให้คุณสามารถทิ้งแล็ปท็อประดับไฮเอนด์ของคุณสำหรับการพัฒนารูปแบบการเรียนรู้ของเครื่อง เพียงเขียนรหัสในคลาวด์โดยใช้ VSCODE และใช้ GPU สำหรับการฝึกอบรมหรือการอนุมาน Lightning Studio คล้ายกับ GitHub codespaces แต่มี GPU
- https://modal.com/ Modal ช่วยให้คุณเรียกใช้หรือปรับใช้โมเดลการเรียนรู้ของเครื่อง, งานคำนวณแบบขนานอย่างหนาแน่น, คิวงาน, แอพพลิเคชั่นเว็บและอื่น ๆ อีกมากมายโดยไม่ต้องมีโครงสร้างพื้นฐานของคุณเอง
- https://www.runpod.io/ ประหยัดมากกว่า 80% สำหรับ GPU การเช่า GPU ทำได้ง่ายด้วย Jupyter สำหรับ Pytorch, Tensorflow หรือกรอบ AI อื่น ๆ ฉันเคยใช้มาก่อน ใช้งานง่ายมาก
- https://replicate.com/ เรียกใช้และปรับแต่งโมเดลโอเพนซอร์ซ ปรับใช้โมเดลที่กำหนดเองในระดับโดยใช้ COG ทั้งหมดมีรหัสหนึ่งบรรทัด
- https://bentoml.com/ Bentoml เป็นแพลตฟอร์มสำหรับวิศวกรซอฟต์แวร์ในการสร้างผลิตภัณฑ์ AI ปรับใช้โดยใช้แพ็คเกจ Bentoml
- https://www.baseten.co/ การอนุมานแบบจำลองที่รวดเร็วและปรับขนาดได้ในคลาวด์โดยใช้มัด
- https://lambdalabs.com/ คลาวด์ GPU ที่สร้างขึ้นเพื่อการเรียนรู้อย่างลึกซึ้ง การเข้าถึงราคาที่ดีที่สุดสำหรับ GPU บนคลาวด์ทันทีในตลาด ไม่จำเป็นต้องมีข้อผูกพันหรือการเจรจา ประหยัดได้มากกว่า 73% เทียบกับ AWS, Azure และ GCP กำหนดค่าสำหรับการเรียนรู้อย่างลึกซึ้งด้วย Pytorch, Tensorflow, Jupyter
- https://www.beam.cloud/ on-demand gpu compute: ฝึกอบรมและปรับใช้แอปพลิเคชัน AI และ LLM อย่างปลอดภัยบน GPU ที่ไม่มีเซิร์ฟเวอร์โดยไม่ต้องจัดการโครงสร้างพื้นฐาน
การจัดเก็บข้อมูล
- https://github.com/huggingface/datasets/ แพ็คเกจสำหรับการโหลดชุดข้อมูลการประมวลผลล่วงหน้าและการแชร์
- https://github.com/activeloopai/deeplake Data Lake เพื่อการเรียนรู้อย่างลึกซึ้ง สร้าง, จัดการ, การสืบค้น, เวอร์ชัน, และชุดข้อมูล สตรีมข้อมูลเรียลไทม์ถึง Pytorch/Tensorflow
- https://github.com/determined-ai/yogadl วิธีการที่ดีกว่าในการโหลดข้อมูลสำหรับการเรียนรู้อย่างลึกซึ้ง การแคช Api-transparent ไปยังดิสก์, GCS หรือ S3
- https://github.com/google/ml_collections ML Collections เป็นห้องสมุดของคอลเลกชัน Python ที่ออกแบบมาสำหรับกรณีการใช้ ML มันมี configdict โครงสร้างข้อมูล "เหมือน" ที่มีจุดเข้าถึงองค์ประกอบที่ซ้อนกัน มันควรจะใช้เป็นวิธีหลักในการแสดงการกำหนดค่าของการทดลองและโมเดล
การถกเถียงกันข้อมูล
การทำความสะอาดข้อมูลและการเพิ่มข้อมูล
- https://github.com/cgnorthcutt/cleanlab ข้อผิดพลาดการติดฉลากทำความสะอาดของชุดข้อมูล
- https://github.com/aleju/imgaug ไลบรารีการเสริมภาพ
- https://github.com/albu/albumentations ไลบรารีการเสริมภาพที่เร็วที่สุด
- https://github.com/mdbloice/augmentor การเพิ่มรูปภาพที่ใช้งานง่ายสำหรับงานการจำแนกประเภท (ไม่สามารถเพิ่ม keypoints)
- https://github.com/facebookresearch/augly ไลบรารีการเพิ่มข้อมูลสำหรับเสียงรูปภาพข้อความและวิดีโอ
การประสานข้อมูล
- https://github.com/prefecthq/prefect
- https://github.com/dagster-io/dagster
- https://github.com/ploomber/ploomber Ploomber เป็นวิธีที่เร็วที่สุดในการสร้างท่อข้อมูล⚡ ใช้ตัวแก้ไขที่คุณชื่นชอบ (Jupyter, VScode, Pycharm) เพื่อพัฒนาแบบโต้ตอบและปรับใช้☁โดยไม่ต้องเปลี่ยนรหัส (Kubernetes, Airflow, AWS Batch และ Slurm)
- https://github.com/orchest/orchest build data pipelines วิธีง่าย ๆ ในการใช้ UI ที่ใช้งานง่าย
การสร้างภาพข้อมูล
- https://github.com/gradio-app/gradio สร้าง UIs สำหรับรูปแบบการเรียนรู้ของเครื่องใน Python ใน 3 นาที UI เป็นเว็บแอปที่สามารถแชร์กับใครก็ได้แม้กระทั่งคนที่ไม่ใช่ด้านเทคนิค หนึ่งในคุณสมบัติที่ฉันชอบคือองค์ประกอบตัวอย่าง มันแสดงให้คุณเห็นเป็นอย่างดีว่าแอพนี้ใช้สำหรับกรณีการใช้งานการใช้เครื่อง
- https://github.com/streamlit/streamlit streamlit เปลี่ยนสคริปต์ข้อมูลเป็นแอพเว็บที่แชร์ได้ในไม่กี่นาที ทั้งหมดใน Python ทั้งหมดฟรี ไม่จำเป็นต้องมีประสบการณ์ด้านหน้า
- https://github.com/oegedijk/explainerDashboard สร้างแดชบอร์ด AI ที่อธิบายได้อย่างรวดเร็วซึ่งแสดงการทำงานภายในของรุ่นการเรียนรู้ของเครื่อง "Blackbox"
- https://github.com/lux-org/lux เพียงแค่พิมพ์ dataframe ในสมุดบันทึก Jupyter Lux แนะนำชุดของการสร้างภาพข้อมูลที่เน้นแนวโน้มและรูปแบบที่น่าสนใจในชุดข้อมูล
- https://github.com/slundberg/shap shap (คำอธิบายเพิ่มเติมของ Shapley) เป็นวิธีการทางทฤษฎีของเกมเพื่ออธิบายผลลัพธ์ของรูปแบบการเรียนรู้ของเครื่องใด ๆ
- https://github.com/comet-ml/kangas Kangas เป็นเครื่องมือในการสำรวจวิเคราะห์และแสดงภาพข้อมูลมัลติมีเดียขนาดใหญ่ มันมี Python API ที่ตรงไปตรงมาสำหรับการบันทึกตารางข้อมูลขนาดใหญ่พร้อมกับอินเทอร์เฟซภาพที่ใช้งานง่ายสำหรับการสืบค้นที่ซับซ้อนกับชุดข้อมูลของคุณ
การปรับจูนพารามิเตอร์
ก่อนที่คุณจะเริ่มโปรดอ่านโพสต์บล็อกนี้เพื่อทำความเข้าใจแรงจูงใจในการค้นหาโดยทั่วไป: https://www.determined.ai/blog/stop-doing-iterative-model-development
เปิดตาของคุณเพื่อการพัฒนาที่ขับเคลื่อนด้วยการค้นหา มันจะเปลี่ยนคุณ ประโยชน์หลักคือจะไม่มีความพ่ายแพ้ อนุญาตให้มีความคืบหน้าและการปรับปรุงเท่านั้น ลองนึกภาพการทำงานและความคืบหน้าทุกวันแทนที่จะถอยหลังไปข้างหลังเพราะโซลูชันใหม่ของคุณไม่ทำงาน ความคืบหน้ารับประกันนี้คือการพัฒนาที่ขับเคลื่อนด้วยการค้นหาจะทำกับคุณ นำไปใช้กับทุกสิ่งในการเพิ่มประสิทธิภาพไม่ใช่แค่การเรียนรู้ของเครื่อง
การตั้งค่าความคิดเห็นด้านบนของฉันจะถูกกำหนดการปรับแต่งเรย์และ optuna เนื่องจากการทำให้เป็นแบบขนาน (การปรับแต่งแบบกระจายบนเครื่องจักรหลายเครื่อง) ความยืดหยุ่น (สามารถเพิ่มประสิทธิภาพโดยพลการและอนุญาตให้พารามิเตอร์ชุดข้อมูลได้รับการปรับ), ไลบรารีของการปรับแต่ง SOTA
- https://github.com/determined-ai/determined ที่กำหนดไว้เป็นแพลตฟอร์มการฝึกอบรมการเรียนรู้เชิงลึกแบบโอเพนซอร์ซที่ทำให้โมเดลอาคารรวดเร็วและง่ายดาย IMO มันเป็นสิ่งที่ดีที่สุดสำหรับการปรับพารามิเตอร์ไฮเปอร์พารามิเตอร์ของโมเดลการเรียนรู้ลึก อย่างถูก เพราะมันจะฝึกฝนยุคหลายรุ่นที่มีการวัดและรุ่นหยุดก่อนที่จะไม่ พวกเขาสนับสนุน AWS และบริการคลาวด์ส่วนใหญ่ในฐานะพลเมืองชั้นหนึ่ง พวกเขายังรองรับอินสแตนซ์ ที่จับได้ ซึ่งเป็นอีกครั้งราคาถูก เมื่อคุณฝึกเสร็จสิ้นอินสแตนซ์ GPU ทั้งหมดจะถูกปิดโดยอัตโนมัติ หากคุณต้องการประหยัดเงินในการฝึกอบรมขนาดใหญ่ให้ไปด้วยความมุ่งมั่น
- https://docs.ray.io/en/master/tune/index.html Ray Tune เป็นไลบรารี Python สำหรับการดำเนินการทดลองและการปรับแต่ง hyperparameter ในทุกระดับ หากคุณกำลังมองหาการปรับแต่งแบบกระจายเรย์ปรับแต่งอาจเป็นกรอบที่ร้ายแรงที่สุด
- https://github.com/optuna/optuna กรอบซอฟต์แวร์การเพิ่มประสิทธิภาพ hyperparameter อัตโนมัติ (Framework Agnostic, define-by-run)
- https://github.com/pyhopper/pyhopper Pyhopper เป็นเครื่องมือเพิ่มประสิทธิภาพ hyperparameter ซึ่งทำขึ้นโดยเฉพาะสำหรับปัญหามิติสูงที่เกิดขึ้นในการวิจัยการเรียนรู้ของเครื่องจักรและธุรกิจ ผู้ชายคนนี้อ้างว่าเร็วกว่า Optuna 10 เท่า การเรียกร้องนี้เป็นจริงหรือไม่? เราไม่รู้จนกว่าเราจะลอง!
- https://github.com/keras-team/keras-tuner การเพิ่มประสิทธิภาพ hyperparameter hyperparameter ที่ง่ายต่อการใช้งานสำหรับ keras; อ่านบทความที่นี่
- https://github.com/autonomio/talos Hyperparameter Optimization สำหรับ keras, tensorflow (tf.keras) และ pytorch
- https://github.com/maxpumperla/hyperas keras + hyperopt: wrapper ง่ายมากสำหรับการเพิ่มประสิทธิภาพ hyperparameter ที่สะดวกสบาย
- https://github.com/fmfn/bayesianoptimization การใช้ Python การเพิ่มประสิทธิภาพทั่วโลกด้วยกระบวนการเกาส์เซียน
- https://github.com/hyperopt/hyperopt
- https://github.com/msu-coinlab/pymoo การเพิ่มประสิทธิภาพแบบหลายวัตถุประสงค์ใน Python
- https://github.com/google/vizier โอเพนซอร์สผู้ให้บริการ: การเพิ่มประสิทธิภาพ Black-Box ที่เชื่อถือได้และยืดหยุ่น OSS Vizier เป็นบริการที่ใช้ Python สำหรับการเพิ่มประสิทธิภาพกล่องดำและการวิจัยโดยอิงจาก Google Vizier ซึ่งเป็นหนึ่งในบริการปรับแต่งพารามิเตอร์ Hyperparameter แห่งแรกที่ออกแบบมาเพื่อทำงานในระดับ
อัตโนมัติ
ทำให้เครื่องจักรเรียนรู้โดยไม่ต้องทำงานที่น่าเบื่อของวิศวกรรมคุณสมบัติการเลือกรุ่นและการปรับจูนไฮเปอร์พารามิเตอร์ที่คุณต้องทำด้วยตัวเอง ปล่อยให้เครื่องจักรทำการเรียนรู้ของเครื่องจักรสำหรับคุณ!
โดยส่วนตัวถ้าฉันมีชุดข้อมูลแบบตารางฉันจะลอง FLAML และ MLJAR ก่อนโดยเฉพาะอย่างยิ่งถ้าคุณต้องการทำงานอย่างรวดเร็ว หากคุณต้องการลองใช้เฟรมเวิร์กการเพิ่มความลาดชันเช่น XGBOOST, LIGHTGBM, CatBoost ฯลฯ แต่คุณไม่รู้ว่าอันไหนดีที่สุดฉันขอแนะนำให้คุณลอง AutomL ก่อนเพราะภายในมันจะลองใช้เฟรมเวิร์กการไล่ระดับสีที่กล่าวถึงก่อนหน้านี้
- เฟรมเวิร์ก OpenSource AutomL ที่ดีที่สุดในปี 2564 บทความเกี่ยวกับสื่อกลางที่มีรายการ OpenSource AutomL Frameworks
- https://github.com/dabl/dabl การวิเคราะห์ข้อมูลพื้นฐานห้องสมุด ฝึกอบรมแบบง่าย ๆ อย่างรวดเร็วเพื่อใช้เป็นพื้นฐานประสิทธิภาพ
- https://www.automl.org/ ค้นหารายการห้องสมุดและงานวิจัยที่ได้รับการดูแล
- https://github.com/jhfjhfj1/autokeras เมื่อเขียน (24 สิงหาคม 2018) ห้องสมุดนี้ค่อนข้างก่อนกำหนดเพราะสามารถจัดหมวดหมู่ได้เท่านั้น
- https://github.com/automl/auto-sklearn/ ไม่ทำงานบน Windows คุณต้องติดตั้ง WSL (ระบบย่อย Windows สำหรับ Linux) เพื่อใช้งาน
- https://github.com/epistasislab/tpot เรียกใช้ท่อเรียนรู้ของเครื่องนับพันและส่งออกรหัสให้คุณ
- https://github.com/climbsrocks/auto_ml อ่านสิ่งที่ผู้เขียนคิดเกี่ยวกับการเปรียบเทียบระหว่าง tpot และ auto-sklearn
- https://github.com/microsoft/flaml AutomL ที่รวดเร็วและมีน้ำหนักเบาพร้อมอัลกอริทึมการเพิ่มประสิทธิภาพประหยัดค่าใช้จ่าย
- https://github.com/mljar/mljar-supervised แพ็คเกจการเรียนรู้ของเครื่องอัตโนมัติที่ทำงานกับข้อมูลตาราง ฉันชอบที่มันสร้างรายงานการสร้างภาพข้อมูล (ในโหมดอธิบาย) และคุณสมบัติพิเศษสำหรับคุณเช่นคุณสมบัติสีทองและคุณสมบัติ k-mean
- https://github.com/awslabs/autogluon Automl สำหรับข้อความรูปภาพและข้อมูลตาราง แต่มันไม่รองรับ Windows (ณ วันที่ 11 ตุลาคม 2564)
- https://github.com/autoviml/auto_viml auto_viml ได้รับการออกแบบมาสำหรับการสร้างโมเดลที่สามารถตีความได้ประสิทธิภาพสูงพร้อมตัวแปรที่น้อยที่สุดที่จำเป็น
สถาปัตยกรรมแบบจำลอง
สถาปัตยกรรมที่ล้ำสมัยในสาขา
- https://github.com/rwightman/pytorch-image-models รูปแบบภาพ pytorch, สคริปต์, น้ำหนักที่ได้รับการปรับแต่ง-resnet, resnext, EfficientNet, Efficientnetv2, NFNet, Transformer Vision, Mixnet, Mobilenet-V3/V2 โดยทั่วไปจะเรียกว่า
timm - https://modelzoo.co/ Model Zoo
- https://github.com/tensorflow/models
- Magenta: ดนตรีและศิลปะการสร้างด้วยเครื่องจักร
- https://github.com/phillipi/pix2pix การแปลภาพถึงภาพโดยใช้ตาข่ายที่มีเงื่อนไข พอร์ต Tensorflow ของ Pix2pix; ดูงานนำเสนองานนี้: เรียนรู้ที่จะดูโดยไม่มีครู
- WAV2LETTER Facebook AI Research AITHINGING Recognition Toolkit
- https://github.com/huggingface/transformers การประมวลผลภาษาธรรมชาติที่ทันสมัยสำหรับ tensorflow 2.0 และ pytorch
- https://github.com/huggingface/diffusers? diffusers: แบบจำลองการแพร่กระจายที่ทันสมัยสำหรับการสร้างภาพและเสียงใน pytorch
- https://bigscience.huggingface.co/blog/bloom เปิดรูปแบบภาษาขนาดใหญ่จาก BigScience LLM บทความ
- https://github.com/hpcaitech/colossalai บทความ
- https://stability.ai/blog/stable-diffusion-public-release การแพร่กระจายที่เสถียรเป็นแบบจำลองที่สามารถสร้างภาพคุณภาพสูงจากคำอธิบายข้อความสั้น ๆ นี่คือเธรด Twitter สั้น ๆ ที่อธิบายว่าทำไมมันถึงทำงานได้ดี และนี่คือเธรดที่มีทรัพยากรเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับรูปแบบการแพร่กระจาย
วิศวกรรมที่รวดเร็ว
โมเดลภาษาขนาดใหญ่ (LLMS) เช่น GPT-3 นั้นทรงพลัง แต่จำเป็นต้องได้รับแจ้งให้สร้างผลลัพธ์ที่ต้องการ นี่คือที่วิศวกรรมที่รวดเร็วเข้ามาวิศวกรรมที่รวดเร็วเป็นกระบวนการของการออกแบบพรอมต์ที่สามารถใช้ในการสร้างผลลัพธ์ที่ต้องการ
- https://github.com/hwchase17/langchain มันเป็นแพ็คเกจ Python สำหรับการสร้างแอปพลิเคชันที่มี LLMs ผ่านการรวบรวม
- https://dust.tt/ เครื่องมือบนเว็บสำหรับการออกแบบและปรับใช้แอพรุ่นภาษาขนาดใหญ่
- https://github.com/jerryjliu/GPT_INDEX GPT ดัชนีเป็นโครงการที่ประกอบด้วยชุดของโครงสร้างข้อมูลที่สร้างขึ้นโดยใช้ LLMS และสามารถเคลื่อนที่ได้โดยใช้ LLM เพื่อตอบคำถาม
- https://github.com/xpitfire/symbolicai/ ไลบรารีการเขียนโปรแกรมที่แตกต่างกันแบบองค์ประกอบ: การสร้างแอพพลิเคชั่นที่มี LLMs ที่แกนกลางผ่าน API สัญลักษณ์ของเราใช้ประโยชน์จากพลังของการเขียนโปรแกรมแบบคลาสสิกและแตกต่างใน Python
บล็อกที่ดีและ vlogs ที่จะติดตาม
- https://www.pyimagesearch.com/ บล็อกที่อัปเดตบ่อยครั้งเกี่ยวกับ OpenCV และการเรียนรู้อย่างลึกซึ้ง
- http://colah.github.io/ คำอธิบายที่ดีพร้อมการสร้างภาพที่สวยงาม
- https://karpathy.github.io/ เขาได้สอนหลักสูตรเกี่ยวกับอวนลึกและเคยทำงานที่เทสลาในฐานะผู้อำนวยการ AI
- http://ruder.io การเรียนรู้อย่างลึกซึ้งและบล็อก NLP ของ Sebastian Ruder
- http://www.wildml.com/
- https://machinelearningmastery.com/ มีเนื้อหาและเว็บไซต์ที่สวยงามมากมาย
- เพลย์ลิสต์ YouTube ของ Sirajology จำนวนมากของการแนะนำเฮฮาสั้น ๆ ที่มีความหนาแน่นสูงถึง ML
- เอกสารสองนาทีเกี่ยวกับเพลย์ลิสต์การเรียนรู้ลึก
- Distill.pub สื่อที่ทันสมัยสำหรับการนำเสนอการวิจัยในการเรียนรู้ของเครื่องจักร
- deeplearn.org จอภาพการเรียนรู้ลึก; ข่าวเกี่ยวกับเอกสารการเรียนรู้ลึกและทวีต
- บล็อก DataRevene เกี่ยวกับ MLOPS ส่วนใหญ่
- https://www.youtube.com/c/andrejkarpathy Andrej Karparthy สร้างช่อง YouTube ใหม่หลังจากที่เขาออกจากทีม Tesla Autopilot เพื่อสอนผู้คนถึงวิธีการใช้เครือข่ายประสาทในสไตล์ "สะกดออกมา"
- https://e2eml.school/blog.html บล็อกการเรียนรู้ของเครื่อง end-to-end ที่ครอบคลุมหัวข้อจำนวนมากในรายละเอียดเช่นวิธีการทำงานของหม้อแปลง
- https://jalammar.github.io/ การสร้างภาพของเครื่องเรียนรู้ครั้งละหนึ่งแนวคิด บล็อกของเขามีคำอธิบายที่แสดงให้เห็นถึงแนวคิด ML เช่นหม้อแปลงหรือการแพร่กระจายที่เสถียร
- บล็อก Radek Osmulski เขาบล็อกเกี่ยวกับเทคนิคและกลยุทธ์ DL คุณสามารถใช้ประโยชน์จากการเรียนรู้ได้เร็วขึ้น
คนที่มีผลกระทบ
- เจฟฟรีย์ฮินตันเขาได้รับการขนานนามว่าเป็นเจ้าพ่อแห่งการเรียนรู้อย่างลึกล้ำโดยการแนะนำ 2 การปฏิวัติเทคนิค (Relu and Dropout) กับนักเรียนของเขา เทคนิคเหล่านี้แก้ปัญหาการไล่ระดับสีที่หายไปและปัญหาทั่วไปของเครือข่ายประสาทลึก
- Yann Lecun เขาคิดค้น CNNs (เครือข่ายประสาทเทียม) ซึ่งเป็นเครือข่ายที่ได้รับความนิยมอย่างมากในหมู่นักพัฒนาวิสัยทัศน์คอมพิวเตอร์ในปัจจุบัน กำลังทำงานที่ Meta
- Yoshua Bengio another serious professor at Deep Learning, you can watch his TEDx talk here (2017)
- Andrew Ng he discovered that GPUs make deep learning faster. He taught 2 famous online courses, Machine Learning and Deep Learning specialization at Coursera. particular type of RNN)
- Jeff Dean, a Google Brain engineer, watch his TEDx Talk
- Ian Goodfellow, he invented GANs (Generative Adversarial Networks), is an OpenAI engineer
- David Silver this is the guy behind AlphaGo and Artari reinforcement learning game agents at DeepMind
- Demis Hassabis CEO of DeepMind, has given a lot of talks about AlphaGo and Reinforcement Learning achievements they have
- Andrej Karparthy he teaches convnet classes, wrote ConvNetJS, and produces a lot of content for DL community, he also writes a blog (see Nice Blogs & Vlogs to Follow section)
- Pedro Domingos he wrote the book The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World , watch his TEDx talk here
- Emad Mostaque he is the founder of stability.ai, a company that releases many open source AI models including Stable Diffusion
- Sam Altman he is the president of OpenAI, a company that releases ChatGPT
Cutting-Edge Research Publishers
Steal the most recent techniques introduced by smart computer scientists (could be you).
- http://www.arxiv-sanity.com/ Arxiv Sanity Preserver
- https://research.facebook.com/ai/
- http://research.google.com/pubs/MachineIntelligence.html
- https://deepmind.com/research/ Research of DeepMind company
- https://www.openai.com/
- https://www.openai.com/requests-for-research/
- State of the art performance on each ML task
- State-of-the-art result for all Machine Learning Problems
- https://stability.ai/ is releasing a lot of open source high-quality models.
- https://twitter.com/ai__pub AI papers and AI research explained, for technical people.
- https://twitter.com/_akhaliq is a Twitter account that tweets the latest research papers in the field of AI.
Practitioner Community
- https://www.kaggle.com
- https://gym.openai.com
- https://universe.openai.com/
- /r/MachineLearning
- https://www.facebook.com/groups/DeepNetGroup/
Thoughtful Insights for Future Research
- Why AI is Harder Than We Think
- The Consciousness Prior by Yoshua Bengio
- What Can't Deep Learning Do? a list of problems that deep learning faces
- Pedro Domingos: "The Master Algorithm" - Talks at Google
- The AI Revolution: The Road to Superintelligence
- https://ai100.stanford.edu/2016-report
- Why does Deep Learning work so well? - The Extraordinary Link Between Deep Neural Networks and the Nature of the Universe
- These are three of the biggest problems facing today's AI
- Four Questions For: Geoff Hinton Geoff Hinton is referred to as "godfather of neural networks"
- What product breakthroughs will recent advances in deep learning enable? - quora
- Liquid Neural Networks
Uncategorized
- Artificial Intelligence: A Modern Approach (Online Book)
- The Principles of Modern Game AI
- Scipy Lecture Notes
- https://www.youtube.com/user/aicourses
- The Fundamentals of Neuroscience learn how our brain works so that you can discover new deep learning breakthrough
- Bayesian Methods for Hackers An introduction to Bayesian methods + probabilistic programming with a computation/understanding-first, mathematics-second point of view. All in pure Python ;)
Other Big Lists
- https://github.com/ahmedbahaaeldin/From-0-to-Research-Scientist-resources-guide This guide is designated to anybody with basic programming knowledge or a computer science background interested in becoming a Research Scientist with on Deep Learning and NLP.
- https://www.mrdbourke.com/ml-resources/ Machine Learning Courses & Resources recommendation by Daniel Bourke
- List of MLOps Courses and Books by Damien Benveniste on Facebook
- https://github.com/collections/machine-learning
- https://github.com/topics/machine-learning
- https://github.com/topics/mlops
- https://github.com/GokuMohandas/MadeWithML Join 30K+ developers in learning how to responsibly deliver value with ML.
- https://papers.labml.ai/papers/daily
- https://github.com/alirezadir/Production-Level-Deep-Learning
- https://github.com/jindongwang/transferlearning
- https://github.com/kmario23/deep-learning-drizzle
- https://github.com/ZuzooVn/machine-learning-for-software-engineers
- https://github.com/josephmisiti/awesome-machine-learning
- https://github.com/ujjwalkarn/Machine-Learning-Tutorials
- https://github.com/terryum/awesome-deep-learning-papers
- https://github.com/ChristosChristofidis/awesome-deep-learning
- https://github.com/Developer-Y/cs-video-courses#machine-learning
- Deep Learning Resources by Jeremy D. Jackson
- https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap
- https://github.com/aikorea/awesome-rl Awesome Reinforcement Learning
- https://github.com/artix41/awesome-transfer-learning Awesome Transfer Learning
- https://github.com/heejkoo/Awesome-Diffusion-Models Awesome Diffusion Models
- https://github.com/Renumics/awesome-open-data-centric-ai Data-centric AI is the practice of systematically engineering the data used to build AI systems.
- https://github.com/labmlai/annotated_deep_learning_paper_implementations
- https://github.com/ashishpatel26/500-AI-Machine-learning-Deep-learning-Computer-vision-NLP-Projects-with-code
I am confused, too many links, where do I start?
If you are a beginner and want to get started with my suggestions, please read this issue: #4
คำเตือน
From now on, this list is going to be compact and opinionated towards my own real-world ML journey and I will put only content that I think are truly beneficial for me and most people. All the materials and tools that are not good enough (in any aspect) will be gradually removed to combat information overload, including:
- too difficult materials without much intuition; impractical content
- too much theory without real-world practice
- low-quality and unstructured materials
- courses that I don't consider to enroll myself
- knowledge or tools that are too niche and not many people can use it in their works eg deepdream or unsupervised domain adaptation (because you can Google it if you want to use it in your work).
- tools that are beaten by other tools; not being state-of-the-art anymore
- commercial tools that look like it can die any time soon
- projects that are outdated or not maintained anymore
NOTE : There is no particular rank for each link. The order in which they appear does not convey any meaning and should not be treated differently.
How to contribute to this list
- Fork this repository, then apply your change.
- Make a pull request and tag me if you want.
- แค่นั้นแค่นั้น If your edition is useful, I'll merge it.
Or you can just submit a new issue containing the resource you want me to include if you don't have time to send a pull request.
The resource you want to include should be free to study.