เฟรมเวิร์กการเรียนรู้ของเครื่อง Datumbox เป็นเฟรมเวิร์กโอเพนซอร์ซที่เขียนใน Java ซึ่งช่วยให้การเรียนรู้ของเครื่องพัฒนาอย่างรวดเร็วและแอปพลิเคชันทางสถิติ จุดสนใจหลักของเฟรมเวิร์กคือการรวมอัลกอริทึมการเรียนรู้ของเครื่องจำนวนมากและวิธีการทางสถิติและเพื่อให้สามารถจัดการชุดข้อมูลขนาดใหญ่ได้
ลิขสิทธิ์ (c) 2013-2020 Vasilis vryniotis
รหัสได้รับอนุญาตภายใต้ใบอนุญาต Apache เวอร์ชัน 2.0
Datumbox Framework มีอยู่ในที่เก็บ Maven Central
เฟรมเวิร์กรุ่นที่เสถียรล่าสุดคือ 0.8.2 (สร้าง 20200805) หากต้องการใช้ให้เพิ่มตัวอย่างต่อไปนี้ใน pom.xml ของคุณ:
<dependency>
<groupId>com.datumbox</groupId>
<artifactId>datumbox-framework-lib</artifactId>
<version>0.8.2</version>
</dependency>
Snapshot เวอร์ชันล่าสุดของเฟรมเวิร์กคือ 0.8.3-Snapshot (สร้าง 20201014) หากต้องการทดสอบให้อัปเดต pom.xml ของคุณดังนี้:
<repository>
<id>sonatype-snapshots</id>
<name>sonatype snapshots repo</name>
<url>https://oss.sonatype.org/content/repositories/snapshots</url>
</repository>
<dependency>
<groupId>com.datumbox</groupId>
<artifactId>datumbox-framework-lib</artifactId>
<version>0.8.3-SNAPSHOT</version>
</dependency>
สาขาการพัฒนาคือสาขาการพัฒนา (สาขา GitHub เริ่มต้น) ในขณะที่สาขาหลักมีเฟรมเวิร์กรุ่นที่เสถียรล่าสุด การเผยแพร่ที่เสถียรทั้งหมดจะถูกทำเครื่องหมายด้วยแท็ก
การเผยแพร่เฟรมเวิร์กเป็นไปตามแนวทางการกำหนดเวอร์ชันความหมาย สำหรับข้อมูลโดยละเอียดเกี่ยวกับรุ่นต่างๆลองดูการเปลี่ยนแปลง
วิธีการสาธารณะและคลาสทั้งหมดของเฟรมเวิร์กได้รับการบันทึกไว้ด้วยความคิดเห็น Javadoc ยิ่งไปกว่านั้นสำหรับทุกรุ่นมีการทดสอบ Junit ซึ่งแสดงวิธีการฝึกอบรมและใช้แบบจำลองอย่างชัดเจน ในที่สุดสำหรับตัวอย่างเพิ่มเติมเกี่ยวกับวิธีการใช้การชำระเงินเฟรมเวิร์กตัวอย่างรหัสหรือบล็อกอย่างเป็นทางการ
Datumbox มาพร้อมกับโมเดลที่ผ่านการฝึกอบรมมาก่อนจำนวนมากซึ่งช่วยให้คุณทำการวิเคราะห์ความเชื่อมั่น (เอกสารและ Twitter) การวิเคราะห์ความเป็นส่วนตัวการจำแนกหัวข้อการตรวจจับสแปมการตรวจจับเนื้อหาสำหรับผู้ใหญ่การตรวจจับภาษาการตรวจจับเชิงพาณิชย์การตรวจจับการศึกษาและการตรวจจับเพศ เพื่อให้รุ่นไบนารีตรวจสอบสวนสัตว์ Datumbox
ขณะนี้เฟรมเวิร์กสนับสนุนการทดสอบเชิงสถิติเชิงพารามิเตอร์และแบบไม่ใช้พารามิเตอร์หลายครั้งการคำนวณสถิติเชิงพรรณนาเกี่ยวกับข้อมูลที่เซ็นเซอร์และไม่ถูกตรวจสอบการดำเนินการวิเคราะห์ ANOVA, การวิเคราะห์คลัสเตอร์, การลดขนาดการวิเคราะห์การถดถอย, การวิเคราะห์การสุ่มตัวอย่างและการคำนวณความน่าจะเป็น นอกจากนี้ยังมีอัลกอริทึมที่นำไปใช้หลายอย่างรวมถึง Max Entropy, Naive Bayes, SVM, การรวม bootstrap, Adaboost, Kmeans, การจัดกลุ่มแบบลำดับชั้น, แบบจำลองการผสมกระบวนการ dirichlet, การถดถอยแบบ softmax
แม้จะมีการใช้บางส่วนของเฟรมเวิร์กในแอปพลิเคชันเชิงพาณิชย์ ปัจจุบันเฟรมเวิร์กอยู่ในรุ่นอัลฟ่าดังนั้นคุณควรคาดหวังการเปลี่ยนแปลงบางอย่างใน API สาธารณะในเวอร์ชันอนาคต หากคุณพบข้อผิดพลาดโปรดส่งเป็นปัญหาในที่เก็บ GitHub อย่างเป็นทางการ
เฟรมเวิร์กสามารถปรับปรุงได้หลายวิธีและเป็นผลให้การสนับสนุนใด ๆ ยินดีต้อนรับ คุณลักษณะที่สำคัญที่สุดที่ขาดหายไปจากเฟรมเวิร์กคือความสามารถในการใช้งานจากบรรทัดคำสั่งหรือจากภาษาอื่น ๆ เช่น Python การปรับปรุงที่สำคัญอื่น ๆ ได้แก่ การปรับปรุงเอกสารการครอบคลุมการทดสอบและตัวอย่างการปรับปรุงสถาปัตยกรรมของกรอบและสนับสนุนการเรียนรู้ของเครื่องและแบบจำลองทางสถิติมากขึ้น หากคุณทำการเปลี่ยนแปลงที่เป็นประโยชน์ในรหัสโปรดพิจารณาสนับสนุนพวกเขาโดยส่งคำขอดึง
ขอบคุณมากสำหรับ Eleftherios Bampaletakis สำหรับการป้อนข้อมูลอันล้ำค่าของเขาในการปรับปรุงสถาปัตยกรรมของกรอบ นอกจากนี้ยังต้องขอบคุณ EJ-Technologies GmbH ที่ให้ใบอนุญาตสำหรับ Java Profiler และ Jetbrains สำหรับการให้ใบอนุญาตสำหรับ Java IDE ของพวกเขา