ที่เก็บนี้นำเสนอแพ็คเกจ Hipart ซึ่งเป็นไลบรารี Python ดั้งเดิมที่ให้การใช้งานที่มีประสิทธิภาพและตีความได้ของอัลกอริทึมการจัดกลุ่มลำดับชั้นแบบแบ่งแยก HIPART รองรับการสร้างภาพข้อมูลแบบโต้ตอบสำหรับการจัดการขั้นตอนการดำเนินการช่วยให้การแทรกแซงโดยตรงของผลลัพธ์การจัดกลุ่ม แพ็คเกจนี้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันข้อมูลขนาดใหญ่เนื่องจากมีการมุ่งเน้นไปที่ประสิทธิภาพการคำนวณของวิธีการจัดกลุ่มที่ใช้งาน การพึ่งพาที่ใช้เป็นแพ็คเกจ Python Build-in หรือแพ็คเกจภายนอกที่มีเสถียรภาพสูง ซอฟต์แวร์มีให้ภายใต้ใบอนุญาต MIT
สำหรับการติดตั้งแพ็คเกจการกระทำและข้อกำหนดที่จำเป็นเท่านั้นคือรุ่นของ Python ที่สูงขึ้นหรือเท่ากับ 3.8 และการดำเนินการของคำสั่งต่อไปนี้
pip install HiPartตัวอย่างตะโกนเป็นรูปแบบที่ง่ายที่สุดของการดำเนินการของแพ็คเกจ ในไม่ช้ามันก็แสดงให้เห็นถึงการสร้างชุดข้อมูลการจัดกลุ่มสังเคราะห์ที่มี 6 กลุ่ม หลังจากนั้นมันจะถูกจัดกลุ่มด้วยอัลกอริทึม DEPDDP และจะส่งคืนฉลากคลัสเตอร์เท่านั้น
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )แพ็คเกจ HIPART นำเสนอชุดตัวอย่างที่ครอบคลุมเพื่อเป็นแนวทางในการใช้อัลกอริทึมต่างๆ ตัวอย่างเหล่านี้ตั้งอยู่อย่างสะดวกสบายในไดเรกทอรีตัวอย่างของที่เก็บ
สำหรับความเข้าใจทั่วไปเกี่ยวกับความสามารถของแพ็คเกจผู้ใช้สามารถอ้างถึงไฟล์ clustering_example ไฟล์นี้ทำหน้าที่เป็นคู่มือพื้นฐานซึ่งเป็นตัวอย่างที่สมบูรณ์ของอัลกอริทึมของแพ็คเกจในการดำเนินการ
นอกจากนี้สำหรับผู้ที่สนใจในการรวมวิธีการ KernelPCA ไฟล์ clustering_with_kpca_example เป็นทรัพยากรที่มีค่า มันมีตัวอย่างโดยละเอียดเกี่ยวกับวิธีการใช้ KernelPCA ภายในบริบทของแพ็คเกจ HIPART
การตระหนักถึงความสำคัญของการจัดกลุ่มผ่านความคล้ายคลึงกันหรือเมทริกซ์ที่แตกต่างกันเช่นเมทริกซ์ระยะทางแพ็คเกจ HIPART รวมถึงไฟล์ clustering_with_distance_matrix_example ตัวอย่างที่เฉพาะเจาะจงนี้แสดงให้เห็นถึงการใช้อัลกอริทึม DEPDDP ด้วยเมทริกซ์ระยะทางซึ่งนำเสนอสถานการณ์แอปพลิเคชันที่ใช้งานได้จริง
สุดท้ายแพ็คเกจมีส่วนประกอบการสร้างภาพข้อมูลแบบโต้ตอบซึ่งเป็นแบบอย่างในไฟล์ interactive_visualization_example ตัวอย่างนี้ไม่เพียงแสดงการดำเนินการของการสร้างภาพข้อมูลแบบโต้ตอบ แต่ยังมีคำแนะนำที่ครอบคลุมสำหรับการนำทาง GUI การสร้างภาพข้อมูล
ทรัพยากรเหล่านี้รวมกันมั่นใจว่าผู้ใช้แพ็คเกจ HIPART มีความเข้าใจที่รอบรู้และเป็นประโยชน์เกี่ยวกับฟังก์ชันการทำงานและแอปพลิเคชัน
เอกสารฉบับเต็มของแพ็คเกจสามารถพบได้ที่นี่
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} โครงการนี้ได้รับเงินทุนจากมูลนิธิกรีกเพื่อการวิจัยและนวัตกรรม (HFRI) ภายใต้ข้อตกลง Grant No 1901
Dimitris Tasoulis? Panagiotis anagnostou? Sotiris Tasoulis? Vassilis plagianakos?