يعرض هذا المستودع حزمة الهيبارت ، وهي مكتبة بيثون أصلية مفتوحة المصدر توفر تطبيقات فعالة وقابلة للتفسير لخوارزميات التجميع الهرمية المثيرة للانقسام. يدعم الهيبارت التصورات التفاعلية لمعالجة خطوات التنفيذ مما يسمح بالتدخل المباشر لنتائج التجميع. هذه الحزمة مناسبة للغاية لتطبيقات البيانات الكبيرة حيث تم التركيز على الكفاءة الحسابية لمنهجيات التجميع المنفذة. التبعيات المستخدمة هي إما حزم بناء بيثون أو حزم خارجية مستقرة للغاية. يتم توفير البرنامج تحت رخصة معهد ماساتشوستس للتكنولوجيا.
لتثبيت الحزمة ، الإجراءات والمتطلبات الوحيدة الوحيدة هي إصدار من Python أعلى أو يساوي 3.8 وتنفيذ الأمر التالي.
pip install HiPartمثال على ذلك هو أبسط أشكال تنفيذ الحزمة. بعد فترة وجيزة ، يوضح إنشاء مجموعة بيانات التجميع الاصطناعية التي تحتوي على 6 مجموعات. بعد ذلك ، يتم تجميعها باستخدام خوارزمية DEPDDP ويتم إرجاع ملصقات الكتلة فقط.
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )تقدم حزمة Hipart مجموعة شاملة من الأمثلة لتوجيه المستخدمين في استخدام خوارزمياتها المختلفة. هذه الأمثلة تقع في مكان مريح في دليل أمثلة المستودع.
من أجل فهم عام لقدرات الحزمة ، يمكن للمستخدمين الرجوع إلى ملف clustering_example. يعمل هذا الملف كدليل أساسي ، ويوفر أمثلة كاملة لخوارزميات الحزمة أثناء العمل.
بالإضافة إلى ذلك ، بالنسبة لأولئك المهتمين بدمج أساليب kernelpca ، فإن ملف clustering_with_kpca_example هو مورد لا يقدر بثمن. يقدم مثالًا مفصلاً حول كيفية تطبيق kernelpca في سياق حزمة الهيبارت.
إدراكًا لأهمية التجميع من خلال التشابه أو المصفوفات الاختلاف ، مثل مصفوفات المسافة ، تتضمن حزمة Hipart ملف clustering_with_distance_matrix_example. يوضح هذا المثال المحدد استخدام خوارزمية DEPDDP مع مصفوفة المسافة ، مما يوفر سيناريو تطبيق عملي.
أخيرًا ، تتميز الحزمة بمكون تصور تفاعلي ، والذي تم تجسسه في ملف interactive_visualization_example. لا يعرض هذا المثال فقط تنفيذ التصور التفاعلي ولكنه يوفر أيضًا تعليمات شاملة للتنقل في واجهة المستخدم الرسومية للتصور.
تضمن هذه الموارد بشكل جماعي أن يكون لدى مستخدمي حزمة الهيبارت فهمًا عمليًا وعمليًا لوظائفها وتطبيقاتها.
يمكن العثور على الوثائق الكاملة للحزمة هنا.
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} تلقى هذا المشروع تمويلًا من مؤسسة Hellenic للبحوث والابتكار (HFRI) ، بموجب اتفاقية المنحة رقم 1901.
ديميتريس تاسوليس؟ Panagiotis anagnostou؟ Sotiris Tasoulis؟ Vassilis Plagianakos؟