Dieses Repository präsentiert das Hipart-Paket, eine Open-Source-Python-Bibliothek, die effiziente und interpretierbare Implementierungen von spaltenden hierarchischen Clustering-Algorithmen bietet. Hipart unterstützt interaktive Visualisierungen für die Manipulation der Ausführungsschritte, die die direkte Intervention des Clustering -Ergebnisses ermöglichen. Dieses Paket ist für Big -Data -Anwendungen sehr geeignet, da der Fokus auf der Recheneffizienz der implementierten Clustering -Methoden gewährt wurde. Die verwendeten Abhängigkeiten sind entweder Python-Build-In-Pakete oder hoch gepflegte stabile externe Pakete. Die Software wird im Rahmen der MIT -Lizenz bereitgestellt.
Für die Installation des Pakets sind die einzigen notwendigen Aktionen und Anforderungen eine Version von Python höher oder gleich 3.8 und die Ausführung des folgenden Befehls.
pip install HiPartDas Beispiel ist die einfachste Form der Ausführung des Pakets. In Kürze zeigt es die Erstellung des synthetischen Clustering -Datensatzes mit 6 Clustern. Danach wird es mit dem DEPDDP -Algorithmus zusammengefasst und nur die Cluster -Etiketten werden zurückgegeben.
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )Das Hipart -Paket bietet eine umfassende Auswahl an Beispielen, mit denen Benutzer die verschiedenen Algorithmen nutzen können. Diese Beispiele befinden sich bequem im Beispiel für Repository -Beispiele.
Für ein allgemeines Verständnis der Funktionen des Pakets können Benutzer auf die Datei clustering_example verweisen. Diese Datei dient als grundlegende Anleitung und liefert vollständige Beispiele für die Algorithmen des Pakets in Aktion.
Darüber hinaus ist die Datei clustering_with_kpca_example eine unschätzbare Ressource, für diejenigen, die an Kernelpca -Methoden teilnehmen möchten. Es bietet ein detailliertes Beispiel für die Anwendung von Kernelpca im Kontext des Hipart -Pakets.
Das Hipart -Paket erkennt die Bedeutung der Clusterbildung durch Ähnlichkeits- oder Unähnlichkeitsmatrizen wie Distanzmatrizen und enthält die Datei clustering_with_distance_matrix_example. Dieses spezifische Beispiel zeigt die Verwendung des DEPDDP -Algorithmus mit einer Distanzmatrix, die ein praktisches Anwendungsszenario bietet.
Schließlich verfügt das Paket über eine interaktive Visualisierungskomponente, die in der Datei interactive_visualisation_example veranschaulicht wird. Dieses Beispiel zeigt nicht nur die Ausführung der interaktiven Visualisierung, sondern bietet auch umfassende Anweisungen zum Navigieren der Visualisierungs -GUI.
Diese Ressourcen stellen zusammen, dass Benutzer des Hipart-Pakets ein umfassendes und praktisches Verständnis für die Funktionen und Anwendungen haben.
Die vollständige Dokumentation des Pakets finden Sie hier.
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} Dieses Projekt wurde von der Hellenic Foundation for Research and Innovation (HFRI) im Rahmen der Zuschussvereinbarung Nr. 1901 erhalten.
Dimitris Tasoulis? Panagiotis Anagnostou? Sotiris Tasoulis? Vassilis plagianakos?