該存儲庫介紹了Hipart軟件包,這是一個開源的本機Python庫,可提供有效且可解釋的分裂分層聚類算法的實現。 Hipart支持交互式可視化,以操縱執行步驟,從而直接干預聚類結果。該軟件包非常適合大數據應用程序,因為已將重點放在實施聚類方法的計算效率上。所使用的依賴項是Python建築包或高度維護的穩定外部軟件包。該軟件是根據MIT許可證提供的。
對於軟件包的安裝,唯一必要的操作和要求是Python更高或等於3.8的版本,並且執行以下命令。
pip install HiPart示例Bellow是軟件包執行的最簡單形式。不久,它顯示了包含6個簇的合成聚類數據集的創建。之後,它使用DEPDDP算法聚類,並且僅返回群集標籤。
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )Hipart軟件包提供了一套全面的示例,可指導用戶使用其各種算法。這些示例位於存儲庫的示例目錄中。
為了一般了解軟件包的功能,用戶可以參考clustering_example文件。該文件是基礎指南,提供了包裝中的算法的完整示例。
此外,對於有興趣合併kernelpca方法的人,clustering_with_kpca_example文件是寶貴的資源。它提供了一個詳細的示例,說明瞭如何在Hipart軟件包的上下文中應用kernelpca。
識別通過相似性或差異矩陣(例如距離矩陣)聚類的重要性,Hipart軟件包包括clustering_with_with_distance_matrix_example文件。這個具體示例證明了DEPDDP算法與距離矩陣的使用,並提供了實用的應用程序方案。
最後,該軟件包具有交互式可視化組件,該組件在Interactive_visualization_example文件中進行了例證。這個示例不僅展示了交互式可視化的執行,而且還提供了可視化GUI的全面說明。
這些資源共同確保Hipart軟件包的用戶對其功能和應用具有全面且實用的理解。
包裝的完整文檔可以在此處找到。
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} 根據1901年授予協議,該項目已獲得希臘研究與創新基金會(HFRI)的資金。
Dimitris Tasoulis? panagiotis anagnostou? Sotiris tasoulis? Vassilis Plagianakos?