このリポジトリは、分裂的な階層クラスタリングアルゴリズムの効率的で解釈可能な実装を提供するオープンソースネイティブPythonライブラリであるHipartパッケージを提示します。 Hipartは、クラスタリング結果の直接的な介入を可能にする実行手順を操作するためのインタラクティブな視覚化をサポートしています。このパッケージは、実装されたクラスタリング方法論の計算効率に焦点が当てられているため、ビッグデータアプリケーションに非常に適しています。使用される依存関係は、Pythonビルドインパッケージまたは高度にメンテナンスされた安定した外部パッケージのいずれかです。ソフトウェアはMITライセンスの下で提供されます。
パッケージをインストールするために、必要なアクションと要件の唯一の唯一のアクションは、3.8より高いまたは等しいPythonのバージョンと次のコマンドの実行です。
pip install HiPartBellowの例は、パッケージの実行の最も単純な形式です。まもなく、6つのクラスターを含む合成クラスタリングデータセットの作成を示しています。その後、DEPDDPアルゴリズムでクラスター化され、クラスターラベルのみが返されます。
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )Hipartパッケージは、さまざまなアルゴリズムを利用するユーザーをガイドするための包括的な例を提供します。これらの例は、リポジトリの例ディレクトリに便利にあります。
パッケージの機能を一般的に理解するために、ユーザーはclustering_exampleファイルを参照できます。このファイルは、基礎ガイドとして機能し、パッケージのアルゴリズムの完全な例を提供します。
さらに、kernelpcaメソッドの組み込みに興味がある人のために、clustering_with_kpca_exampleファイルは非常に貴重なリソースです。 Hipartパッケージのコンテキスト内でKernelPCAを適用する方法の詳細な例を提供します。
HIPARTパッケージには、Clustering_with_distance_matrix_exampleファイルが含まれます。この特定の例は、距離マトリックスを使用してDEPDDPアルゴリズムの使用を示しており、実用的なアプリケーションシナリオを提供します。
最後に、このパッケージには、Interactive_Visualization_exampleファイルに例示されているインタラクティブな視覚化コンポーネントがあります。この例は、インタラクティブな視覚化の実行を紹介するだけでなく、視覚化GUIをナビゲートするための包括的な指示も提供します。
これらのリソースは、HIPARTパッケージのユーザーが、その機能とアプリケーションを十分にバランスのとれた実用的な理解を深めることを集合的に保証します。
パッケージの完全なドキュメントはこちらをご覧ください。
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} このプロジェクトは、1901年の助成金契約下で、Hellenic Research and Innovation(HFRI)から資金を受け取っています。
Dimitris Tasoulis? Panagiotis anagnostou? Sotiris Tasoulis? Vassilis Plagianakos?