Este repositório apresenta o pacote Hipart, uma biblioteca python nativa de código aberto que fornece implementações eficientes e interpretáveis de algoritmos de cluster hierárquico divisivos. A Hipart suporta visualizações interativas para a manipulação das etapas de execução, permitindo a intervenção direta do resultado do agrupamento. Este pacote é altamente adequado para aplicativos de big data, pois o foco foi dado à eficiência computacional das metodologias de cluster implementadas. As dependências utilizadas são pacotes de construção do Python ou pacotes externos estáveis altamente mantidos. O software é fornecido sob a licença do MIT.
Para a instalação do pacote, as únicas ações e requisitos necessários são uma versão do Python mais alta ou igual a 3.8 e a execução do comando a seguir.
pip install HiPartO exemplo abaixo é a forma mais simples da execução do pacote. Logo, mostra a criação do conjunto de dados de cluster sintético contendo 6 clusters. Posteriormente, ele está agrupado com o algoritmo DEPDDP e apenas os rótulos do cluster são retornados.
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )O pacote Hipart oferece um conjunto abrangente de exemplos para orientar os usuários na utilização de seus vários algoritmos. Esses exemplos estão convenientemente localizados no diretório de exemplos do repositório.
Para um entendimento geral dos recursos do pacote, os usuários podem se referir ao arquivo clustering_example. Este arquivo serve como um guia fundamental, fornecendo exemplos completos dos algoritmos do pacote em ação.
Além disso, para os interessados em incorporar os métodos Kernelpca, o arquivo clustering_with_kpca_example é um recurso inestimável. Oferece um exemplo detalhado de como aplicar o Kernelpca no contexto do pacote HIPART.
Reconhecendo a importância de cluster por meio de similaridade ou dissimilaridade, como matrizes de distância, o pacote HIPART inclui o arquivo clustering_with_distance_matrix_example. Este exemplo específico demonstra o uso do algoritmo DEPDDP com uma matriz de distância, oferecendo um cenário de aplicação prático.
Por fim, o pacote possui um componente de visualização interativa, que é exemplificado no arquivo interactive_visualization_example. Este exemplo não apenas mostra a execução da visualização interativa, mas também fornece instruções abrangentes para navegar na GUI da visualização.
Esses recursos garantem coletivamente que os usuários do pacote Hipart tenham uma compreensão completa e prática de suas funcionalidades e aplicativos.
A documentação completa do pacote pode ser encontrada aqui.
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} Este projeto recebeu financiamento da Hellenic Foundation for Research and Inovation (HFRI), sob o acordo de concessão no 1901.
Dimitris Tasoulis? Panagiotis anagnosou? Sotiris Tasoulis? Vassilis Plagianakos?