Этот репозиторий представляет пакет Hipart, нативную библиотеку Python с открытым исходным кодом, которая обеспечивает эффективные и интерпретируемые реализации разного иерархического кластеризации алгоритмов. Hipart поддерживает интерактивные визуализации для манипулирования этапами выполнения, позволяя прямому вмешательству результата кластеризации. Этот пакет высоко подходит для приложений больших данных, так как основное внимание уделялось вычислительной эффективности реализованных методологий кластеризации. Используемые зависимости представляют собой либо встроенные пакеты Python, либо высоко поддерживаемые стабильные внешние пакеты. Программное обеспечение предоставляется по лицензии MIT.
Для установки пакета единственными необходимыми действиями и требованиями являются версия Python выше или равны 3.8 и выполнение следующей команды.
pip install HiPartПример Bellow - самая простая форма выполнения пакета. Вскоре он показывает создание набора данных синтетической кластеризации, содержащего 6 кластеров. После этого он сгруппирован с алгоритмом DEPDDP, и возвращаются только макет кластеров.
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )Пакет Hipart предлагает комплексный набор примеров, которые приводят пользователей при использовании различных алгоритмов. Эти примеры удобно расположены в каталоге примеров репозитория.
Для общего понимания возможностей пакета пользователи могут ссылаться на файл clustering_example. Этот файл служит основополагающим руководством, предоставляя полные примеры алгоритмов пакета в действии.
Кроме того, для тех, кто заинтересован в включении методов kernelpca, файл clustering_with_kpca_example является бесценным ресурсом. Он предлагает подробный пример того, как применять kernelpca в контексте пакета Hipart.
Признавая важность кластеризации с помощью матриц сходства или различий, таких как матрицы расстояний, пакет Hipart включает файл clustering_with_distance_matrix_example. Этот конкретный пример демонстрирует использование алгоритма DEPDDP с матрицей расстояний, предлагая практическое сценарий применения.
Наконец, пакет имеет интерактивную компонент визуализации, который иллюстрируется в файле Interactive_visualization_example. Этот пример не только демонстрирует выполнение интерактивной визуализации, но также предоставляет комплексные инструкции для навигации по графическому интерфейсу.
Эти ресурсы в совокупности гарантируют, что пользователи пакета Hipart имеют всестороннее и практическое понимание своих функциональных возможностей и приложений.
Полную документацию пакета можно найти здесь.
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} Этот проект получил финансирование от Эллинского фонда исследований и инноваций (HFRI) в соответствии с грантовым соглашением № 1901.
Димитрис Тасулис? Panagiotis anagnostou? Сотирис Тасулис? Vassilis plagianakos?