Repositori ini menyajikan Paket HipArt, perpustakaan python asli sumber terbuka yang menyediakan implementasi algoritma pengelompokan hierarkis yang efisien dan dapat ditafsirkan. HIPART mendukung visualisasi interaktif untuk manipulasi langkah -langkah eksekusi yang memungkinkan intervensi langsung dari hasil pengelompokan. Paket ini sangat cocok untuk aplikasi data besar karena fokus telah diberikan pada efisiensi komputasi dari metodologi pengelompokan yang diimplementasikan. Ketergantungan yang digunakan adalah paket python build-in atau paket eksternal stabil yang sangat dipelihara. Perangkat lunak disediakan di bawah lisensi MIT.
Untuk pemasangan paket, satu -satunya tindakan dan persyaratan yang diperlukan adalah versi Python lebih tinggi atau sama dengan 3,8 dan pelaksanaan perintah berikut.
pip install HiPartContoh di bawah adalah bentuk paling sederhana dari eksekusi paket. Singkatnya, ini menunjukkan penciptaan dataset pengelompokan sintetis yang berisi 6 cluster. Setelah itu dikelompokkan dengan algoritma DEPDDP dan hanya label cluster yang dikembalikan.
from HiPart . clustering import DePDDP
from sklearn . datasets import make_blobs
X , y = make_blobs ( n_samples = 1500 , centers = 6 , random_state = 0 )
clustered_class = DePDDP ( max_clusters_number = 6 ). fit_predict ( X )Paket HipArt menawarkan serangkaian contoh yang komprehensif untuk memandu pengguna dalam memanfaatkan berbagai algoritma. Contoh -contoh ini berlokasi di direktori contoh repositori.
Untuk pemahaman umum tentang kemampuan paket, pengguna dapat merujuk ke file clustering_example. File ini berfungsi sebagai panduan dasar, memberikan contoh lengkap dari algoritma paket yang sedang beraksi.
Selain itu, bagi mereka yang tertarik untuk memasukkan metode kernelpca, file clustering_with_kpca_example adalah sumber daya yang sangat berharga. Ini menawarkan contoh terperinci tentang cara menerapkan kernelpca dalam konteks paket hipart.
Mengenali pentingnya pengelompokan melalui kesamaan atau matriks ketidaksamaan, seperti matriks jarak, paket HIPART mencakup file clustering_with_distance_matrix_example. Contoh khusus ini menunjukkan penggunaan algoritma DEPDDP dengan matriks jarak, menawarkan skenario aplikasi praktis.
Terakhir, paket ini menampilkan komponen visualisasi interaktif, yang dicontohkan dalam file interaktif_visualization_example. Contoh ini tidak hanya menampilkan pelaksanaan visualisasi interaktif tetapi juga memberikan instruksi komprehensif untuk menavigasi GUI visualisasi.
Sumber daya ini secara kolektif memastikan bahwa pengguna paket HIPART memiliki pemahaman yang lengkap dan praktis tentang fungsi dan aplikasinya.
Dokumentasi lengkap paket dapat ditemukan di sini.
@article { Anagnostou2023HiPart ,
title = { HiPart: Hierarchical Divisive Clustering Toolbox } ,
author = { Panagiotis Anagnostou and Sotiris Tasoulis and Vassilis P. Plagianakos and Dimitris Tasoulis } ,
year = { 2023 } ,
journal = { Journal of Open Source Software } ,
publisher = { The Open Journal } ,
volume = { 8 } ,
number = { 84 } ,
pages = { 5024 } ,
doi = { 10.21105/joss.05024 } ,
url = { https://doi.org/10.21105/joss.05024 }
} Proyek ini telah menerima dana dari Hellenic Foundation for Research and Innovation (HFRI), berdasarkan perjanjian hibah no 1901.
Dimitris Tasoulis? Panagiotis anagnostou? Sotiris Tasoulis? Vassilis Plagianakos?