
Pygod adalah pustaka Python untuk deteksi grafik outlier (deteksi anomali). Bidang yang menarik namun menantang ini memiliki banyak aplikasi utama, misalnya, mendeteksi kegiatan yang mencurigakan di jejaring sosial [1] dan sistem keamanan [2].
Pygod mencakup 10+ algoritma deteksi outlier grafik. Untuk konsistensi dan aksesibilitas, Pygod dikembangkan di atas Pytorch Geometric (PYG) dan Pytorch, dan mengikuti desain API PYOD. Lihat contoh di bawah ini untuk mendeteksi outlier dengan pygod dalam 5 baris!
Pygod ditampilkan untuk :
Deteksi outlier menggunakan pygod dengan 5 baris kode :
# train a dominant detector
from pygod . detector import DOMINANT
model = DOMINANT ( num_layers = 4 , epoch = 20 ) # hyperparameters can be set here
model . fit ( train_data ) # input data is a PyG data object
# get outlier scores on the training data (transductive setting)
score = model . decision_score_
# predict labels and scores on the testing data (inductive setting)
pred , score = model . predict ( test_data , return_score = True )Mengutip Pygod :
Kertas Perangkat Lunak dan Kertas Benchmark kami tersedia untuk umum. Jika Anda menggunakan pygod atau ikatan dalam publikasi ilmiah, kami akan menghargai kutipan untuk makalah berikut:
@Article {JMLR: V25: 23-0963,
penulis = {Kay Liu dan Yingtong Dou dan Xueying Ding dan Xiyang Hu dan Ruitong Zhang dan Hao Peng dan Lichao Sun dan Philip S. Yu},
title = {{pygod}: pustaka {python} untuk deteksi grafik outlier},
Journal = {Journal of Machine Learning Research},
tahun = {2024},
volume = {25},
angka = {141},
halaman = {1--9},
url = {http://jmlr.org/papers/v25/23-0963.html}
}
@Inproeding {neurips2022_acc1ec4a,
author = {Liu, Kay and Dou, Yingtong and Zhao, Yue and Ding, Xueying and Hu, Xiyang and Zhang, Ruitong and Ding, Kaize and Chen, Canyu and Peng, Hao and Shu, Kai and Sun, Lichao and Li, Jundong and Chen, George H and Jia, Zhihao and Yu, Philip S},
booktitle = {kemajuan dalam sistem pemrosesan informasi saraf},
editor = {S. Koyejo dan S. Mohamed dan A. Agarwal dan D. Belgrave dan K. Cho dan A. OH},
halaman = {27021--27035},
Publisher = {Curran Associates, Inc.},
title = {{Bond}: Benchmarking deteksi node outlier tanpa pengawasan pada grafik dikaitkan statis},
url = {https://proedings.neurips.cc/paper_files/paper/2022/file/acc1ec4a9c780006c9aafd595104816b-paper-datasets_and_benchmarks.pdf},
volume = {35},
tahun = {2022}
}
atau:
Liu, K., Dou, Y., Ding, X., Hu, X., Zhang, R., Peng, H., Sun, L. dan Yu, PS, 2024. Pygod: Perpustakaan Python untuk deteksi grafik outlier. Jurnal Penelitian Pembelajaran Mesin, 25 (141), hlm.1-9. Liu, K., Dou, Y., Zhao, Y., Ding, X., Hu, X., Zhang, R., Ding, K., Chen, C., Peng, H., Shu, K., Sun, L., Li, J., Chen, GH, Jia, Z., dan Yu, Ps, 2022. Bondan: Benchmark. Kemajuan dalam Sistem Pemrosesan Informasi Saraf, 35, pp.27021-27035.
Catatan tentang instalasi PYG dan Pytorch : Pygod tergantung pada obor dan torch_geometrik (termasuk dependensi opsional). Untuk merampingkan instalasi, Pygod tidak menginstal perpustakaan ini untuk Anda. Harap instal dari tautan di atas untuk menjalankan pygod:
Disarankan untuk menggunakan PIP untuk pemasangan. Pastikan versi terbaru diinstal, karena Pygod sering diperbarui:
pip install pygod # normal install
pip install --upgrade pygod # or update if neededAtau, Anda dapat mengkloning dan menjalankan file setup.py:
git clone https://github.com/pygod-team/pygod.git
cd pygod
pip install .Ketergantungan yang Diperlukan :
"Pendahuluan Blitz" menunjukkan API dasar Pygod menggunakan detektor dominan. Perlu dicatat bahwa API di semua algoritma lainnya konsisten/serupa .
Referensi API Lengkap: (https://docs.pygod.org). API Cheatsheet untuk semua detektor:
Atribut utama dari detektor yang pas:
Input Pygod : Harap lewati objek data PYG. Lihat contoh pemrosesan data PYG.
| ABBR | Tahun | Tulang punggung | Contoh | Ref |
|---|---|---|---|---|
| Pindai | 2007 | Kekelompokan | TIDAK | [3] |
| GAE | 2016 | GNN+AE | Ya | [4] |
| Radar | 2017 | Mf | TIDAK | [5] |
| GANJIL | 2018 | Mf | TIDAK | [6] |
| SATU | 2019 | Mf | TIDAK | [7] |
| DOMINAN | 2019 | GNN+AE | Ya | [8] |
| SELESAI | 2020 | MLP+AE | Ya | [9] |
| Adone | 2020 | MLP+AE | Ya | [9] |
| Anomalydae | 2020 | GNN+AE | Ya | [10] |
| Gaan | 2020 | Gan | Ya | [11] |
| DMGD | 2020 | GNN+AE | Ya | [12] |
| Ocgnn | 2021 | GNN | Ya | [13] |
| Cola | 2021 | GNN+AE+SSL | Ya | [14] |
| MEMANDU | 2021 | GNN+AE | Ya | [15] |
| CONAD | 2022 | GNN+AE+SSL | Ya | [16] |
| Gadnr | 2024 | GNN+AE | Ya | [17] |
| KARTU | 2024 | GNN+SSL+AE | Ya | [18] |
Anda dipersilakan untuk berkontribusi pada proyek yang menarik ini:
Lihat Panduan Kontribusi untuk informasi lebih lanjut.
Pygod adalah upaya tim yang hebat oleh para peneliti dari UIC, IIT, Buaa, ASU, dan CMU. Anggota tim inti kami meliputi:
Kay Liu (UIC), Yingtong Dou (UIC), Yue Zhao (CMU), Xueying Ding (CMU), Xiyang Hu (CMU), Ruitong Zhang (Buaa), Kaize Ding (ASU), Canyu Chen (IIT),
Hubungi kami dengan mengirimkan laporan masalah atau kirim email ke [email protected].
| [1] | Dou, Y., Liu, Z., Sun, L., Deng, Y., Peng, H. dan Yu, PS, 2020, Oktober. Meningkatkan grafik detektor penipuan berbasis jaringan saraf terhadap penipu yang disamarkan. Dalam Prosiding Konferensi Internasional ACM ke -29 tentang Informasi & Manajemen Pengetahuan (CIKM). |
| [2] | Cai, L., Chen, Z., Luo, C., Gui, J., Ni, J., Li, D. dan Chen, H., 2021, Oktober. Jaringan saraf grafik temporal struktural untuk deteksi anomali dalam grafik dinamis. Dalam Prosiding Konferensi Internasional ACM ke -30 tentang Informasi & Manajemen Pengetahuan (CIKM). |
| [3] | Xu, X., Yuruk, N., Feng, Z. dan Schweiger, TA, 2007, Agustus. Pemindaian: Algoritma pengelompokan struktural untuk jaringan. Dalam Prosiding Konferensi Internasional ACM SIGKDD ke -13 tentang Penemuan Pengetahuan dan Penambangan Data (KDD). |
| [4] | KIPF, TN dan Welling, M., 2016. Variasional grafik auto-encoder. ARXIV Preprint ARXIV: 1611.07308. |
| [5] | Li, J., Dani, H., Hu, X. dan Liu, H., 2017, Agustus. Radar: Analisis residual untuk deteksi anomali dalam jaringan yang dikaitkan. Dalam Prosiding Konferensi Gabungan Internasional ke-dua puluh enam tentang Kecerdasan Buatan (IJCAI). |
| [6] | Peng, Z., Luo, M., Li, J., Liu, H. dan Zheng, Q., 2018, Juli. Anomali: Pendekatan pemodelan bersama untuk deteksi anomali pada jaringan yang dikaitkan. Dalam Prosiding Konferensi Gabungan Internasional ke-dua puluh tujuh tentang Kecerdasan Buatan (IJCAI). |
| [7] | Bandyopadhyay, S., Lokesh, N. dan Murty, MN, 2019, Juli. Outlier sadar jaringan embedding untuk jaringan yang dikaitkan. Dalam Prosiding Konferensi AAAI tentang Kecerdasan Buatan (AAAI). |
| [8] | Ding, K., Li, J., Bhanushali, R. dan Liu, H., 2019, Mei. Deteksi anomali yang dalam pada jaringan yang dikaitkan. Dalam Prosiding Konferensi Internasional SIAM tentang Data Mining (SDM). |
| [9] | (1, 2) Bandyopadhyay, S., Vivek, SV dan Murty, MN, 2020, Januari. Outlier resisten arsitektur mendalam tanpa pengawasan untuk embedding jaringan yang dikaitkan. Dalam Prosiding Konferensi Internasional tentang Pencarian Web dan Data Mining (WSDM). |
| [10] | Fan, H., Zhang, F. dan Li, Z., 2020, Mei. Anomalydae: Autoencoder ganda untuk deteksi anomali pada jaringan yang dikaitkan. Dalam Prosiding Konferensi Internasional IEEE tentang Akustik, Pidato dan Pemrosesan Sinyal (ICASSP). |
| [11] | Chen, Z., Liu, B., Wang, M., Dai, P., Lv, J. dan Bo, L., 2020, Oktober. Deteksi anomali jaringan yang dikaitkan dengan permusuhan generatif. Dalam Prosiding Konferensi Internasional ACM ke -29 tentang Informasi & Manajemen Pengetahuan (CIKM). |
| [12] | Bandyopadhyay, S., Vishal Vivek, S. dan Murty, MN, 2020. Mengintegrasikan jaringan embedding dan deteksi outlier komunitas melalui deskripsi grafik multiclass. Perbatasan dalam Kecerdasan dan Aplikasi Buatan, (FAIA). |
| [13] | Wang, X., Jin, B., Du, Y., Cui, P., Tan, Y. dan Yang, Y., 2021. Jaringan saraf grafik satu kelas untuk deteksi anomali dalam jaringan yang dikaitkan. Komputasi dan aplikasi saraf. |
| [14] | Liu, Y., Li, Z., Pan, S., Gong, C., Zhou, C. dan Karypis, G., 2021. Deteksi anomali pada jaringan yang dikaitkan melalui pembelajaran yang diatasi sendiri. Transaksi IEEE pada jaringan saraf dan sistem pembelajaran (TNNLS). |
| [15] | Yuan, X., Zhou, N., Yu, S., Huang, H., Chen, Z. dan Xia, F., 2021, Desember. Deteksi anomali berbasis struktur tingkat tinggi pada jaringan yang dikaitkan. Pada 2021 Konferensi Internasional IEEE tentang Big Data (Big Data). |
| [16] | Xu, Z., Huang, X., Zhao, Y., Dong, Y., dan Li, J., 2022. Deteksi anomali jaringan yang dikaitkan dengan kontras dengan augmentasi data. Dalam Prosiding Konferensi Pasifik-Asia ke-26 tentang Penemuan Pengetahuan dan Penambangan Data (PAKDD). |
| [17] | Roy, A., Shu, J., Li, J., Yang, C., Elshocht, O., Smeets, J. dan Li, P., 2024. GAD-NR: Deteksi anomali grafik melalui rekonstruksi lingkungan. Dalam Prosiding Konferensi Internasional ACM ke -17 tentang Pencarian Web dan Penambangan Data (WSDM). |
| [18] | Wang Y., Wang X., He C., Chen X., Luo Z., Duan L., Zuo J., 2024. Pembelajaran kontras yang dipandu komunitas dengan rekonstruksi sadar anomali untuk deteksi anomali pada jaringan yang dikaitkan. Sistem Basis Data untuk Aplikasi Lanjutan (DASFAA). |