
Pygod est une bibliothèque Python pour la détection des valeurs aberrantes graphiques (détection d'anomalie). Ce domaine passionnant mais difficile a de nombreuses applications clés, par exemple, détectant des activités suspectes dans les réseaux sociaux [1] et les systèmes de sécurité [2].
Pygod comprend plus de 10 algorithmes de détection des valeurs aberrantes. Pour la cohérence et l'accessibilité, le pygod est développé au-dessus de la géométrique Pytorch (PYG) et du pytorch, et suit la conception de l'API de Pyod. Voir des exemples ci-dessous pour détecter les valeurs aberrantes avec Pygod en 5 lignes!
Pygod est présenté pour :
Détection aberrante à l'aide de Pygod avec 5 lignes de code :
# train a dominant detector
from pygod . detector import DOMINANT
model = DOMINANT ( num_layers = 4 , epoch = 20 ) # hyperparameters can be set here
model . fit ( train_data ) # input data is a PyG data object
# get outlier scores on the training data (transductive setting)
score = model . decision_score_
# predict labels and scores on the testing data (inductive setting)
pred , score = model . predict ( test_data , return_score = True )Citant Pygod :
Notre papier logiciel et notre papier de référence sont accessibles au public. Si vous utilisez Pygod ou Bond dans une publication scientifique, nous apprécierions les citations des articles suivants:
@article {JMLR: V25: 23-0963,
Auteur = {Kay Liu et Yingtong Dou et Xueying Ding et Xiyang Hu et Ruitong Zhang et Hao Peng et Lichao Sun et Philip S. Yu},
title = {{pygod}: une bibliothèque {python} pour la détection des valeurs aberrantes graphiques},
Journal = {Journal of Machine Learning Research},
année = {2024},
volume = {25},
nombre = {141},
pages = {1--9},
url = {http://jmlr.org/papers/v25/23-0963.html}
}
@inproceedings {nererips2022_acc1ec4a,
Auteur = {Liu, Kay et Dou, Yingtong et Zhao, Yue et Ding, Xueying et Hu, Xiyang et Zhang, Ruitong et Ding, Kaize et Chen, Canyu et Peng, Hao et Shu, Kai et Sun, Lichao et Li, Jundong et Chen, George H and Jia, Zhiha et Yu, Philip S},
booktitle = {avancées dans les systèmes de traitement de l'information neuronaux},
éditeur = {S. Koyejo et S. Mohamed et A. Agarwal et D. Belgrave et K. Cho et A. Oh},
pages = {27021--27035},
Publisher = {Curran Associates, Inc.},
title = {{Bond}: Benchmarking Detection de nœud de valeurs aberrants non supervisé sur les graphiques attribués statiques},
url = {https://proceedings.neurips.cc/paper_files/paper/2022/file/acc1ec4a9c780006c9aafd595104816b-paper-datasets_and_benchmarks.pdf},
volume = {35},
année = {2022}
}
ou:
Liu, K., Dou, Y., Ding, X., Hu, X., Zhang, R., Peng, H., Sun, L. et Yu, PS, 2024. Pygod: A Python Library for Graph Outlier Detection. Journal of Machine Learning Research, 25 (141), pp.1-9. Liu, K., Dou, Y., Zhao, Y., Ding, X., Hu, X., Zhang, R., Ding, K., Chen, C., Peng, H., Shu, K., Sun, L., Li, J., Chen, GH, Jia, Z., et Yu, Ps, 2022. Benchmarkmarking Unpervised Outlier Node Node. Avances dans les systèmes de traitement des informations neuronales, 35, pp.27021-27035.
Remarque sur PYG et PYTORCH Installation : Pygod dépend de Torch et Torch_Geometric (y compris ses dépendances facultatives). Pour rationaliser l'installation, Pygod n'installe pas ces bibliothèques pour vous. Veuillez les installer à partir des liens ci-dessus pour l'exécution de Pygod:
Il est recommandé d'utiliser PIP pour l'installation. Veuillez vous assurer que la dernière version est installée, car Pygod est fréquemment mis à jour:
pip install pygod # normal install
pip install --upgrade pygod # or update if neededAlternativement, vous pouvez cloner et exécuter le fichier setup.py:
git clone https://github.com/pygod-team/pygod.git
cd pygod
pip install .Dépendances requises :
"A Blitz Introduction" démontre l'API de base de Pygod en utilisant le détecteur dominant. Il est à noter que l'API de tous les autres algorithmes est cohérente / similaire .
Référence complète de l'API: (https://docs.pygod.org). API Cheatheet pour tous les détecteurs:
Attributs clés d'un détecteur ajusté:
Entrée de Pygod : veuillez passer dans un objet de données PYG. Voir des exemples de traitement des données PYG.
| Abbr | Année | Colonne vertébrale | Échantillonnage | Référence |
|---|---|---|---|---|
| BALAYAGE | 2007 | Regroupement | Non | [3] |
| Gae | 2016 | GNN + AE | Oui | [4] |
| Radar | 2017 | MF | Non | [5] |
| ANORMAL | 2018 | MF | Non | [6] |
| UN | 2019 | MF | Non | [7] |
| DOMINANT | 2019 | GNN + AE | Oui | [8] |
| FAIT | 2020 | MLP + AE | Oui | [9] |
| Tonne | 2020 | MLP + AE | Oui | [9] |
| Anomalydae | 2020 | GNN + AE | Oui | [10] |
| Gaan | 2020 | Gan | Oui | [11] |
| DMGD | 2020 | GNN + AE | Oui | [12] |
| OCGNN | 2021 | Gnn | Oui | [13] |
| Cola | 2021 | GNN + AE + SSL | Oui | [14] |
| GUIDE | 2021 | GNN + AE | Oui | [15] |
| Conad | 2022 | GNN + AE + SSL | Oui | [16] |
| Gadnr | 2024 | GNN + AE | Oui | [17] |
| CARTE | 2024 | GNN + SSL + AE | Oui | [18] |
Vous êtes invités à contribuer à ce projet passionnant:
Voir Guide de contribution pour plus d'informations.
Pygod est un excellent effort d'équipe des chercheurs de l'UIC, IIT, Buaa, ASU et CMU. Les membres de notre équipe principale incluent:
Kay Liu (UIC), Yingtong Dou (UIC), Yue Zhao (CMU), Xueying Ding (CMU), Xiyang Hu (CMU), Ruitong Zhang (Buaa), Kaize Ding (ASU), Canyu Chen (IIT),
Contactez-nous en soumettant un rapport de problème ou envoyez un e-mail à [email protected].
| [1] | Dou, Y., Liu, Z., Sun, L., Deng, Y., Peng, H. et Yu, PS, 2020, octobre. Améliorer les détecteurs de fraude basés sur le réseau neuronal contre les fraudeurs camouflés. Dans les actes de la 29e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances (CIKM). |
| [2] | Cai, L., Chen, Z., Luo, C., Gui, J., Ni, J., Li, D. et Chen, H., 2021, octobre. Réseaux de neurones de graphiques temporels structurels pour la détection des anomalies dans les graphiques dynamiques. Dans les actes de la 30e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances (CIKM). |
| [3] | Xu, X., Yuruk, N., Feng, Z. et Schweiger, TA, 2007, août. SCAN: un algorithme de clustering structurel pour les réseaux. Dans les actes de la 13e conférence internationale ACM SIGKDD sur la découverte des connaissances et l'exploration de données (KDD). |
| [4] | Kipf, TN et Welling, M., 2016. Autocoders de graphiques variationnels. ARXIV PRÉALLAGE ARXIV: 1611.07308. |
| [5] | Li, J., Dani, H., Hu, X. et Liu, H., 2017, août. Radar: analyse résiduelle de la détection des anomalies dans les réseaux attribués. Dans les actes de la vingt-sixième conférence conjointe internationale sur l'intelligence artificielle (IJCAI). |
| [6] | Peng, Z., Luo, M., Li, J., Liu, H. et Zheng, Q., 2018, juillet. Anormal: une approche de modélisation conjointe pour la détection des anomalies sur les réseaux attribués. Dans les actes de la vingt-septième conférence conjointe internationale sur l'intelligence artificielle (IJCAI). |
| [7] | Bandyopadhyay, S., Lokesh, N. et Murty, MN, 2019, juillet. L'intégration du réseau conscient des valeurs aberrantes pour les réseaux attribués. Dans les actes de la Conférence AAAI sur l'intelligence artificielle (AAAI). |
| [8] | Ding, K., Li, J., Bhanushali, R. et Liu, H., 2019, mai. Détection des anomalies profondes sur les réseaux attribués. Dans les actes de la Conférence internationale du SIAM sur l'exploration de données (SDM). |
| [9] | (1, 2) Bandyopadhyay, S., Vivek, SV et Murty, MN, 2020, janvier. Architectures profondes non supervisées résistantes des valeurs aberrantes pour l'intégration du réseau attribué. Dans les actes de la Conférence internationale sur la recherche sur le Web et l'exploration de données (WSDM). |
| [10] | Fan, H., Zhang, F. et Li, Z., 2020, mai. Anomalydae: double autoencodeur pour la détection d'anomalies sur les réseaux attribués. Dans les actes de la Conférence internationale de l'IEEE sur l'acoustique, le traitement de la parole et du signal (ICASSP). |
| [11] | Chen, Z., Liu, B., Wang, M., Dai, P., Lv, J. et Bo, L., 2020, octobre. Détection d'anomalie du réseau attribuée à l'adversariat génératif. Dans les actes de la 29e Conférence internationale de l'ACM sur la gestion de l'information et des connaissances (CIKM). |
| [12] | Bandyopadhyay, S., Vishal Vivek, S. et Murty, MN, 2020. Intégration de l'intégration du réseau et de la détection des valeurs aberrantes communautaires via la description du graphique multicalme. Frontières en intelligence artificielle et applications, (FAIA). |
| [13] | Wang, X., Jin, B., Du, Y., Cui, P., Tan, Y. et Yang, Y., 2021. Réseaux de neurones graphiques à une classe pour la détection d'anomalies dans les réseaux attribués. Informatique neuronale et applications. |
| [14] | Liu, Y., Li, Z., Pan, S., Gong, C., Zhou, C. et Karypis, G., 2021. Détection d'anomalie sur les réseaux attribués via un apprentissage auto-supervisé contrasté. Transactions IEEE sur les réseaux de neurones et les systèmes d'apprentissage (TNNL). |
| [15] | Yuan, X., Zhou, N., Yu, S., Huang, H., Chen, Z. et Xia, F., 2021, décembre. Détection d'anomalies basée sur la structure d'ordre supérieur sur les réseaux attribués. En 2021, la Conférence internationale de l'IEEE sur les mégadonnées (Big Data). |
| [16] | Xu, Z., Huang, X., Zhao, Y., Dong, Y., et Li, J., 2022. Détection d'anomalie du réseau attribuée contrastive avec augmentation des données. Dans les actes de la 26e Conférence du Pacifique-Asie sur la découverte des connaissances et l'exploration de données (PAKDD). |
| [17] | Roy, A., Shu, J., Li, J., Yang, C., Elshocht, O., Smeets, J. et Li, P., 2024. GAD-NR: détection des anomalies graphiques via la reconstruction du quartier. Dans les actes de la 17e conférence internationale ACM sur la recherche sur le Web et l'exploration de données (WSDM). |
| [18] | Wang Y., Wang X., He C., Chen X., Luo Z., Duan L., Zuo J., 2024. Apprentissage contrastif guidé par la communauté avec reconstruction anomalie pour la détection d'anomalies sur les réseaux attribués. Systèmes de base de données pour les applications avancées (DASFAA). |