
Pygod - это библиотека Python для обнаружения выбросов графика (обнаружение аномалии). Эта захватывающая, но сложная область имеет много ключевых приложений, например, обнаружение подозрительных видов деятельности в социальных сетях [1] и систем безопасности [2].
Pygod включает в себя 10+ алгоритмов обнаружения выбросов графиков. Для согласованности и доступности Pygod разрабатывается поверх геометрического (PYG) и Pytorch Pytorch и следует за дизайном API PYOD. См. Примеры ниже для обнаружения выбросов с Pygod в 5 линиях!
Pygod представлен для :
Обнаружение выбросов с использованием Pygod с 5 строками кода :
# train a dominant detector
from pygod . detector import DOMINANT
model = DOMINANT ( num_layers = 4 , epoch = 20 ) # hyperparameters can be set here
model . fit ( train_data ) # input data is a PyG data object
# get outlier scores on the training data (transductive setting)
score = model . decision_score_
# predict labels and scores on the testing data (inductive setting)
pred , score = model . predict ( test_data , return_score = True )Цитируя Pygod :
Наша бумага программного обеспечения и эталонная бумага общедоступны. Если вы используете Pygod или Bond в научной публикации, мы будем признателен о ссылках к следующим документам:
@Article {JMLR: V25: 23-0963,
Автор = {Кей Лю и Ингтонг Доу и Сюэтинг Дин и Сиян Ху и Руинг Чжан и Хао Пэн и Личао Сан и Филип С. Ю.,
title = {{pygod}: a {python} библиотека для обнаружения выбросов графика},
Journal = {журнал исследований машинного обучения},
Год = {2024},
том = {25},
number = {141},
pages = {1--9},
url = {http://jmlr.org/papers/v25/23-0963.html}
}
@inproceedings {neurips2022_acc1ec4a,
Автор = {Лю, Кей и Доу, Йинтонг и Чжао, Юэ и Дин, Сюиинг и Ху, Сиян и Чжан, Руитонг и Дин, Кайз и Чен, Кани и Пенг, Хао и Шу, Кай и Сан, Личао и Ли, Джундонг и Чен, Джордж Х и Чиа, Зихао и Иу, Фили, Фили, Фили, Фили и Фи.
booktitle = {Advances в системах обработки нейронной информации},
Editor = {S. Койехо и С. Мохамед и А. Агарвал и Д. Белгрейв и К. Чо и А. О},
pages = {27021--27035},
Publisher = {Curran Associates, Inc.},
title = {{bond}: сравнительный анализ неконтролируемого обнаружения узлов выбросов на статических приписываемых графах},
url = {https://proceedings.neurips.cc/paper_files/paper/2022/file/acc1ec4a9c780006c9aafd595104816b-paper-datasets_and_benchmarks.pdf},
том = {35},
Год = {2022}
}
или:
Liu, K., Dou, Y., Ding, X., Hu, X., Zhang, R., Peng, H., Sun, L. и Yu, PS, 2024. Pygod: библиотека Python для обнаружения выбросов графика. Журнал исследований машинного обучения, 25 (141), с.1-9. Liu, K., Dou, Y., Zhao, Y., Ding, X., Hu, X., Zhang, R., Ding, K., Chen, C., Peng, H., Shu, K., Sun, L., Li, J., Chen, GH, Jia, Z., и Yu, PS, 2022. Бонд: Benchmarking Unsupring Outlier Node. Достижения в системах обработки нейронной информации, 35, с.27021-27035.
Примечание на установке PYG и Pytorch : PYGOD зависит от TORCH и TORCH_GEOMETRIC (включая его необязательные зависимости). Чтобы упростить установку, Pygod не устанавливает эти библиотеки для вас. Пожалуйста, установите их по приведенным выше ссылкам для запуска Pygod:
Рекомендуется использовать PIP для установки. Пожалуйста, убедитесь, что последняя версия установлена, так как Pygod часто обновляется:
pip install pygod # normal install
pip install --upgrade pygod # or update if neededВ качестве альтернативы, вы можете клонировать и запустить файл setup.py:
git clone https://github.com/pygod-team/pygod.git
cd pygod
pip install .Требуемые зависимости :
«Введение в блиц» демонстрирует основной API Pygod с использованием доминирующего детектора. Отмечено, что API во всех других алгоритмах является последовательным/похожим .
Полная ссылка на API: (https://docs.pygod.org). Чит -лист API для всех детекторов:
Ключевые атрибуты подходящего детектора:
Ввод PYGOD : Пожалуйста, пропустите объект данных PYG. См. Примеры обработки данных PYG.
| Аббр | Год | Магистраль | Выборка | Рефери |
|---|---|---|---|---|
| Сканирование | 2007 | Кластеризация | Нет | [3] |
| Газо | 2016 | GNN+AE | Да | [4] |
| Радар | 2017 | Млн | Нет | [5] |
| Аномальный | 2018 | Млн | Нет | [6] |
| ОДИН | 2019 | Млн | Нет | [7] |
| Доминирующий | 2019 | GNN+AE | Да | [8] |
| СДЕЛАННЫЙ | 2020 | MLP+AE | Да | [9] |
| Адоне | 2020 | MLP+AE | Да | [9] |
| Anomalydae | 2020 | GNN+AE | Да | [10] |
| Гаан | 2020 | Ган | Да | [11] |
| Dmgd | 2020 | GNN+AE | Да | [12] |
| Ocgnn | 2021 | Г -н | Да | [13] |
| Кола | 2021 | GNN+AE+SSL | Да | [14] |
| ГИД | 2021 | GNN+AE | Да | [15] |
| Конад | 2022 | GNN+AE+SSL | Да | [16] |
| ГАДНР | 2024 | GNN+AE | Да | [17] |
| Карта | 2024 | GNN+SSL+AE | Да | [18] |
Вы можете внести свой вклад в этот захватывающий проект:
См. Руководство по взносу для получения дополнительной информации.
Pygod - отличная команда исследователей из UIC, IIT, Buaa, ASU и CMU. Наши основные члены команды включают:
Кей Лю (UIC), Yingtong Dou (UIC), Юэ Чжао (CMU), Xueying Ding (CMU), Xiyang Hu (CMU), Ruitong Zhang (Buaa), Kaize Ding (Asu), Canyu Chen (IIT),
Обратитесь к нам, отправив отчет о выпуске или отправьте электронное письмо на [email protected].
| [1] | Dou, Y., Liu, Z., Sun, L., Deng, Y., Peng, H. and Yu, PS, 2020, октябрь. Улучшение графических детекторов мошенничества на основе нейронной сети против замаскированных мошенников. В материалах 29 -й Международной конференции ACM по управлению информацией и знаниями (CIKM). |
| [2] | Cai, L., Chen, Z., Luo, C., Gui, J., Ni, J., Li, D. and Chen, H., 2021, октябрь. Структурные височные графики нейронные сети для обнаружения аномалий в динамических графиках. В материалах 30 -й Международной конференции ACM по управлению информацией и знаниями (CIKM). |
| [3] | Xu, X., Yuruk, N., Feng, Z. and Schweiger, Ta, 2007, август. Сканирование: Структурная кластеризационная алгоритм для сетей. В материалах 13 -й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (KDD). |
| [4] | Kipf, TN и Welling, M., 2016. Вариационный график автоматические кодеры. Arxiv Preprint arxiv: 1611.07308. |
| [5] | Li, J., Dani, H., Hu, X. и Liu, H., 2017, август. Радар: остаточный анализ для обнаружения аномалий в приписанных сетях. В материалах Двадцать шестой Международной совместной конференции по искусственному интеллекту (IJCAI). |
| [6] | Peng, Z., Luo, M., Li, J., Liu, H. and Zheng, Q., 2018, июль. Аномальный: подход к моделированию для обнаружения аномалий в приписанных сетях. В материалах Двадцать седьмой международной совместной конференции по искусственному интеллекту (IJCAI). |
| [7] | Bandyopadhyay, S., Lokesh, N. и Murty, Mn, 2019, июль. Внедрение сети Outlier Swith для приписанных сетей. В материалах конференции AAAI по искусственному интеллекту (AAAI). |
| [8] | Ding, K., Li, J., Bhanushali, R. and Liu, H., 2019, май. Глубокое обнаружение аномалий в приписанных сетях. В материалах Международной конференции SIAM по добыче данных (SDM). |
| [9] | (1, 2) Bandyopadhyay, S., Vivek, SV и Murty, MN, 2020, январь. Устойчивые к выбросам неконтролируемые глубокие архитектуры для приписанного сетевого встраивания. В материалах Международной конференции по поиску веб -поиска и добычи данных (WSDM). |
| [10] | Fan, H., Zhang, F. and Li, Z., 2020, май. Anomalydae: двойной аутокодер для обнаружения аномалий в приписанных сетях. В материалах Международной конференции IEEE по акустике, обработке речи и сигнала (ICASSP). |
| [11] | Chen, Z., Liu, B., Wang, M., Dai, P., LV, J. and Bo, L., 2020, октябрь. Генеративное состязательное обнаружение аномалий сети. В материалах 29 -й Международной конференции ACM по управлению информацией и знаниями (CIKM). |
| [12] | Bandyopadhyay, S., Vishal Vivek, S. and Murty, MN, 2020. Интеграция встраивания сети и обнаружения выбросов сообщества с помощью описания многоклассного графика. Границы в искусственном интеллекте и приложениях, (FAIA). |
| [13] | Wang, X., Jin, B., Du, Y., Cui, P., Tan, Y. and Yang, Y., 2021. Нейронные сети с одним классом для обнаружения аномалий в приписанных сетях. Нейронные вычисления и приложения. |
| [14] | Liu, Y., Li, Z., Pan, S., Gong, C., Zhou, C. and Karypis, G., 2021. Обнаружение аномалий в приписываемых сетях посредством контрастного самоотверженного обучения. IEEE транзакции на нейронные сети и системы обучения (TNNLS). |
| [15] | Yuan, X., Zhou, N., Yu, S., Huang, H., Chen, Z. and Xia, F., 2021, декабрь. Обнаружение аномалий на основе структуры более высокого порядка в приписанных сетях. В 2021 году Международная конференция IEEE по большим данным (большие данные). |
| [16] | Xu, Z., Huang, X., Zhao, Y., Dong Y. и Li, J., 2022. Контрастное обнаружение аномалий сети с увеличением данных. В материалах 26-й конференции в Тихоокеанском регионе по обнаружению знаний и интеллектуальному анализу данных (PAKDD). |
| [17] | Roy, A., Shu, J., Li, J., Yang, C., Elshocht, O., Smeets, J. and Li, P., 2024. Gad-NR: обнаружение аномалии графика через реконструкцию соседства. В материалах 17 -й Международной конференции ACM по веб -поиску и интеллектуальному анализу данных (WSDM). |
| [18] | Wang Y., Wang X., He C., Chen X., Luo Z., Duan L., Zuo J., 2024. Контрастное обучение под руководством сообщества с реконструкцией аномалии для обнаружения аномалий в приписанных сетях. Системы баз данных для расширенных приложений (DASFAA). |