скачать pygod - скачать исходный код pygod

pygod

Питон

v1.1.0

Скачать

тестирование

Pygod - это библиотека Python для обнаружения выбросов графика (обнаружение аномалии). Эта захватывающая, но сложная область имеет много ключевых приложений, например, обнаружение подозрительных видов деятельности в социальных сетях [1] и систем безопасности [2].

Pygod включает в себя 10+ алгоритмов обнаружения выбросов графиков. Для согласованности и доступности Pygod разрабатывается поверх геометрического (PYG) и Pytorch Pytorch и следует за дизайном API PYOD. См. Примеры ниже для обнаружения выбросов с Pygod в 5 линиях!

Pygod представлен для :

Унифицированные API, подробную документацию и интерактивные примеры в различных алгоритмах на основе графика.
Комплексное покрытие 10+ детекторов графиков.
Полная поддержка обнаружений на нескольких уровнях , таких как задачи на уровне узлов, крае и график.
Масштабируемая конструкция для обработки больших графиков с помощью мини-партии и отбора проб.
Обработка данных оптимизирует с помощью PYG , совместимой с объектами данных PYG.

Обнаружение выбросов с использованием Pygod с 5 строками кода :

 # train a dominant detector
from pygod . detector import DOMINANT

model = DOMINANT ( num_layers = 4 , epoch = 20 )  # hyperparameters can be set here
model . fit ( train_data )  # input data is a PyG data object

# get outlier scores on the training data (transductive setting)
score = model . decision_score_

# predict labels and scores on the testing data (inductive setting)
pred , score = model . predict ( test_data , return_score = True )

Цитируя Pygod :

Наша бумага программного обеспечения и эталонная бумага общедоступны. Если вы используете Pygod или Bond в научной публикации, мы будем признателен о ссылках к следующим документам:

 @Article {JMLR: V25: 23-0963,
  Автор = {Кей Лю и Ингтонг Доу и Сюэтинг Дин и Сиян Ху и Руинг Чжан и Хао Пэн и Личао Сан и Филип С. Ю.,
  title = {{pygod}: a {python} библиотека для обнаружения выбросов графика},
  Journal = {журнал исследований машинного обучения},
  Год = {2024},
  том = {25},
  number = {141},
  pages = {1--9},
  url = {http://jmlr.org/papers/v25/23-0963.html}
}
@inproceedings {neurips2022_acc1ec4a,
 Автор = {Лю, Кей и Доу, Йинтонг и Чжао, Юэ и Дин, Сюиинг и Ху, Сиян и Чжан, Руитонг и Дин, Кайз и Чен, Кани и Пенг, Хао и Шу, Кай и Сан, Личао и Ли, Джундонг и Чен, Джордж Х и Чиа, Зихао и Иу, Фили, Фили, Фили, Фили и Фи.
 booktitle = {Advances в системах обработки нейронной информации},
 Editor = {S. Койехо и С. Мохамед и А. Агарвал и Д. Белгрейв и К. Чо и А. О},
 pages = {27021--27035},
 Publisher = {Curran Associates, Inc.},
 title = {{bond}: сравнительный анализ неконтролируемого обнаружения узлов выбросов на статических приписываемых графах},
 url = {https://proceedings.neurips.cc/paper_files/paper/2022/file/acc1ec4a9c780006c9aafd595104816b-paper-datasets_and_benchmarks.pdf},
 том = {35},
 Год = {2022}
}

или:

 Liu, K., Dou, Y., Ding, X., Hu, X., Zhang, R., Peng, H., Sun, L. и Yu, PS, 2024. Pygod: библиотека Python для обнаружения выбросов графика. Журнал исследований машинного обучения, 25 (141), с.1-9.
Liu, K., Dou, Y., Zhao, Y., Ding, X., Hu, X., Zhang, R., Ding, K., Chen, C., Peng, H., Shu, K., Sun, L., Li, J., Chen, GH, Jia, Z., и Yu, PS, 2022. Бонд: Benchmarking Unsupring Outlier Node. Достижения в системах обработки нейронной информации, 35, с.27021-27035.

Установка

Примечание на установке PYG и Pytorch : PYGOD зависит от TORCH и TORCH_GEOMETRIC (включая его необязательные зависимости). Чтобы упростить установку, Pygod не устанавливает эти библиотеки для вас. Пожалуйста, установите их по приведенным выше ссылкам для запуска Pygod:

TORCH> = 2,0,0
TORCH_GEOMETRIC> = 2.3.0

Рекомендуется использовать PIP для установки. Пожалуйста, убедитесь, что последняя версия установлена, так как Pygod часто обновляется:

pip install pygod            # normal install
pip install --upgrade pygod  # or update if needed

В качестве альтернативы, вы можете клонировать и запустить файл setup.py:

git clone https://github.com/pygod-team/pygod.git
cd pygod
pip install .

Требуемые зависимости :

Python> = 3,8
Numpy> = 1,24,3
Scikit-learn> = 1.2.2
Scipy> = 1.10.1
Networkx> = 3.1

Быстрый старт обнаружения выбросов с Pygod

«Введение в блиц» демонстрирует основной API Pygod с использованием доминирующего детектора. Отмечено, что API во всех других алгоритмах является последовательным/похожим .

API CheatSheet & Research

Полная ссылка на API: (https://docs.pygod.org). Чит -лист API для всех детекторов:

FIT (DATA) : подключить детектор с данными поезда.
Прогнозируйте (данные) : прогнозируйте тестовые данные (данные поезда, если не предоставлены) с использованием подходящего детектора.

Ключевые атрибуты подходящего детектора:

DESCORE_SCORE_ : выбросы показателей входных данных. Выбросы, как правило, имеют более высокие оценки.
Label_ : двоичные метки входных данных. 0 означает Inliers и 1 для выбросов.
Порог_ : определенный порог для бинарной классификации. Оценки выше порога являются выбросами.

Ввод PYGOD : Пожалуйста, пропустите объект данных PYG. См. Примеры обработки данных PYG.

Реализованные алгоритмы

Аббр	Год	Магистраль	Выборка	Рефери
Сканирование	2007	Кластеризация	Нет	[3]
Газо	2016	GNN+AE	Да	[4]
Радар	2017	Млн	Нет	[5]
Аномальный	2018	Млн	Нет	[6]
ОДИН	2019	Млн	Нет	[7]
Доминирующий	2019	GNN+AE	Да	[8]
СДЕЛАННЫЙ	2020	MLP+AE	Да	[9]
Адоне	2020	MLP+AE	Да	[9]
Anomalydae	2020	GNN+AE	Да	[10]
Гаан	2020	Ган	Да	[11]
Dmgd	2020	GNN+AE	Да	[12]
Ocgnn	2021	Г -н	Да	[13]
Кола	2021	GNN+AE+SSL	Да	[14]
ГИД	2021	GNN+AE	Да	[15]
Конад	2022	GNN+AE+SSL	Да	[16]
ГАДНР	2024	GNN+AE	Да	[17]
Карта	2024	GNN+SSL+AE	Да	[18]

Как внести свой вклад

Вы можете внести свой вклад в этот захватывающий проект:

См. Руководство по взносу для получения дополнительной информации.

Pygod Team

Pygod - отличная команда исследователей из UIC, IIT, Buaa, ASU и CMU. Наши основные члены команды включают:

Кей Лю (UIC), Yingtong Dou (UIC), Юэ Чжао (CMU), Xueying Ding (CMU), Xiyang Hu (CMU), Ruitong Zhang (Buaa), Kaize Ding (Asu), Canyu Chen (IIT),

Обратитесь к нам, отправив отчет о выпуске или отправьте электронное письмо на [email protected].

Ссылка

[1]	Dou, Y., Liu, Z., Sun, L., Deng, Y., Peng, H. and Yu, PS, 2020, октябрь. Улучшение графических детекторов мошенничества на основе нейронной сети против замаскированных мошенников. В материалах 29 -й Международной конференции ACM по управлению информацией и знаниями (CIKM).

[2]	Cai, L., Chen, Z., Luo, C., Gui, J., Ni, J., Li, D. and Chen, H., 2021, октябрь. Структурные височные графики нейронные сети для обнаружения аномалий в динамических графиках. В материалах 30 -й Международной конференции ACM по управлению информацией и знаниями (CIKM).

[3]	Xu, X., Yuruk, N., Feng, Z. and Schweiger, Ta, 2007, август. Сканирование: Структурная кластеризационная алгоритм для сетей. В материалах 13 -й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (KDD).

[4]	Kipf, TN и Welling, M., 2016. Вариационный график автоматические кодеры. Arxiv Preprint arxiv: 1611.07308.

[5]	Li, J., Dani, H., Hu, X. и Liu, H., 2017, август. Радар: остаточный анализ для обнаружения аномалий в приписанных сетях. В материалах Двадцать шестой Международной совместной конференции по искусственному интеллекту (IJCAI).

[6]	Peng, Z., Luo, M., Li, J., Liu, H. and Zheng, Q., 2018, июль. Аномальный: подход к моделированию для обнаружения аномалий в приписанных сетях. В материалах Двадцать седьмой международной совместной конференции по искусственному интеллекту (IJCAI).

[7]	Bandyopadhyay, S., Lokesh, N. и Murty, Mn, 2019, июль. Внедрение сети Outlier Swith для приписанных сетей. В материалах конференции AAAI по искусственному интеллекту (AAAI).

[8]	Ding, K., Li, J., Bhanushali, R. and Liu, H., 2019, май. Глубокое обнаружение аномалий в приписанных сетях. В материалах Международной конференции SIAM по добыче данных (SDM).

[9]	(1, 2) Bandyopadhyay, S., Vivek, SV и Murty, MN, 2020, январь. Устойчивые к выбросам неконтролируемые глубокие архитектуры для приписанного сетевого встраивания. В материалах Международной конференции по поиску веб -поиска и добычи данных (WSDM).

[10]	Fan, H., Zhang, F. and Li, Z., 2020, май. Anomalydae: двойной аутокодер для обнаружения аномалий в приписанных сетях. В материалах Международной конференции IEEE по акустике, обработке речи и сигнала (ICASSP).

[11]	Chen, Z., Liu, B., Wang, M., Dai, P., LV, J. and Bo, L., 2020, октябрь. Генеративное состязательное обнаружение аномалий сети. В материалах 29 -й Международной конференции ACM по управлению информацией и знаниями (CIKM).

[12]	Bandyopadhyay, S., Vishal Vivek, S. and Murty, MN, 2020. Интеграция встраивания сети и обнаружения выбросов сообщества с помощью описания многоклассного графика. Границы в искусственном интеллекте и приложениях, (FAIA).

[13]	Wang, X., Jin, B., Du, Y., Cui, P., Tan, Y. and Yang, Y., 2021. Нейронные сети с одним классом для обнаружения аномалий в приписанных сетях. Нейронные вычисления и приложения.

[14]	Liu, Y., Li, Z., Pan, S., Gong, C., Zhou, C. and Karypis, G., 2021. Обнаружение аномалий в приписываемых сетях посредством контрастного самоотверженного обучения. IEEE транзакции на нейронные сети и системы обучения (TNNLS).

[15]	Yuan, X., Zhou, N., Yu, S., Huang, H., Chen, Z. and Xia, F., 2021, декабрь. Обнаружение аномалий на основе структуры более высокого порядка в приписанных сетях. В 2021 году Международная конференция IEEE по большим данным (большие данные).

[16]	Xu, Z., Huang, X., Zhao, Y., Dong Y. и Li, J., 2022. Контрастное обнаружение аномалий сети с увеличением данных. В материалах 26-й конференции в Тихоокеанском регионе по обнаружению знаний и интеллектуальному анализу данных (PAKDD).

[17]	Roy, A., Shu, J., Li, J., Yang, C., Elshocht, O., Smeets, J. and Li, P., 2024. Gad-NR: обнаружение аномалии графика через реконструкцию соседства. В материалах 17 -й Международной конференции ACM по веб -поиску и интеллектуальному анализу данных (WSDM).

[18]	Wang Y., Wang X., He C., Chen X., Luo Z., Duan L., Zuo J., 2024. Контрастное обучение под руководством сообщества с реконструкцией аномалии для обнаружения аномалий в приписанных сетях. Системы баз данных для расширенных приложений (DASFAA).

Расширять

Дополнительная информация