هذا هو الكود المصدري لورقة WSDM'23 "Good-D: على الرسم البياني غير الخاضع للإشراف خارج التوزيع".
يتطلب هذا الرمز ما يلي:
فقط قم بتشغيل البرنامج النصي المقابل للتجربة ومجموعة البيانات التي تريدها. على سبيل المثال:
bash script/oodd_BZR+COX2.sh
bash script/ad_PROTEINS_full.sh
يتم توفير إحصاء كل زوج من مجموعة البيانات في معيارنا على النحو التالي.
| مجموعة بيانات المعرف | مجموعة بيانات OOD | |||||||
| لا. | اسم | # الرسم البياني (قطار/اختبار) | # العقدة (متوسط) | # حافة (متوسط) | اسم | # الرسم البياني (امتحان) | # العقدة (متوسط) | # حافة (متوسط) |
| 1 | BZR | 364/41 | 35.8 | 38.4 | COX2 | 41 | 41.2 | 43.5 |
| 2 | PTC-MR | 309/35 | 14.3 | 14.7 | موتاج | 35 | 17.9 | 19.8 |
| 3 | الإيدز | 1800/200 | 15.7 | 16.2 | DHFR | 200 | 42.4 | 44.5 |
| 4 | الإنزيمات | 540/60 | 32.6 | 62.1 | بروتين | 60 | 39.1 | 72.8 |
| 5 | IMDB-B | 1،350/150 | 19.8 | 96.5 | imdb-m | 150 | 13.0 | 65.9 |
| 6 | Tox21 | 7،047/784 | 18.6 | 19.3 | سايدر | 784 | 33.6 | 35.4 |
| 7 | Freesolv | 577/65 | 8.7 | 8.4 | توكساست | 65 | 18.8 | 19.3 |
| 8 | BBBP | 1،835/204 | 24.1 | 26.0 | باس | 204 | 34.1 | 36.9 |
| 9 | كلينتوكس | 1،329/148 | 26.2 | 27.9 | Lipo | 148 | 27.0 | 29.5 |
| 10 | esol | 1،015/113 | 13.3 | 13.7 | موف | 113 | 24.2 | 26.3 |
يتم توفير إحصاء كل مجموعة بيانات في تجارب الكشف عن الشذوذ على النحو التالي.
| مجموعة البيانات | # الرسم البياني (قطار/اختبار) | # العقدة (متوسط) | # حافة (متوسط) |
| البروتينات-ممتلئة | 360/223 | 39.1 | 72.8 |
| الإنزيمات | 400/120 | 32.6 | 62.1 |
| الإيدز | 1280/400 | 15.7 | 16.2 |
| DHFR | 368/152 | 42.4 | 44.5 |
| BZR | 69/81 | 35.8 | 38.4 |
| COX2 | 81/94 | 41.2 | 43.5 |
| DD | 390/236 | 284.3 | 715.7 |
| NCI1 | 1646/822 | 29.8 | 32.3 |
| IMDB-B | 400/200 | 19.8 | 96.5 |
| reddit-b | 800/400 | 429.6 | 497.8 |
| collab | 1920/1000 | 74.5 | 2457.8 |
| HSE | 423/267 | 16.9 | 17.2 |
| MMP | 6170/238 | 17.6 | 18.0 |
| p53 | 8088/269 | 17.9 | 18.3 |
| PPAR-GAMMA | 219/267 | 17.4 | 17.7 |
من أجل الكفاءة ، نضع أبعاد الترميز الهيكلي
نقوم بإجراء التجارب على خادم Linux مع وحدة المعالجة المركزية Intel Xeon Gold 6226R وقيمين Tesla V100S. نحن ننفذ طريقتنا مع Pytorch 1.11.0 و Pytorch الهندسة 2.0.4.
إذا قارنت مع أو بناء أو استخدام جوانب من هذا العمل ، يرجى الاستشهاد بما يلي:
@inproceedings{liu2023goodd,
title={GOOD-D: On Unsupervised Graph Out-Of-Distribution Detection},
author={Liu, Yixin and Ding, Kaize and Liu, Huan and Pan, Shirui},
booktitle={Proceedings of the Sixteenth ACM International Conference on Web Search and Data Mining},
year={2023}
}