تنفيذ النص GCN في ورقتنا:
ليانغ ياو ، تشنغشنغ ماو ، يوان لوو. "الرسم البياني الشبكات التلافيفية لتصنيف النص." في مؤتمر AAAI 33 حول الذكاء الاصطناعي (AAAI-19) ، 7370-7377
بيثون 2.7 أو 3.6
TensorFlow> = 1.4.0
تشغيل python remove_words.py 20ng
Run python build_graph.py 20ng
Run python train.py 20ng
قم بتغيير 20ng في خطوط الأوامر المذكورة أعلاه إلى R8 و R52 و ohsumed و mr عند إنتاج نتائج لمجموعات البيانات الأخرى.
/data/20ng.txt يشير إلى أسماء المستندات ، تقسيم التدريب/الاختبار ، ملصقات المستندات. كل سطر هو لمستند.
/data/corpus/20ng.txt يحتوي على نص خام لكل وثيقة ، كل سطر مخصص للخط المقابل في /data/20ng.txt
يعد prepare_data.py مثالًا لإعداد البيانات الخاصة بك ، لاحظ أنه تتم إزالة' n 'في المستندات أو الجمل الخاصة بك.
إصدار استقرائي من Text GCN هو fast_text_gcn ، حيث لا يتم تضمين مستندات الاختبار في عملية التدريب.