ดาวน์โหลด CogDL - ดาวน์โหลดซอร์สโค้ด CogDL

CogDL

หลาม

v0.6

ดาวน์โหลด

หน้าแรก กระดาษ | เอกสาร ฟอรัมสนทนา | ชุดข้อมูล |中文

COGDL เป็นชุดเครื่องมือการเรียนรู้เชิงลึกของกราฟที่ช่วยให้นักวิจัยและนักพัฒนาสามารถฝึกอบรมและเปรียบเทียบแบบจำลองพื้นฐานหรือแบบจำลองที่กำหนดเองได้อย่างง่ายดายสำหรับการจำแนกโหนดการจำแนกกราฟและงานที่สำคัญอื่น ๆ ในโดเมนกราฟ

เราสรุปการมีส่วนร่วมของ COGDL ดังนี้:

ประสิทธิภาพ : COGDL ใช้ผู้ให้บริการที่ปรับให้เหมาะสมเพื่อเพิ่มความเร็วในการฝึกอบรมและบันทึกหน่วยความจำ GPU ของรุ่น GNN
ความสะดวกในการใช้งาน : COGDL ให้ API ที่ใช้งานง่ายสำหรับการทดลองกับรุ่นและชุดข้อมูลที่กำหนดโดยใช้การค้นหาพารามิเตอร์ไฮเปอร์
Extensibility : การออกแบบ COGDL ทำให้ง่ายต่อการใช้รุ่น GNN กับสถานการณ์ใหม่ตามกรอบของเรา

❗ข่าว

กระดาษ COGDL ได้รับการยอมรับจาก www 2023 พบเราที่ www 2023! นอกจากนี้เรายังเปิด ตัวรีลีส V0.6 ใหม่ซึ่งเพิ่มตัวอย่างเพิ่มเติมของการเรียนรู้ที่ดูแลตนเองของกราฟรวมถึง graphmae, graphmae2 และ BGRL
มีหลักสูตร GNN ฟรีที่จัดทำโดยทีมงาน COGDL ที่ลิงค์นี้ นอกจากนี้เรายังมีฟอรัมการสนทนาสำหรับผู้ใช้ภาษาจีน
การเปิดตัว V0.5.3 ใหม่รองรับการฝึกอบรมแบบผสมผสานโดยการตั้งค่า textit {fp16 = true} และให้ตัวอย่างพื้นฐานที่เขียนโดย Jittor นอกจากนี้ยังอัปเดตการสอนในเอกสารแก้ไขการดาวน์โหลดลิงก์ของชุดข้อมูลบางชุดและแก้ไขข้อบกพร่องที่อาจเกิดขึ้นของผู้ให้บริการ

ประวัติข่าว

รีลีส V0.5.2 ใหม่เพิ่มตัวอย่าง GNN สำหรับผลิตภัณฑ์ OGBN และอัปเดตชุดข้อมูล GEOM นอกจากนี้ยังแก้ไขข้อบกพร่องที่อาจเกิดขึ้นบางอย่างรวมถึงการตั้งค่าอุปกรณ์โดยใช้ CPU สำหรับการอนุมาน ฯลฯ
รีลีส V0.5.1 ใหม่เพิ่มตัวดำเนินการที่รวดเร็วรวมถึง SPMM (เวอร์ชัน CPU) และ scatter_max (รุ่น CUDA) นอกจากนี้ยังเพิ่มชุดข้อมูลจำนวนมากสำหรับการจำแนกโหนดซึ่งสามารถพบได้ในลิงค์นี้ -
V0.5.0 รีลีส ใหม่ออกแบบและดำเนินการฝึกอบรมแบบครบวงจรสำหรับ GNN แนะนำ DataWrapper เพื่อช่วยเตรียมข้อมูลการฝึกอบรม/การตรวจสอบ/ทดสอบและ ModelWrapper เพื่อกำหนดขั้นตอนการฝึกอบรม/การตรวจสอบ/ทดสอบ -
การเปิดตัว V0.4.1 ใหม่เพิ่มการใช้งาน GNNs ลึกและงานแนะนำ นอกจากนี้ยังรองรับท่อใหม่สำหรับการสร้าง embeddings และคำแนะนำ ยินดีต้อนรับสู่เข้าร่วมการสอนของเราใน KDD 2021 เวลา 10.30 น. - 12:00 น., 14 สิงหาคม (เวลาสิงคโปร์) รายละเอียดเพิ่มเติมสามารถพบได้ใน https://kdd2021graph.github.io/ -
รีลีส V0.4.0 ใหม่ refactors การจัดเก็บข้อมูล (จาก Data ไปยัง Graph ) และให้ผู้ให้บริการที่รวดเร็วยิ่งขึ้นเพื่อเพิ่มความเร็วในการฝึกอบรม GNN นอกจากนี้ยังรวมถึงวิธีการเรียนรู้ที่ดูแลตนเองมากมายในกราฟ BTW เราดีใจที่ได้ประกาศว่าเราจะให้การสอนเกี่ยวกับ KDD 2021 ในเดือนสิงหาคม โปรดดูลิงค์นี้สำหรับรายละเอียดเพิ่มเติม -
COGDL รองรับรุ่น GNN ที่มีส่วนผสมของผู้เชี่ยวชาญ (MOE) คุณสามารถติดตั้ง fastmoe และลอง moe gcn ใน cogdl ได้ทันที!
การเปิดตัว V0.3.0 ใหม่ให้บริการ SPMM ที่รวดเร็วเพื่อเพิ่มความเร็วในการฝึกอบรม GNN นอกจากนี้เรายังเปิดตัว COGDL Paper เวอร์ชันแรกใน Arxiv คุณสามารถเข้าร่วม Slack สำหรับการสนทนาของเรา -
การเปิดตัว V0.2.0 ใหม่รวมถึง experiment ใช้งานง่ายและ API pipeline สำหรับการทดลองและแอปพลิเคชันทั้งหมด API experiment รองรับคุณสมบัติ AUTOML ของการค้นหาพารามิเตอร์ไฮเปอร์ การเปิดตัวครั้งนี้ยังให้ OAGBert API สำหรับการอนุมานแบบจำลอง ( OAGBert ได้รับการฝึกฝนเกี่ยวกับคลังวิชาการขนาดใหญ่โดยห้องปฏิบัติการของเรา) คุณสมบัติและแบบจำลองบางอย่างถูกเพิ่มโดยชุมชนโอเพ่นซอร์ส (ขอบคุณผู้มีส่วนร่วมทุกคน?)
การเปิดตัว V0.1.2 ใหม่รวมถึงงานการฝึกอบรมล่วงหน้าตัวอย่างมากมายชุดข้อมูล OGB วิธีการฝังกราฟความรู้บางอย่างและโมเดลเครือข่ายประสาทกราฟบางรุ่น ความครอบคลุมของ COGDL เพิ่มขึ้นเป็น 80% API ใหม่บางตัวเช่น Trainer และ Sampler ได้รับการพัฒนาและถูกทดสอบ
การเปิดตัว V0.1.1 ใหม่รวมถึงภารกิจการทำนายความรู้ลิงก์ความรู้หลายรุ่นที่ทันสมัยและการสนับสนุน optuna นอกจากนี้เรายังมีโพสต์ WeChat จีนเกี่ยวกับการเปิดตัว COGDL

เริ่มต้น

ข้อกำหนดและการติดตั้ง

รุ่น Python> = 3.7
รุ่น Pytorch> = 1.7.1

โปรดทำตามคำแนะนำที่นี่เพื่อติดตั้ง pytorch (https://github.com/pytorch/pytorch#installation)

เมื่อติดตั้ง Pytorch แล้ว COGDL สามารถติดตั้งได้โดยใช้ PIP ดังนี้:

pip install cogdl

ติดตั้งจากแหล่งที่มาผ่าน:

pip install git+https://github.com/thudm/cogdl.git

หรือโคลนที่เก็บและติดตั้งด้วยคำสั่งต่อไปนี้:

git clone [email protected]:THUDM/cogdl.git
cd cogdl
pip install -e .

การใช้งาน

การใช้ API

คุณสามารถทำการทดลองทุกชนิดผ่าน COGDL API โดยเฉพาะ experiment คุณยังสามารถใช้ชุดข้อมูลและรุ่นของคุณเองสำหรับการทดลอง ตัวอย่าง QuickStart สามารถพบได้ใน quick_start.py ตัวอย่างเพิ่มเติมมีให้ในตัวอย่าง/

 from cogdl import experiment

# basic usage
experiment ( dataset = "cora" , model = "gcn" )

# set other hyper-parameters
experiment ( dataset = "cora" , model = "gcn" , hidden_size = 32 , epochs = 200 )

# run over multiple models on different seeds
experiment ( dataset = "cora" , model = [ "gcn" , "gat" ], seed = [ 1 , 2 ])

# automl usage
def search_space ( trial ):
    return {
        "lr" : trial . suggest_categorical ( "lr" , [ 1e-3 , 5e-3 , 1e-2 ]),
        "hidden_size" : trial . suggest_categorical ( "hidden_size" , [ 32 , 64 , 128 ]),
        "dropout" : trial . suggest_uniform ( "dropout" , 0.5 , 0.8 ),
    }

experiment ( dataset = "cora" , model = "gcn" , seed = [ 1 , 2 ], search_space = search_space )

การใช้บรรทัดคำสั่ง

นอกจากนี้คุณยังสามารถใช้ python scripts/train.py --dataset example_dataset --model example_model เพื่อเรียกใช้ EXAMPLE_MODEL ON EXAMPLE_DATA

-Dataset ชื่อชุดข้อมูลที่จะเรียกใช้สามารถเป็นรายการชุดข้อมูลที่มีพื้นที่เช่น cora citeseer ชุดข้อมูลที่รองรับ ได้แก่ 'Cora', 'Citeseer', 'Pumbed', 'PPI', 'Wikipedia', 'BlogCatalog', 'Flickr' ชุดข้อมูลเพิ่มเติมสามารถพบได้ใน COGDL/ชุดข้อมูล
-โมเดลชื่อรุ่นที่จะเรียกใช้สามารถเป็นรายการของรุ่นเช่น gcn gat รุ่นที่รองรับ ได้แก่ 'GCN', 'GAT', 'กราฟ', 'DeepWalk', 'Node2Vec', 'Hope', 'Grarep', 'Netmf', 'Netsmf', 'Hope' สามารถพบโมเดลเพิ่มเติมได้ใน COGDL/รุ่น

ตัวอย่างเช่นหากคุณต้องการเรียกใช้ GCN และ GAT บนชุดข้อมูล CORA ด้วย 5 เมล็ดที่แตกต่างกัน:

python scripts/train.py --dataset cora --model gcn gat --seed 0 1 2 3 4

ผลลัพธ์ที่คาดหวัง:

แตกต่างกันไป	test_acc	val_acc
('Cora', 'GCN')	0.8050 ± 0.0047	0.7940 ± 0.0063
('Cora', 'Gat')	0.8234 ± 0.0042	0.8088 ± 0.0016

หากคุณมีปัญหาใด ๆ ที่จะทำให้สิ่งต่าง ๆ ทำงานในขั้นตอนข้างต้นอย่าลังเลที่จะเปิดปัญหา คุณสามารถคาดหวังการตอบกลับภายใน 24 ชั่วโมง

❗คำถามที่พบบ่อย

จะมีส่วนร่วมใน COGDL ได้อย่างไร?

หากคุณมีอัลกอริทึมที่มีประสิทธิภาพและยินดีที่จะนำไปใช้ในชุดเครื่องมือของเราเพื่อช่วยเหลือผู้คนมากขึ้นคุณสามารถเปิดปัญหาก่อนจากนั้นสร้างคำขอดึงข้อมูลรายละเอียดสามารถพบได้ที่นี่

ก่อนที่จะทำการปรับเปลี่ยนของคุณโปรด pre-commit install ล่วงหน้าก่อนเพื่อตั้งค่า Git Hook สำหรับการตรวจสอบรูปแบบรหัสและสไตล์โดยใช้ black และ flake8 จากนั้น pre-commit จะทำงานโดยอัตโนมัติใน git commit ! ข้อมูลรายละเอียดของ pre-commit สามารถพบได้ที่นี่

จะเปิดใช้งานการฝึกอบรม GNN ได้อย่างรวดเร็วได้อย่างไร?

COGDL ให้บริการการคูณเมทริกซ์เมทริกซ์-เมทริกซ์ที่เร็วที่เรียกว่า [ge-spmm] (https://arxiv.org/abs/2007.03179) เพื่อเพิ่มความเร็วในการฝึกอบรมรุ่น GNN บน GPU คุณลักษณะจะถูกใช้โดยอัตโนมัติหากพร้อมใช้งาน โปรดทราบว่าคุณลักษณะนี้ยังอยู่ในการทดสอบและอาจไม่ทำงานภายใต้ CUDA บางรุ่น

วิธีเรียกใช้การทดลองแบบขนานกับ GPU ในหลายรุ่น?

หากคุณต้องการเรียกใช้การทดลองแบบขนานบนเซิร์ฟเวอร์ของคุณด้วย GPU หลายตัวในหลายรุ่น GCN และ GAT บนชุดข้อมูล CORA:

$ python scripts/train.py --dataset cora --model gcn gat --hidden-size 64 --devices 0 1 --seed 0 1 2 3 4

ผลลัพธ์ที่คาดหวัง:

แตกต่างกันไป	ACC
('Cora', 'GCN')	0.8236 ± 0.0033
('Cora', 'Gat')	0.8262 ± 0.0032

วิธีใช้โมเดลจากไลบรารีอื่น ๆ ?

หากคุณคุ้นเคยกับไลบรารีกราฟยอดนิยมอื่น ๆ คุณสามารถใช้โมเดลของคุณเองใน COGDL โดยใช้โมดูลจาก Pytorch Geometric (PYG) สำหรับการติดตั้ง PYG คุณสามารถทำตามคำแนะนำจาก PYG (https://github.com/rusty1s/pytorch_geometric/#installation) สำหรับการใช้งานอย่างรวดเร็วของวิธีการใช้เลเยอร์ของ PYG คุณสามารถค้นหาตัวอย่างใน [ตัวอย่าง/pyg] (https://github.com/thudm/cogdl/tree/master/examples/pyg/)

วิธีทำคำขอดึงที่ประสบความสำเร็จด้วยการทดสอบหน่วย

เพื่อให้มีคำขอดึงที่ประสบความสำเร็จคุณต้องมีอย่างน้อย (1) การใช้งานโมเดลของคุณและ (2) การทดสอบหน่วย

คุณอาจสับสนว่าทำไมคำขอดึงของคุณถูกปฏิเสธเนื่องจาก 'ความครอบคลุมลดลง ... ' ปัญหาแม้ว่าโมเดลของคุณจะทำงานได้ดีในท้องถิ่น นี่เป็นเพราะคุณยังไม่ได้รวมการทดสอบหน่วยซึ่งจะวิ่งผ่านรหัสพิเศษที่คุณเพิ่ม บริการ Travis CI ที่ใช้โดย GitHub ดำเนินการทดสอบหน่วยทั้งหมดในรหัสที่คุณทำและตรวจสอบจำนวนบรรทัดของรหัสที่ได้รับการตรวจสอบโดยการทดสอบหน่วยและหากส่วนสำคัญของรหัสของคุณยังไม่ได้รับการตรวจสอบ (ความครอบคลุมไม่เพียงพอ) คำขอดึงจะถูกปฏิเสธ

แล้วคุณจะทำการทดสอบหน่วยได้อย่างไร?

สมมติว่าคุณใช้โมเดล GNN ใน models/nn/abcgnn.py ที่ทำงานในการจำแนกโหนด จากนั้นคุณต้องเพิ่มการทดสอบหน่วยภายใน tests/tasks/test_node_classification.py (หรืองานที่เกี่ยวข้องกับแบบจำลองของคุณ)
ในการเพิ่มการทดสอบหน่วยคุณเพียงเพิ่มฟังก์ชั่น test_abcgnn_cora () (เพียงทำตามรูปแบบของการทดสอบหน่วยอื่น ๆ ที่มีอยู่แล้วในสคริปต์) เติมด้วยอาร์กิวเมนต์ที่จำเป็นและบรรทัดสุดท้ายในฟังก์ชัน 'ยืนยัน 0 <= ret ["ACC"] <= 1'
หลังจากแก้ไข tests/tasks/test_node_classification.py ให้พร้อมกับ models/nn/abcgnn.py และคำขอดึงของคุณควรผ่าน

ทีม COGDL

Cogdl ได้รับการพัฒนาและดูแลโดย Tsinghua, Zju, Damo Academy และ Zhipu.ai

ทีมพัฒนาหลักสามารถติดต่อได้ที่ [email protected]

อ้างถึง cogdl

โปรดอ้างอิงบทความของเราหากคุณพบว่ารหัสหรือผลลัพธ์ของเรามีประโยชน์สำหรับการวิจัยของคุณ:

 @inproceedings{cen2023cogdl,
    title={CogDL: A Comprehensive Library for Graph Deep Learning},
    author={Yukuo Cen and Zhenyu Hou and Yan Wang and Qibin Chen and Yizhen Luo and Zhongming Yu and Hengrui Zhang and Xingcheng Yao and Aohan Zeng and Shiguang Guo and Yuxiao Dong and Yang Yang and Peng Zhang and Guohao Dai and Yu Wang and Chang Zhou and Hongxia Yang and Jie Tang},
    booktitle={Proceedings of the ACM Web Conference 2023 (WWW'23)},
    year={2023}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.6
ประเภท หลาม
เวลาอัปเดต 2025-07-12
ขนาด 1.85MB
มาจาก Github

แอปที่เกี่ยวข้อง

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

2024-11-27
datamule python

2024-11-08
แพลตฟอร์มการแสดงภาพข้อมูล smartchart เวอร์ชัน 6.9

2024-11-27
เครื่องมือทดสอบโหลดตั๊กแตน v2.32.0

2024-11-27

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

หลาม

24.10.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด