ดาวน์โหลด ecco - ดาวน์โหลดซอร์สโค้ด ecco

ecco

ซอร์สโค้ดอื่น ๆ

v0.1.2: hotfix

ดาวน์โหลด

ECCO เป็นไลบรารี Python สำหรับการสำรวจและอธิบายรูปแบบการประมวลผลภาษาธรรมชาติโดยใช้การสร้างภาพข้อมูลแบบโต้ตอบ

ECCO จัดหาอินเทอร์เฟซหลายอย่างเพื่อช่วยในการอธิบายและสัญชาตญาณของแบบจำลองภาษาที่ใช้หม้อแปลง อ่าน: อินเตอร์เฟสสำหรับการอธิบายโมเดลภาษาหม้อแปลง

ECCO ทำงานภายในสมุดบันทึก Jupyter มันถูกสร้างขึ้นบน Pytorch และ Transformers

ECCO ไม่เกี่ยวข้องกับรูปแบบการฝึกอบรมหรือการปรับแต่ง การสำรวจและทำความเข้าใจแบบจำลองที่ผ่านการฝึกอบรมมาก่อนเท่านั้น ปัจจุบันห้องสมุดเป็นโครงการวิจัยอัลฟ่า คุณยินดีที่จะมีส่วนร่วมเพื่อให้ดีขึ้น!

เอกสาร: ecco.readthedocs.io

คุณสมบัติ

รองรับโมเดลภาษาที่หลากหลาย (GPT2, Bert, Roberta, T5, T0 และอื่น ๆ ) [โน๊ตบุ๊คและคำแนะนำสำหรับการเพิ่มโมเดลเพิ่มเติม]
ความสามารถในการเพิ่ม โมเดลท้องถิ่น ของคุณเอง (หากพวกเขาอยู่บนพื้นฐานของการกอดโมเดล Pytorch)
การระบุแหล่งที่มาของคุณลักษณะ (IntegratedGradients, Saliiency, Inputxgradient, Deeplift, Deepliftshap, Guidedbackprop, GuidedGradcam, Deconvolution และ LRP ผ่าน Captum)
จับการเปิดใช้งานเซลล์ประสาท ในเลเยอร์ FFNN ในบล็อกหม้อแปลง
ระบุและ แสดงภาพรูปแบบการเปิดใช้งานของเซลล์ประสาท (ผ่านการแยกเมทริกซ์แบบไม่เป็นลบ)
ตรวจสอบการเปิดใช้งานเซลล์ประสาทผ่านการเปรียบเทียบพื้นที่เปิดใช้งานโดยใช้ SVCCA, PWCCA และ CKA (ดูวิดีโอนี้เกี่ยวกับการตรวจสอบเครือข่ายประสาทด้วย CCA)
การสร้างภาพข้อมูลสำหรับ:
- วิวัฒนาการของการประมวลผลโทเค็นผ่านเลเยอร์ของโมเดล (เลนส์ logit)
- โทเค็นเอาท์พุทผู้สมัครและความน่าจะเป็น (ในแต่ละเลเยอร์ในโมเดล)

การติดตั้ง

คุณสามารถติดตั้ง ecco ด้วย pip หรือกับ conda

ด้วย pip

pip install ecco

กับ Conda

conda install -c conda-forge ecco

ตัวอย่าง:

คุณสามารถเรียกใช้ตัวอย่างทั้งหมดเหล่านี้ได้จาก [Notebook] | [colab].

ความเชื่อมั่นของบทวิจารณ์ภาพยนตร์เรื่องนี้คืออะไร?

ใช้โมเดลภาษาขนาดใหญ่ (T5 ในกรณีนี้) เพื่อตรวจจับความเชื่อมั่นข้อความ นอกเหนือจากความเชื่อมั่นให้ดูโทเค็นรุ่นที่ทำลายข้อความเป็น (ซึ่งสามารถช่วยแก้ไขข้อบกพร่องบางส่วนของขอบ)

คำใดในการตรวจสอบนี้นำแบบจำลองเพื่อจัดประเภทความเชื่อมั่นเป็น "ลบ"

การระบุแหล่งที่มาของคุณลักษณะโดยใช้การไล่ระดับสีแบบบูรณาการช่วยให้คุณสำรวจการตัดสินใจแบบจำลอง ในกรณีนี้การสลับ "ความอ่อนแอ" เป็น "ความโน้มเอียง" ช่วยให้แบบจำลองสามารถเปลี่ยนการทำนายเป็น บวก ได้อย่างถูกต้อง

สำรวจความรู้ของโลกเกี่ยวกับโมเดล GPT โดยวางคำถามที่ว่างเปล่า

GPT2 รู้หรือไม่ว่าสนามบิน Heathrow อยู่ที่ไหน? ใช่. มันทำ

รูปแบบอื่น ๆ ของเมือง/คำใดที่พิจารณาเพิ่มเติมจากลอนดอน?

เห็นภาพโทเค็นเอาท์พุทของผู้สมัครและคะแนนความน่าจะเป็น

คำใดที่นำไปสู่ความคิดของลอนดอน?

รูปแบบใดที่รวบรวมความมั่นใจว่าลอนดอนเป็นคำตอบที่ถูกต้อง?

โมเดลเลือกลอนดอนโดยสร้างโทเค็นความน่าจะเป็นสูงสุด (จัดอันดับ #1) หลังจากเลเยอร์สุดท้ายในรุ่น แต่ละชั้นมีส่วนช่วยเพิ่มอันดับของ ลอนดอน มากแค่ไหน? นี่คือการสร้างภาพเลนส์ logit ที่ช่วยสำรวจกิจกรรมของเลเยอร์โมเดลที่แตกต่างกัน

รูปแบบในการเปิดใช้งาน Bert Neuron คืออะไรเมื่อประมวลผลชิ้นส่วนของข้อความ?

กลุ่มของเซลล์ประสาทในเบิร์ตมักจะยิงเพื่อตอบสนองต่อเครื่องหมายจุลภาคและเครื่องหมายวรรคตอนอื่น ๆ กลุ่มเซลล์ประสาทอื่น ๆ มีแนวโน้มที่จะยิงเพื่อตอบสนองต่อคำสรรพนาม ใช้การสร้างภาพข้อมูลนี้เพื่อแยกกิจกรรมของเซลล์ประสาทในแต่ละชั้น FFNN หรือในแบบจำลองทั้งหมด

อ่านกระดาษ:

ECCO: ไลบรารีโอเพนซอร์สสำหรับการอธิบายของแบบจำลองภาษาหม้อแปลงสำหรับการสาธิตระบบการคำนวณภาษาศาสตร์ (ACL), 2021

บทเรียน

วิดีโอ: ลองดูรูปแบบภาษาด้วย ECCO [โน๊ตบุ๊ค Colab]

วิธีการแนะนำ

อินเทอร์เฟซสำหรับการอธิบายโมเดลภาษาหม้อแปลง
การค้นหาคำที่จะพูด: การสร้างภาพข้อมูลสถานะที่ซ่อนอยู่สำหรับแบบจำลองภาษา

การอ้างอิง API

การอ้างอิง API และหน้าสถาปัตยกรรมอธิบายส่วนประกอบของ ECCO และวิธีการทำงานร่วมกัน

แกลเลอรี่และตัวอย่าง

โทเค็นที่คาดการณ์ไว้: ดูการทำนายของโมเดลสำหรับโทเค็นถัดไป (ด้วยคะแนนความน่าจะเป็น) มาดูกันว่าการทำนายพัฒนาผ่านเลเยอร์ของแบบจำลองอย่างไร [โน๊ตบุ๊ค] [colab]

การจัดอันดับข้ามเลเยอร์: หลังจากรุ่นเลือกโทเค็นเอาท์พุทให้มองย้อนกลับไปว่าแต่ละเลเยอร์จัดอันดับโทเค็นนั้นอย่างไร [โน๊ตบุ๊ค] [colab]

การทำนายเลเยอร์: เปรียบเทียบการจัดอันดับของโทเค็นหลายตัวเป็นผู้สมัครสำหรับตำแหน่งที่แน่นอนในลำดับ [โน๊ตบุ๊ค] [colab]

การอ้างเหตุผลหลัก: โทเค็นอินพุตแต่ละครั้งมีส่วนร่วมในการผลิตโทเค็นเอาท์พุทเท่าไหร่? [โน๊ตบุ๊ค] [colab]

การอ้างเหตุผลหลักโดยละเอียด: ดูค่าการอ้างถึงการป้อนข้อมูลที่แม่นยำยิ่งขึ้นโดยใช้มุมมองโดยละเอียด [โน๊ตบุ๊ค] [colab]

การวิเคราะห์การเปิดใช้งานของเซลล์ประสาท: ตรวจสอบรูปแบบพื้นฐานในการเปิดใช้งานเซลล์ประสาทโดยใช้การแยกเมทริกซ์ที่ไม่เป็นลบ [โน๊ตบุ๊ค] [colab]

ขอความช่วยเหลือ

มีปัญหา?

คณะกรรมการสนทนาอาจมีข้อมูลที่เกี่ยวข้อง ถ้าไม่คุณสามารถโพสต์คำถามของคุณที่นั่น
รายงานข้อบกพร่องที่ตัวติดตามปัญหาของ ECCO

bibtex สำหรับการอ้างอิง:

 @inproceedings { alammar-2021-ecco ,
    title = " Ecco: An Open Source Library for the Explainability of Transformer Language Models " ,
    author = " Alammar, J " ,
    booktitle = " Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations " ,
    year = " 2021 " ,
    publisher = " Association for Computational Linguistics " ,
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.1.2: hotfix
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-15
ขนาด 1.12MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด