ดาวน์โหลด OpenPrompt - OpenPrompt Source Source Download

OpenPrompt

ซอร์สโค้ดอื่น ๆ

v1.0.0

ดาวน์โหลด

เฟรมเวิร์กโอเพนซอร์ซสำหรับการเรียนรู้ล่วงหน้า

ภาพรวม•การติดตั้ง•วิธีการใช้•เอกสาร•กระดาษ•การอ้างอิง•ประสิทธิภาพ•

มีอะไรใหม่?

❗เมษายน 2023: $ color {red} { normalsize { textbf {ต้องการสร้างแชท ai ของคุณ?}}} $ เรากำลังปล่อย Ultachat ใช้ OpenPrompt และ Ultachat เพื่อดำเนินการปรับแต่งคำแนะนำภายใต้การดูแลดู . ./tutorial/9_UltraChat.py
ส.ค. 2022: ขอบคุณผู้สนับสนุน Zhiyongliu1114 ตอนนี้ OpenPrompt รองรับ Ernie 1.0 ใน Paddlepaddle
กรกฎาคม 2022: OpenPrompt รองรับ OPT ตอนนี้
มิถุนายน 2022: OpenPrompt ได้รับรางวัล ACL 2022 Best Demo Paper Award
มี.ค. 2022: เราเพิ่มบทช่วยสอนเป็นการตอบสนองต่อการออก 124 ซึ่งใช้ tokenizer_wrapper ที่ปรับแต่งเพื่อดำเนินการงานที่ไม่ได้อยู่ในการกำหนดค่าเริ่มต้นของ OpenPrompt (เช่น Bert Tokenizer+T5 รุ่น)
ก.พ. 2022: ตรวจสอบ repo sister repo opendelta ของเรา!
ธ.ค. 2021: pip install openprompt
ธ.ค. 2021: เพิ่มประสิทธิภาพของ SuperGlue
ธ.ค. 2021: เราสนับสนุน กระบวนทัศน์การสร้างสำหรับงานทั้งหมด โดยการเพิ่ม Verbalizer ใหม่: GenerationverBalizer และการสอน: 4.1_all_tasks_are_generation.py
พ.ย. 2021: ตอนนี้เราได้เปิดตัว Paper OpenPrompt: กรอบโอเพนซอร์ซสำหรับการเรียนรู้ล่วงหน้า
พ.ย. 2021 prefixtuning รองรับ T5 ตอนนี้
พ.ย. 2021: เราทำการเปลี่ยนแปลงที่สำคัญบางอย่างจากเวอร์ชันสุดท้ายที่มีการแนะนำภาษาเทมเพลตที่ยืดหยุ่นใหม่! ส่วนหนึ่งของเอกสารล้าสมัยและเราจะแก้ไขในไม่ช้า

ภาพรวม

Prompt-Learning เป็นกระบวนทัศน์ล่าสุดในการปรับโมเดลภาษาที่ผ่านการฝึกอบรมมาก่อน (PLMS) ให้เข้ากับงาน NLP ดาวน์สตรีมซึ่งปรับเปลี่ยนข้อความอินพุตด้วยเทมเพลตข้อความและใช้ PLMS โดยตรงเพื่อดำเนินงานที่ผ่านการฝึกอบรมมาก่อน ไลบรารีนี้มีกรอบมาตรฐานยืดหยุ่นและขยายได้เพื่อปรับใช้ไปป์ไลน์การเรียนรู้พรอมต์ OpenPrompt รองรับการโหลด PLMS โดยตรงจาก HuggingFace Transformers ในอนาคตเราจะสนับสนุน PLMS ที่ดำเนินการโดยห้องสมุดอื่น ๆ สำหรับทรัพยากรเพิ่มเติมเกี่ยวกับการเรียนรู้พรอมต์โปรดตรวจสอบรายการกระดาษของเรา

คุณสามารถทำอะไรผ่าน OpenPrompt

การสาธิต

ใช้การใช้งานของวิธีการเรียนรู้ที่รวดเร็วในปัจจุบัน* เราได้ใช้วิธีการแจ้งเตือนต่าง ๆ รวมถึงกลยุทธ์การปรับแต่งการใช้คำพูดและการเพิ่มประสิทธิภาพภายใต้มาตรฐานแบบครบวงจร คุณสามารถโทรและเข้าใจวิธีการเหล่านี้ได้อย่างง่ายดาย
ออกแบบงานการเรียนรู้ที่รวดเร็วของคุณเอง ด้วยความสามารถในการขยายของ OpenPrompt คุณสามารถฝึกความคิดการเรียนรู้ได้อย่างรวดเร็ว

การติดตั้ง

หมายเหตุ: โปรดใช้ Python 3.8+ สำหรับ OpenPrompt

ใช้ PIP

repo ของเราได้รับการทดสอบใน Python 3.8+ และ Pytorch 1.8.1+ , ติดตั้ง OpenPrompt โดยใช้ PIP ดังนี้:

pip install openprompt

ในการเล่นกับคุณสมบัติล่าสุดคุณยังสามารถติดตั้ง OpenPrompt จากแหล่งที่มา

ใช้ Git

โคลนที่เก็บจาก GitHub:

git clone https://github.com/thunlp/OpenPrompt.git
cd OpenPrompt
pip install -r requirements.txt
python setup.py install

แก้ไขรหัส

 python setup.py develop

ใช้ OpenPrompt

แนวคิดพื้นฐาน

วัตถุ PromptModel ประกอบด้วย Template PLM , (หรือหลาย) และ A (หรือหลาย) Verbalizer โดยที่คลาส Template ถูกกำหนดให้ห่ออินพุตดั้งเดิมด้วยเทมเพลตและคลาส Verbalizer คือการสร้างการฉายภาพระหว่างฉลากและคำเป้าหมายในคำศัพท์ปัจจุบัน และวัตถุ PromptModel มีส่วนร่วมในการฝึกอบรมและการอนุมาน

บทนำโดยตัวอย่างง่ายๆ

ด้วยความเป็นโมดูลและความยืดหยุ่นของ OpenPrompt คุณสามารถพัฒนาไปป์ไลน์การเรียนรู้ได้อย่างง่ายดาย

ขั้นตอนที่ 1: กำหนดงาน

ขั้นตอนแรกคือการกำหนดงาน NLP ปัจจุบันลองคิดดูว่าข้อมูลของคุณเป็นอย่างไรและคุณต้องการอะไรจากข้อมูล! นั่นคือสาระสำคัญของขั้นตอนนี้คือการกำหนด classes และ InputExample ของงาน เพื่อความเรียบง่ายเราใช้การวิเคราะห์ความเชื่อมั่นเป็นตัวอย่าง Tutorial_task

 from openprompt . data_utils import InputExample
classes = [ # There are two classes in Sentiment Analysis, one for negative and one for positive
    "negative" ,
    "positive"
]
dataset = [ # For simplicity, there's only two examples
    # text_a is the input text of the data, some other datasets may have multiple input sentences in one example.
    InputExample (
        guid = 0 ,
        text_a = "Albert Einstein was one of the greatest intellects of his time." ,
    ),
    InputExample (
        guid = 1 ,
        text_a = "The film was badly made." ,
    ),
]

ขั้นตอนที่ 2: กำหนดรูปแบบภาษาที่ผ่านการฝึกอบรมมาก่อน (PLMS) เป็นกระดูกสันหลัง

เลือก PLM เพื่อสนับสนุนงานของคุณ โมเดลที่แตกต่างกันมีคุณลักษณะที่แตกต่างกันเราขอแนะนำให้คุณใช้ OpenPrompt เพื่อสำรวจศักยภาพของ PLMs ต่างๆ OpenPrompt เข้ากันได้กับโมเดลบน HuggingFace

 from openprompt . plms import load_plm
plm , tokenizer , model_config , WrapperClass = load_plm ( "bert" , "bert-base-cased" )

ขั้นตอนที่ 3: กำหนดเทมเพลต

Template เป็นตัวดัดแปลงของข้อความอินพุตต้นฉบับซึ่งเป็นหนึ่งในโมดูลที่สำคัญที่สุดในการเรียนรู้ด้วยพรอมต์ เราได้กำหนด text_a ในขั้นตอนที่ 1

 from openprompt . prompts import ManualTemplate
promptTemplate = ManualTemplate (
    text = '{"placeholder":"text_a"} It was {"mask"}' ,
    tokenizer = tokenizer ,
)

ขั้นตอนที่ 4: กำหนด Verbalizer

Verbalizer เป็นอีกสิ่งที่สำคัญ (แต่ไม่จำเป็น) ในการเรียนรู้ที่รวดเร็วซึ่งคาดการณ์ฉลากดั้งเดิม (เราได้กำหนดไว้เป็น classes จำได้ไหม) กับชุดคำติดฉลาก นี่คือตัวอย่างที่เราคาดการณ์คลาส negative ไปยังคำที่ไม่ดีและฉายภาพระดับ positive กับคำที่ดียอดเยี่ยมยอดเยี่ยมมาก

 from openprompt . prompts import ManualVerbalizer
promptVerbalizer = ManualVerbalizer (
    classes = classes ,
    label_words = {
        "negative" : [ "bad" ],
        "positive" : [ "good" , "wonderful" , "great" ],
    },
    tokenizer = tokenizer ,
)

ขั้นตอนที่ 5: รวมเข้ากับโมเดลพร้อมท์

จากงานตอนนี้เรามี PLM Template และ Verbalizer เรารวมเข้ากับ PromptModel โปรดทราบว่าแม้ว่าตัวอย่างจะรวมโมดูลสามโมดูลอย่างไร้เดียงสา แต่คุณสามารถกำหนดปฏิสัมพันธ์ที่ซับซ้อนบางอย่างได้จริง

 from openprompt import PromptForClassification
promptModel = PromptForClassification (
    template = promptTemplate ,
    plm = plm ,
    verbalizer = promptVerbalizer ,
)

ขั้นตอนที่ 6: กำหนด dataloader

PromptDataLoader นั้นเป็นเวอร์ชันที่พร้อมท์ของ Pytorch Dataloader ซึ่งรวมถึง Tokenizer , Template และ TokenizerWrapper

 from openprompt import PromptDataLoader
data_loader = PromptDataLoader (
    dataset = dataset ,
    tokenizer = tokenizer ,
    template = promptTemplate ,
    tokenizer_wrapper_class = WrapperClass ,
)

ขั้นตอนที่ 7: รถไฟและการอนุมาน

เสร็จแล้ว! เราสามารถทำการฝึกอบรมและอนุมานได้เช่นเดียวกับกระบวนการอื่น ๆ ใน Pytorch

 import torch

# making zero-shot inference using pretrained MLM with prompt
promptModel . eval ()
with torch . no_grad ():
    for batch in data_loader :
        logits = promptModel ( batch )
        preds = torch . argmax ( logits , dim = - 1 )
        print ( classes [ preds ])
# predictions would be 1, 0 for classes 'positive', 'negative'

โปรดดูสคริปต์การสอนของเราและเอกสารสำหรับรายละเอียดเพิ่มเติม

ชุดข้อมูล

เราให้บริการสคริปต์ดาวน์โหลดใน dataset/ โฟลเดอร์อย่าลังเลที่จะใช้เพื่อดาวน์โหลดเกณฑ์มาตรฐาน

รายงานประสิทธิภาพ

มีชุดค่าผสมที่เป็นไปได้มากเกินไปที่ขับเคลื่อนโดย OpenPrompt เราพยายามอย่างเต็มที่เพื่อทดสอบประสิทธิภาพของวิธีการต่าง ๆ โดยเร็วที่สุด ประสิทธิภาพจะได้รับการปรับปรุงอย่างต่อเนื่องเป็นตาราง นอกจากนี้เรายังสนับสนุนให้ผู้ใช้ค้นหาพารามิเตอร์ไฮเปอร์ที่ดีที่สุดสำหรับงานของตนเองและรายงานผลลัพธ์โดยการร้องขอการดึง

ปัญหาที่รู้จัก

การปรับปรุง/เพิ่มประสิทธิภาพที่สำคัญในอนาคต

เราทำการเปลี่ยนแปลงที่สำคัญบางอย่างจากเวอร์ชันสุดท้ายดังนั้นส่วนหนึ่งของเอกสารจะล้าสมัย เราจะแก้ไขเร็ว ๆ นี้

การอ้างอิง

โปรดอ้างอิงกระดาษของเราหากคุณใช้ OpenPrompt ในงานของคุณ

 @article { ding2021openprompt ,
  title = { OpenPrompt: An Open-source Framework for Prompt-learning } ,
  author = { Ding, Ning and Hu, Shengding and Zhao, Weilin and Chen, Yulin and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong } ,
  journal = { arXiv preprint arXiv:2111.01998 } ,
  year = { 2021 }
}

ผู้มีส่วนร่วม

เราขอขอบคุณผู้สนับสนุนทุกคนในโครงการนี้ยินดีต้อนรับผู้มีส่วนร่วมเพิ่มเติม!

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-28
ขนาด 2.51MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด