https://datadreamer.dev
แจ้ง สร้างข้อมูลสังเคราะห์ โมเดลรถไฟและแนวตั้ง
DataDreamer เป็นไลบรารี Python โอเพนซอร์ซที่ทรงพลังสำหรับการแจ้งเตือนการสร้างข้อมูลสังเคราะห์และเวิร์กโฟลว์การฝึกอบรม มันถูกออกแบบมาให้เรียบง่ายมีประสิทธิภาพมากและเกรดการวิจัย
การติดตั้ง pip3 install datadreamer.dev | |
demo.py | ผลของ demo.py |
|---|---|
ดูสคริปต์ตัวอย่างเต็มรูปแบบ | ดูชุดข้อมูลสังเคราะห์และโมเดลที่ผ่านการฝึกอบรม |
สำหรับการสาธิตและสูตรอาหารเพิ่มเติมดูหน้าการท่องเที่ยวอย่างรวดเร็ว | |
ด้วย DataDreamer คุณสามารถ:
DataDreamer คือ:
กรุณาอ้างอิงกระดาษ dataDreamer:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}โปรดติดต่อเราทางอีเมล ([email protected]) หรือบน Discord หากคุณมีคำถามความคิดเห็นหรือข้อเสนอแนะใด ๆ
ลิขสิทธิ์© 2024, Ajay Patel ปล่อยภายใต้ใบอนุญาต MIT
ขอขอบคุณผู้ดูแลที่ Hugging Face และ Litellm ที่ยอมรับการมีส่วนร่วมที่จำเป็นสำหรับ DataDreamer และให้การสนับสนุนต้นน้ำ
ODNI, IARPA: งานวิจัยนี้ได้รับการสนับสนุนบางส่วนโดยสำนักงานผู้อำนวยการหน่วยข่าวกรองแห่งชาติ (ODNI) กิจกรรมโครงการวิจัยขั้นสูงของหน่วยข่าวกรอง (IARPA) ผ่านทางสัญญาโครงการที่หายไป #2022-22072200005 มุมมองและข้อสรุปที่มีอยู่ในที่นี้เป็นของผู้เขียนและไม่ควรตีความว่าจำเป็นต้องเป็นตัวแทนของนโยบายอย่างเป็นทางการไม่ว่าจะเป็นการแสดงหรือโดยนัยของ Odni, IARPA หรือรัฐบาลสหรัฐฯ รัฐบาลสหรัฐฯได้รับอนุญาตให้ทำซ้ำและจัดจำหน่ายซ้ำเพื่อวัตถุประสงค์ของรัฐบาลแม้จะมีคำอธิบายประกอบลิขสิทธิ์ใด ๆ ในนั้น