DataDreamer
v0.38.0
https://datadreamer.dev
迅速的。生成合成數據。火車和對齊模型。
DatadReamer是一個強大的開源Python庫,用於提示,合成數據生成和培訓工作流程。它旨在簡單,極其高效和研究級。
安裝 pip3 install datadreamer.dev | |
demo.py | demo.py的結果 |
|---|---|
查看完整的演示腳本 | 請參閱合成數據集和訓練有素的模型 |
有關更多演示和食譜,請參閱快速旅行頁面。 | |
對於DatadReamer,您可以:
DatadReamer是:
請引用DatadReamer紙:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}如果您有任何疑問,評論或反饋,請通過電子郵件([email protected])與我們聯繫。
版權所有©2024,Ajay Patel。根據MIT許可發布。
感謝您在擁抱面孔和Litellm的維護者接受DatadReamer所需的貢獻並提供上游支持所需的貢獻。
ODNI,IARPA:這項研究得到了國家情報總監(ODNI),情報高級研究項目活動(IARPA)的部分支持,該研究通過HIATUS計劃合同#2022-2207222005。本文所包含的觀點和結論是作者的觀點,不應被解釋為一定代表ODNI,IARPA或美國政府的官方政策,即表示或暗示。儘管有任何版權註釋,但美國政府有權出於政府目的複制和分發重印。