https://datadreamer.dev
プロンプト。合成データを生成します。モデルを訓練および整列させます。
DatadReamerは、プロンプト、合成データ生成、トレーニングワークフローのための強力なオープンソースPythonライブラリです。シンプルで、非常に効率的で、研究グレードになるように設計されています。
インストール pip3 install datadreamer.dev | |
demo.py | demo.pyの結果 |
|---|---|
完全なデモスクリプトを参照してください | 合成データセットと訓練されたモデルを参照してください |
その他のデモンストレーションとレシピについては、クイックツアーページをご覧ください。 | |
DatadReamerを使用すると、次のことができます。
DataDreamerは次のとおりです。
Datadreamerの論文を引用してください:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}質問、コメント、またはフィードバックがある場合は、電子メール([email protected])またはdiscordでご連絡ください。
Copyright©2024、Ajay Patel。 MITライセンスの下でリリースされました。
DataDreamerに必要な貢献を受け入れ、上流のサポートを提供してくれたFaceとLitellmを抱きしめてくれたメンテナーに感謝します。
ODNI、IARPA:この研究の一部は、Hutus Program Contract#2022-22072200005を介して、Intelligencee Advanced Research Projects Activity(IARPA)のNational Intelligence Director(ODNI)のオフィスによってサポートされています。本明細書に含まれる見解と結論は著者の見解であり、ODNI、IARPA、または米国政府の表明または黙示のいずれかの公式政策を必ずしも代表するものとして解釈すべきではない。米国政府は、著作権の注釈にかかわらず、政府の目的で再版を再現して配布することを許可されています。