https://datadreamer.dev
Prompt. Generieren Sie synthetische Daten. Zug- und Ausrichtung von Modellen.
Datadreamer ist eine leistungsstarke Open-Source-Python-Bibliothek für Aufforderung, synthetische Datenerzeugung und Trainingsarbeitsabläufe. Es ist so konzipiert, dass es einfach, äußerst effizient und Forschungsgrad ist.
Installation pip3 install datadreamer.dev | |
demo.py | Ergebnis von demo.py |
|---|---|
Siehe das vollständige Demo -Skript | Siehe den synthetischen Datensatz und das geschulte Modell |
Weitere Demonstrationen und Rezepte finden Sie auf der Quick Tour -Seite. | |
Mit Datadreamer können Sie:
Datadreamer ist:
Bitte zitieren Sie das Datadreamer -Papier:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}Bitte wenden Sie sich an uns per E -Mail ([email protected]) oder auf Discord, wenn Sie Fragen, Kommentare oder Feedback haben.
Copyright © 2024, Ajay Patel. Unter der MIT -Lizenz veröffentlicht.
Vielen Dank an die Betreuer von Sugging Face und Litellm für die Annahme von Beiträgen für Datadreamer und die Bereitstellung von Upstream -Unterstützung.
ODNI, IARPA: Diese Forschung wird zum Teil vom Büro des Direktors für National Intelligence (ODNI), Intelligence Advanced Research Projects Activity (IARPA), über den Vertrag Nr. 2022-2207200005 (IARPA) unterstützt. Die hierin enthaltenen Ansichten und Schlussfolgerungen sind die der Autoren und sollten nicht so interpretiert werden, dass sie notwendigerweise die ausgedrückten oder stillschweigenden offiziellen Politiken von Odni, Iarpa oder der US -Regierung darstellen. Die US -Regierung ist berechtigt, ungeachtet einer darin geschützten Annotation des Urheberrechts für staatliche Zwecke zu reproduzieren und zu verteilen.