https://datadreamer.dev
Incitar. Gerar dados sintéticos. Treinar e alinhar modelos.
O DatadReamer é uma poderosa biblioteca Python de código aberto para solicitar, geração de dados sintéticos e fluxos de trabalho de treinamento. Ele foi projetado para ser simples, extremamente eficiente e grau de pesquisa.
Instalação pip3 install datadreamer.dev | |
demo.py | Resultado de demo.py |
|---|---|
Veja o script de demonstração completo | Veja o conjunto de dados sintéticos e o modelo treinado |
Para mais demonstrações e receitas, consulte a página de turnê rápida. | |
Com DatadReamer, você pode:
Datadreamer é:
Cite o papel datadreamer:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}Entre em contato conosco por e -mail ([email protected]) ou em discórdia se tiver alguma dúvida, comentário ou feedback.
Copyright © 2024, Ajay Patel. Liberado sob a licença do MIT.
Obrigado aos mantenedores em abraçar o rosto e a Litellm por aceitar as contribuições necessárias para o DatadReamer e fornecer suporte a montante.
ODNI, IARPA: Esta pesquisa é apoiada em parte pelo Escritório do Diretor de Inteligência Nacional (ODNI), Atividade de Projetos de Pesquisa Avançada de Inteligência (IARPA), por meio do contrato do programa Hiatus #2022-22072200005. As opiniões e conclusões aqui contidas são as dos autores e não devem ser interpretadas como necessariamente representando as políticas oficiais, expressas ou implícitas, de Odni, Iarpa ou governo dos EUA. O governo dos EUA está autorizado a reproduzir e distribuir reimpressões para fins governamentais, apesar de qualquer anotação de direitos autorais nela.