pip install discus
Para a versão mais recente, faça pip install discus@git+https://github.com/discus-labs/discus
https://discus.ai/docs/index.html
O acesso a conjuntos de dados de alta qualidade e grandes é fundamental quando se trata de teste/avaliação de ML. O Discus é uma biblioteca Python que utiliza a LLM para gerar dados guiados pelo usuário para resolver esse problema crítico.
Acompanhe atualizações em nosso Twitter ou nossa discórdia.
Aqui estão algumas etapas rápidas para fazer o disco funcionar.
Após a instalação do disco, certifique -se de integrar seu provedor LLM. Por exemplo,
export OPENAI_API_KEY=your-api-key-hereAgora podemos começar. Primeiro, crie seu JSON seguindo estas diretrizes:
config = {
"task_name" : "English2Spanish" ,
"task_type" : "LLM-Instances" ,
"task_explained" : "generate english to spanish translation." , # fill in the blank. "you are trying to _____"
"generated_dataset_name" : "eng2spanish.csv" ,
"model_provider" : "openai" ,
"model_name" : "gpt-3.5-turbo" ,
"number_of_rows" : "1500"
}Para correr, importe o disco. Em seguida, crie um objeto gerador.
from discus import Generator
discus = Generator ( config = "config_file_path" )
generated_data = discus . run ()Obtenha melhores resultados, fornecendo ao seu modelo um conjunto de dados de sementes.
discus = Generator ( config = "config_file_path" , seed_dataset = "csv_file_path" )
generated_data = discus . run ()O disco é um projeto em rápido desenvolvimento. Congratulamo -nos com contribuições em todas as formas - relatórios de bug, solicitações e idéias para melhorar a biblioteca.
Abra um problema no github para obter os recursos de bugs e solicitar. Pegue um problema em aberto e envie uma solicitação de tração! O disco é um projeto em rápido desenvolvimento. Congratulamo -nos com contribuições em todas as formas - relatórios de bug, solicitações e idéias para melhorar a biblioteca.