pip install discus
Para la versión más reciente, haga pip install discus@git+https://github.com/discus-labs/discus
https://discus.ai/docs/index.html
El acceso a conjuntos de datos de alta calidad y grandes es fundamental cuando se trata de pruebas/evaluación de ML. DISCUS es una biblioteca de Python que aprovecha los LLM para generar datos guiados por el usuario para resolver este problema crítico.
Manténgase al día con las actualizaciones en nuestro Twitter o nuestra discordia.
Aquí hay algunos pasos rápidos para que el disco funcione.
Después de instalar Discus, asegúrese de integrarse en su proveedor de LLM. Por ejemplo,
export OPENAI_API_KEY=your-api-key-hereAhora podemos comenzar. Primero, cree su JSON siguiendo estas pautas:
config = {
"task_name" : "English2Spanish" ,
"task_type" : "LLM-Instances" ,
"task_explained" : "generate english to spanish translation." , # fill in the blank. "you are trying to _____"
"generated_dataset_name" : "eng2spanish.csv" ,
"model_provider" : "openai" ,
"model_name" : "gpt-3.5-turbo" ,
"number_of_rows" : "1500"
}Para ejecutar, importar disco. Luego, cree un objeto generador.
from discus import Generator
discus = Generator ( config = "config_file_path" )
generated_data = discus . run ()Lograra mejores resultados al proporcionar a su modelo un conjunto de datos de semillas.
discus = Generator ( config = "config_file_path" , seed_dataset = "csv_file_path" )
generated_data = discus . run ()DISCUS es un proyecto en rápido desarrollo. Agradecemos las contribuciones en todas las formas: informes de errores, solicitudes e ideas para mejorar la biblioteca.
Abra un problema en GitHub para errores y características de solicitud. ¡Tome un problema abierto y envíe una solicitud de extracción! DISCUS es un proyecto en rápido desarrollo. Agradecemos las contribuciones en todas las formas: informes de errores, solicitudes e ideas para mejorar la biblioteca.