pip install discus
Для самой последней версии, пожалуйста, pip install discus@git+https://github.com/discus-labs/discus
https://discus.ai/docs/index.html
Доступ к высококачественным и большим наборам данных имеет решающее значение, когда речь идет о тестировании/оценке ML. Discus - это библиотека Python, которая использует LLM для генерации данных, управляемых пользователем, для решения этой критической проблемы.
Следите за обновлениями в нашем Твиттере или в наших раздорах.
Вот несколько быстрых шагов для работы диска.
После установки диска, обязательно интегрируйтесь в свой поставщик LLM. Например,
export OPENAI_API_KEY=your-api-key-hereТеперь мы можем начать. Во -первых, создайте свой JSON, следуя этим рекомендациям:
config = {
"task_name" : "English2Spanish" ,
"task_type" : "LLM-Instances" ,
"task_explained" : "generate english to spanish translation." , # fill in the blank. "you are trying to _____"
"generated_dataset_name" : "eng2spanish.csv" ,
"model_provider" : "openai" ,
"model_name" : "gpt-3.5-turbo" ,
"number_of_rows" : "1500"
}Запустить, импортировать диск. Затем создайте объект генератора.
from discus import Generator
discus = Generator ( config = "config_file_path" )
generated_data = discus . run ()Получите лучшие результаты, предоставив вашу модель с помощью набора данных семян.
discus = Generator ( config = "config_file_path" , seed_dataset = "csv_file_path" )
generated_data = discus . run ()Диск - это быстро развивающийся проект. Мы приветствуем вклад во все формы - отчеты об ошибках, запросы на получение запросов и идеи для улучшения библиотеки.
Откройте проблему на GitHub для ошибок и функций запроса. Возьмите открытую проблему и отправьте запрос на привлечение! Диск - это быстро развивающийся проект. Мы приветствуем вклад во все формы - отчеты об ошибках, запросы на получение запросов и идеи для улучшения библиотеки.