pip install discus
لأحدث إصدار ، يرجى pip install discus@git+https://github.com/discus-labs/discus
https://discus.ai/docs/index.html
يعد الوصول إلى مجموعات البيانات عالية الجودة والكبيرة أمرًا بالغ الأهمية عندما يتعلق الأمر باختبار/تقييم ML. Discus هي مكتبة Python التي تعزز LLM لإنشاء بيانات موجهة للمستخدم لحل هذه المشكلة الحرجة.
مواكبة التحديثات على Twitter لدينا أو خلافنا.
فيما يلي بعض الخطوات السريعة للحصول على عمل Discus.
بعد تثبيت Discus ، تأكد من الاندماج في مزود LLM الخاص بك. على سبيل المثال،
export OPENAI_API_KEY=your-api-key-hereيمكننا الآن البدء. أولاً ، قم بإنشاء JSON بعد هذه الإرشادات:
config = {
"task_name" : "English2Spanish" ,
"task_type" : "LLM-Instances" ,
"task_explained" : "generate english to spanish translation." , # fill in the blank. "you are trying to _____"
"generated_dataset_name" : "eng2spanish.csv" ,
"model_provider" : "openai" ,
"model_name" : "gpt-3.5-turbo" ,
"number_of_rows" : "1500"
}لتشغيل ، استيراد القرص. ثم ، قم بإنشاء كائن مولد.
from discus import Generator
discus = Generator ( config = "config_file_path" )
generated_data = discus . run ()تحقيق نتائج أفضل من خلال تزويد النموذج الخاص بك مع مجموعة بيانات البذور.
discus = Generator ( config = "config_file_path" , seed_dataset = "csv_file_path" )
generated_data = discus . run ()Discus هو مشروع سريع التطور. نرحب بالمساهمات في جميع النماذج - تقارير الأخطاء ، وطلبات السحب والأفكار لتحسين المكتبة.
افتح مشكلة على github للحشرات وطلب الميزات. الاستيلاء على مشكلة مفتوحة ، وتقديم طلب سحب! Discus هو مشروع سريع التطور. نرحب بالمساهمات في جميع النماذج - تقارير الأخطاء ، وطلبات السحب والأفكار لتحسين المكتبة.