tuna هو متجر One Stop (مفتوح المصدر) لضبط نموذج توليد الرموز على أي قاعدة كود ، متاح بشكل عام أو خاص على GitHub (المزيد من دعم VCS قريبًا!).
نحن نقوم بتبسيط العملية برمتها ، مما يعني أن كل ما عليك فعله لبناء نموذجك المثالي والإعدادات والكلمت ، هو ببساطة اتباع أمر التهيئة أدناه!
ليس لديك وحدة معالجة الرسومات nvidia؟ لا تقلق! تأكد من أن لديك مفتاح RSA SSH متاح على ~/.ssh/id_rsa.pub ، وقام بإعداد حساب ومفتاح API على مزود GPU الخاص بنا ، FluidStack. الحد الأدنى من الأسعار ، الحد الأقصى للتطوير.
إذا كنت تتعلق بخصوصية البيانات وجمع البيانات ، لاحظ أن التونة لا تجمع أي بيانات عليك ، وهي مفتوحة تمامًا. تحقق من قسم "جمع البيانات" أدناه لمعرفة المزيد.
نحن نحب إذا أعطيتنا ، لأن هذه هي طريقتنا الأساسية لتتبع اهتمام المستخدم! إذا كنت تشعر بالسخاء ، يمكنك النقر فوق الراعي ❤. شكرا جزيلا لك على القراءة!
أسئلة؟ اتصل بـ abhi[at]opennote.me .
ملاحظة: تونة حاليًا مدعومة فقط على MacOS و Linux ، سيأتي Windows قريبًا ...
لتثبيت tuna ، تأكد من تثبيت Python 3.12+ على جهازك ، ثم قم ببساطة بتشغيل الأمر أدناه:
pip install tuna-cli هذا سيجعل tuna قابلة للتنفيذ من أي مكان على جهازك.
1. تهيئة
tuna init
# Initializes a `.tuna` folder
# Authenticates your GitHub credentials
# - This asks for a GitHub Token
# which MUST have READ REPO and READ USER permissions
# Lets you select a repository
# Builds a Model Training Dataset
# Sets up Jupyter Environment2. الخدمة
tuna serve
# Runs a Local Jupyter Environment with the
# autogenerated notebook and dataset,
# with CPU and Memory monitoring
# By default, this doesn't open the browser
# automatically. Run:
tuna serve --open
# to do that3. تحديث
tuna refresh
# Recreates the dataset after updating
# from your GitHub project, in case you made
# edits after initializing with Tuna4. القطار (قريبا)
tuna train
# Begins to train the dataset with a powerful GPU from
# FluidStack (see intro)
# To train locally on current hardware, run
tuna train --local
# (must be on a device with an NVIDIA GPU, since Tuna relies on CUDA)5. المساعدون
tuna help
# or
tuna github
# or
tuna docs
# All of these will open the GitHub repository for Tuna, where all the documentation
# is served in the README.md file.6. تطهير
tuna purge
# This will delete all tuna-generated files
# in your current directory
# USE WITH CAUTION!7. لا أعلام
tuna
# Displays a welcome message بعد تثبيت أداة CLI ، يتم ترجمة التونة بالكامل على نظامك. خارج خدمات تأجير GPU التي نربطها للسماح بالتدريب ، لا نقوم بتخزين أي بيانات أو نقلها إلى أي خدمات داخلية. التونة مفتوحة بشكل صارم .
يمكن مسح بيانات اعتماد GitHub بما في ذلك Oauth Tokens ، اسم المستخدم الخاص بك ، ومستودعاتك المخزنة عن طريق حذف دليل .tuna في نفس المكان الذي تم صنعه ، أو عن طريق تشغيل tuna purge في هذا الدليل.
يتم أيضًا تخزين مفاتيح API FluidStack محليًا ، عن طريق حذف دليل .tuna في نفس المكان الذي تم صنعه ، أو عن طريق تشغيل tuna purge في هذا الدليل
يتم تخزين جميع الملفات التي يتم سحبها من Github بدقة في مجموعات البيانات التي يمكنك العثور عليها في دليل .tuna الذي يتم صنعه. نقوم بسحب النص مباشرة من واجهة برمجة تطبيقات Github لتوفير الملفات غير المرغوب فيها وتثبيتات التبعية ، وأيضًا لحماية متغيرات البيئة الخاصة بك.
ما لم تقم بمشاركة تفسير البيانات معنا ، فلن نرى بياناتك الشخصية أبدًا.
إخلاء المسئولية: نحن لا نمتلك النماذج التي نستخدمها للضبط الدقيق ، وسياسات البيانات الخاصة بهم على مواقعها الإلكترونية. ابحث عن نموذجك المفضل لمعرفة المزيد.
؟ هابي تون (أ) جي!