تنزيل smolrsrwkv - تنزيل رمز المصدر smolrsrwkv

smolrsrwkv

كود الذكاء الاصطناعي

1.0.0

تنزيل

SMOL RWKV

ما هذا؟

مثال على نهج RWKV في نماذج اللغة المكتوبة في الصدأ من قبل شخص لا يعرف سوى القليل عن الرياضيات أو الشبكات العصبية. كان الإصدار الأولي يعتمد بشكل كبير للغاية على المعلومات المذهلة ومثال Python هنا: https://johanwind.github.io/2023/03/23/rwkv_details.html

انظر أيضًا مستودع RWKV Creator: https://github.com/blinkdl/chatrwkv/

سمات

مكتوب في الصدأ. يمكن أن تساعد الكتابة الثابتة حقًا عند محاولة فهم شيء ما ، لأنه من الواضح نوع الشيء الذي يكون عليه كل كائن.
لا يعتمد على أطر عمل ضخمة مثل Torch أو CUDA.
يمكن استخدام جميع المواضيع/النوى للاستدلال.
يدعم Float32 و 8bit الاستدلال وكذلك الاستدلال 4bit مع GGML.

أوجه القصور

لم يتم تحسينه حقًا للأداء.
لا يمكن تحديد كمية على الطيران (يمكن بطيئة للطرز الكبيرة).
يمكن تشغيل الاستدلال فقط على وحدة المعالجة المركزية.

إذا كان التحميل في وضع 32 بت يستخدم الكثير من الذاكرة. يستخدم طراز 3B حوالي 11 جيجا بايت ذاكرة الوصول العشوائي وقد يتناسب واحد 7B فقط على آلة سعة 32 جيجابايت ترغب في إغلاق التطبيقات الأخرى أو التعامل مع بعض المبادلات. حتى التحميل في وضع 8bit يستخدم كمية لا بأس بها من الذاكرة ، ولكنه سوف ينخفض بمجرد الانتهاء من التحميل.

كيف يمكنني استخدامه؟

ستحتاج إلى صدأ وشحنة: https://www.rust-lang.org/learn/get-started

ستحتاج إلى تنزيل طراز RWKV. إليك رابط لبدء تشغيلك (حوالي 820 ميجابايت): https://huggingface.co/blinkdl/rwkv-4-pile-430m/resolve/main/rwkv-4-pile-430m-20220808-8066.pth

أيضا tokenizer هنا: https://github.com/blinkdl/chatrwkv/blob/main/20b_tokenizer.json

يمكن تحميل ملفات طراز Pytorch مباشرة. إذا انتهت الملفات بـ .pt أو .pth ، فسيتم تحميلها كنموذج pytorch. إذا انتهى الأمر بـ .st أو .safetensors ، فسيتم تحميله على أنه Safetensors. ملاحظة : دعم Pytorch تجريبي حاليًا وقد لا يعمل بشكل صحيح. من المحتمل أن تحصل على خطأ فورًا إذا كانت هناك مشكلة ، لذا لا ينبغي أن يكون من الخطير تجربة هذا النهج. إذا كنت تريد ، يمكنك تعطيل ميزة torch وبناء الدعم فقط لملفات تنسيق Safetensors.

بعد ذلك ، يجب أن تكون قادرًا على cargo run --release . يمكنك محاولة التجميع بدون --release لكن من المحتمل أن يكون كل شيء بطيئًا بجنون. حاول أيضًا cargo run --release -- --help لرؤية خيارات سطر الأوامر.

ملاحظة : الافتراضي هو استخدام جميع النوى المنطقية ، راجع خيارات سطر الأوامر.

يمكنك اختياريًا تحويل ملف .pth Model إلى تنسيق Safetensors. انظر إلى utils/pth_to_safetensors.py على سبيل المثال. للقيام بذلك ، ستحتاج إلى إعداد حزم safetensors و torch Python. أقترح القيام بذلك في بيئة افتراضية. لا يوجد حاليًا ميزة كبيرة لهذه الخطوة حيث يمكن تحميل ملفات الشعلة مباشرة في الإصدار الحالي.

ملاحظة GGML DEV

يحتاج دعم GGML حاليًا إلى إصدار مصحح من ggml و ggml-sys من مشروع llama-rs .

تم إعداد Cargo.toml للإشارة إلى الفرع الصحيح في شوكة بلدي ، ولكن هذا سوف يختفي بمجرد دمج التغييرات اللازمة في GGML. بطبيعة الحال ، سيتم تحديث هذا الريبو ، ولكن ضع في اعتبارك أن تجميعاتك قد تبدأ في الفشل في النهاية إذا كنت تحاول استخدام إصدار أقدم ، حيث سيتم إزالة هذا الفرع في النهاية.

كيف تعمل

ملاحظة: هذا الجزء قديم من الوقت الآن. ما زلت أوصي بقراءة الروابط أدناه. لاحظ أيضًا أن هذا الوصف يعتمد على نسخة أبسط من نموذج RWKV مع أربع حالات فقط لكل طبقة. النسخة الكاملة لديها خمسة.

فيما يلي وصف عالي المستوى (ربما يكون خطأ) للخطوات التي ينطوي عليها تقييم النموذج. ستحتاج إلى الرجوع إلى المصدر في smolrwkv/src/simple/model.rs لهذا المنطقي.

أيضا ، فكر بقوة في قراءة هذه أولا:

https://johanwind.github.io/2023/03/23/rwkv_overview.html - تفسير المستوى العالي.
https://johanwind.github.io/2023/03/23/rwkv_details.html - شرح أكثر تفصيلاً مع مثال Python.

بالمناسبة ، حقيقة ممتعة: "Tensor" تبدو خيالية حقيقية لكنها في الأساس مجرد مجموعة. الموتر الأبعاد الواحد هو مجرد صفيف أبعاد واحد ، وهو موتر ثنائي الأبعاد ثنائي الأبعاد هو صفيف ثنائي الأبعاد. يمكن أن يكون لديهم خصائص خاصة (مثل كونها غير قابلة للتغيير) ولكن هذا لا يهم لفهم المفهوم بشكل عام. إذا كنت تعرف المصفوفات ، فلديك الفكرة العامة للترنز بالفعل.

لتقييم الرمز المميز:

حساب قيمة أولية لـ x من ln0 .
قم بتغذية هذا x لكل طبقة بالتتابع ، باستخدام x الطبقة التي تم إنشاؤها للآخر.
1. خذ x الذي تم تغذيته.
2. تطبيق ln1 على x وتغذيةها لخلط الوقت. هذا يستخدم Tensor من الجزء FFN من النموذج.
  1. خذ tm_state من حالة الطبقة واتصل بها last_x . (لماذا؟ من يدري!)
  2. خذ tm_num و tm_den كـ last_num ، last_den .
  3. قم بمجموعة من أشياء الرياضيات الفاخرة لست مؤهلاً لشرحها.
  4. القيم الجديدة المحسوبة أعلاه لـ tm_[state,num,den] لذا قم بتحديث حالة الطبقة الخاصة بك بهذه.
  5. أيضا إرجاع x التي نتجت عن الحسابات.
3. أضف x من الاختلاط الزمني إلى x ( x += time_mixing_x ).
4. تطبيق ln2 على x وتغذيةه على خلط القناة. هذا يستخدم Tensors من جزء شبكة التغذية للأمام من النموذج.
  1. خذ cm_state من حالة الطبقة واتصل بها last_x .
  2. أشياء رياضيات أكثر فاخرة (أقل مشاركة من وقت الاختلاط رغم ذلك).
  3. كما هو الحال مع الاختلاط الزمني ، سيحسب هذا cm_state جديدًا ، لذا قم بتحديث حالة الطبقة.
  4. إرجاع x الذي نتج عن حساب خلط القناة.
5. أضف x من خلط القناة إلى x .
قم بعمل أشياء رياضيات فاخرة إلى x التي كانت النتيجة بعد تقييم الطبقة الأخيرة.
أعدها كقائمة الاحتمالات لكل رمز.

يحتوي النموذج على قائمة من الرموز "يعرف". في بعض الأحيان يكون الرمز مساوياً للكلمة ، وأحيانًا يكون مجرد جزء من كلمة. عادة ما يكون هناك عدد كبير من الرموز ، في حدود 30،000-60،000. أعتقد أن نماذج RWKV الحالية لديها 50،277 رمز. على أي حال ، ستحصل على قائمة بـ 50،277 أرقام نقاط عائمة مرة أخرى بعد تشغيل النموذج.

أعلى قيمة من تلك القائمة هي الرمز المميز الذي يتوقعه النموذج هو الاستمرار الأكثر ترجيحًا وما إلى ذلك. إذا قمت بإنشاء قائمة مصنفة بأعلى 10-40 احتمالات رمزية أو نحو ذلك وحددت واحدة بشكل عشوائي ، فستحصل على إخراج معقول إلى حد ما ، نسبيًا. من العدل أن نقول أن نموذجًا صغيرًا يبلغ طوله 430 مترًا لا ينتج الناتج الأكثر منطقية بشكل عام.

شرح جيد لكيفية التعامل مع الخطوة التالية بمجرد الحصول على قائمة الاحتمالات: https://huggingface.co/blog/how-to-generate

التوافه

هناك العديد من الأشياء الرياضية المعقدة التي تشارك في تقييم النموذج ، ولكن الشيء الوحيد الذي يهم حقًا هو تكاثر المصفوفة ( pardot في المصدر). في حالة RWKV ، فإن تكاثر المصفوفة-المصفوفة (مجموعة ثنائية الأبعاد مضروبة مع صفيف 1D). > 90 ٪ من الوقت الذي يقضيه تقييم النموذج في مكالمات تكاثر المصفوفة هذه.

في وضع غير GGML ، يستخدم معالجة Math/Array هنا صندوق ndarray . إنه يوفر وظيفة .dot ، ومع ذلك لن يحسب هذا فعليًا مضاعفة المصفوفة المصفوفة بالتوازي على الرغم من أن الدعم يدعي دعم ترابط. نظرًا لأن هذا الحساب أمر بالغ الأهمية للأداء ، فقد انتهى بي الأمر إلى كتابة وظيفتي الخاصة لتقسيم الحساب إلى أجزاء وتشغيله بالتوازي. انظر الوظائف في وحدة dumdot في smolrwkv/src/util.rs .

حقيقة أن تحصل على قائمة من الاحتمالات مرة أخرى وليس "إجابة" محددة من النموذج تبدو وكأنها حجة مضادة لائقة لفكرة أن LLMs هي أو يمكن أن تكون واعية بطريقة ما. عندما تنظر إلى الإخراج من LLM ، فإنك في كثير من الأحيان لن تشاهد حتى الضيق الأكثر احتمالًا. أيضًا ، حقيقة ممتعة: عندما تغذي موجهًا لنموذج ما ، فإنه يأتي بقائمة من الاحتمالات تمامًا مثل عندما تسألها عن الرد. ومع ذلك ، يتم طرح هذه الاحتمالات فقط باستثناء النتيجة بعد معالجة الرمز المميز الأخير.

مثال الإخراج

موجه بالخط العريض. إذن ، هل ثعابين شجرة التنين أو الكلاب؟ قد لا يعرف العالم أبدًا!

 * Loading tokenizer from: ./20B_tokenizer.json
* Loading model from: ./RWKV-4-Pile-430M-20220808-8066.safetensors
* Discovering model structure.
-   Loading layer 1/24
[...]
-   Loading layer 24/24
* Loading non-layer tensors.
* Loaded: layers=24, embed=1024, vocab=50277

في اكتشاف مروع ، اكتشف العالم قطيعًا من التنانين الذين يعيشون في وادي بعيد غير مستكشفة سابقًا ، في التبت. والأكثر إثارة للدهشة للباحثين هو حقيقة أن التنين تحدث الصينية المثالية.

تحدثت جميع هذه التنينات لهجات مختلفة وهذه اللهجات لا تتطابق مع اللغة الأم للكلاب.

في محاولة لفك تشفير ما تحدثه هذه التنينات ، أطلقوا على التنين ووجدوا أن لغتهم كانت مختلفة عن الإنسان.

"لقد فهمت التنينات الكلمات البشرية واللغات البشرية بشكل أكثر دقة. تحدث التنينات اللغة البشرية. لقد فهموا أيضًا قواعد الصينية" ، قال فريق الأبحاث لمونغاباي.

من خلال إجراء البحث ، يأملون في إلقاء الضوء على التاريخ الغامض للتنين في المناطق النائية في العالم ، وخاصة في التبت.

يوضح المشروع البحثي ، الذي نشر في مجلة Open Science ، أيضًا أن التنينات هي ، في الواقع ، الزواحف ، أو الأذواق الملقب.

التنين ، وليس الأفعى

وفقًا لفريق البحث ، فإن التنينات الموجودة في التبت هي سباق للكلاب ، وليس الزواحف.

بينما كان فريق البحث لا يزال غير قادر على التوصل إلى أي تفسير حول سبب عيش هذه التنينات في التبت ، كان يعتقد سابقًا أنهم كانوا على الأرجح على الأرض بالقرب من هضبة التبت.

"يعيش التنين هناك كجزء من هضبة تشينغهاي التبت العظيمة التي لم يتم إزعاجها تقريبًا ، وتم تحويل هضبة تشينغهاي توب كلها تدريجياً إلى حالة زراعية. لذلك ، لديهم نمط مميز من المضغ على الأشجار ، وربما لا تكون الحيوانات كبيرة جدًا بحيث لا يمكن الاحتفاظ بها في الطبيعة" ، أوضح الباحثون.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-09
الحجم 39.62KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل