ดาวน์โหลด smolrsrwkv - smolrsrwkv ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

smolrsrwkv

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

SMOL RUST RWKV

มันคืออะไร?

ตัวอย่างของวิธีการ RWKV กับโมเดลภาษาที่เขียนด้วย Rust โดยคนที่รู้น้อยมากเกี่ยวกับคณิตศาสตร์หรือเครือข่ายประสาท เวอร์ชันเริ่มต้นนั้นขึ้นอยู่กับข้อมูลที่น่าทึ่งและตัวอย่าง Python ที่นี่: https://johanwind.github.io/2023/03/23/rwkv_details.html

ดูที่เก็บของผู้สร้าง RWKV: https://github.com/blinkdl/chatrwkv/

คุณสมบัติ

เขียนเป็นสนิม การพิมพ์แบบสแตติกสามารถช่วยได้จริง ๆ เมื่อพยายามเข้าใจบางสิ่งบางอย่างเนื่องจากเป็นที่ชัดเจนว่าทุกประเภทของวัตถุคืออะไร
ไม่ได้ขึ้นอยู่กับเฟรมเวิร์กขนาดใหญ่เช่น Torch หรือ Cuda
สามารถใช้เธรด/คอร์ทั้งหมดเพื่อการอนุมาน
รองรับการอนุมาน Float32 และ 8 บิตรวมถึงการอนุมาน 4 บิตด้วย GGML

ข้อบกพร่อง

ไม่ได้รับการปรับให้เหมาะสมสำหรับประสิทธิภาพ
สามารถหาปริมาณได้ทันที (สามารถช้าสำหรับรุ่นใหญ่)
สามารถเรียกใช้การอนุมานบน CPU เท่านั้น

หากโหลดในโหมด 32 บิตมันใช้หน่วยความจำ จำนวน มาก รุ่น 3B ใช้ RAM ประมาณ 11GB และ 7B อันเดียวอาจ พอดี กับเครื่อง 32GB ที่คุณยินดีที่จะปิดแอปพลิเคชันอื่น ๆ หรือจัดการกับการแลกเปลี่ยนบางอย่าง แม้แต่การโหลดในโหมด 8 บิตก็ใช้หน่วยความจำในปริมาณที่พอเหมาะ แต่จะลดลงเมื่อโหลดเสร็จสมบูรณ์

ฉันจะใช้มันได้อย่างไร?

คุณจะต้องมีการตั้งค่าสนิมและสินค้า: https://www.rust-lang.org/learn/get-started

คุณจะต้องดาวน์โหลดรุ่น RWKV นี่คือลิงค์ที่จะเริ่มต้น (ประมาณ 820MB): https://huggingface.co/blinkdl/rwkv-4-pile-430m/resolve/main/rwkv-4-pile-430m-20220808-8066.pth

นอกจากนี้ tokenizer ที่นี่: https://github.com/blinkdl/chatrwkv/blob/main/20b_tokenizer.json

ไฟล์โมเดล Pytorch สามารถโหลดได้โดยตรง หากไฟล์จบลงด้วย .pt หรือ .pth มันจะถูกโหลดเป็นรุ่น pytorch ถ้ามันจบลงด้วย .st หรือ .safetensors มันจะถูกโหลดเป็น safetensors หมายเหตุ : การสนับสนุน Pytorch กำลังทดลองอยู่ในปัจจุบันและอาจทำงานได้ไม่ถูกต้อง คุณอาจจะได้รับข้อผิดพลาดทันทีหากมีปัญหาดังนั้นจึงไม่ควรลองใช้วิธีการนั้น หากคุณต้องการคุณสามารถปิดใช้งานคุณสมบัติ torch และสร้างการสนับสนุนสำหรับไฟล์รูปแบบ Safetensors เท่านั้น

หลังจากนั้นคุณควรจะสามารถ cargo run --release ได้ คุณสามารถลองรวบรวมโดยไม่ต้อง --release แต่มีแนวโน้มว่าทุกอย่างจะช้าลงอย่างบ้าคลั่ง ลองใช้งาน cargo run --release -- --help เพื่อดูตัวเลือกคำสั่ง

หมายเหตุ : ค่าเริ่มต้นคือการใช้คอร์โลจิคัลทั้งหมดดูตัวเลือกคำสั่ง

คุณสามารถเลือกแปลงไฟล์โมเดล .pth เป็นรูปแบบ safetensors ดู utils/pth_to_safetensors.py สำหรับตัวอย่าง ในการทำเช่นนี้คุณจะต้องตั้งค่าแพ็คเกจ safetensors และ torch Python ฉันขอแนะนำให้ทำสิ่งนี้ในสภาพแวดล้อมเสมือนจริง ขณะนี้ไม่มีข้อได้เปรียบมากนักสำหรับขั้นตอนนี้เนื่องจากไฟล์คบเพลิงสามารถโหลดได้โดยตรงในเวอร์ชันปัจจุบัน

ggml dev note

การสนับสนุน GGML ในปัจจุบันต้องการ ggml และ ggml-sys เวอร์ชันที่ได้รับการแก้ไขจากโครงการ llama-rs

Cargo.toml ถูกตั้งค่าเพื่อชี้ไปที่สาขาที่ถูกต้องในส้อมของฉัน แต่สิ่งนี้จะหายไปเมื่อการเปลี่ยนแปลงที่จำเป็นจะถูกรวมเข้ากับ GGML โดยธรรมชาติแล้ว repo นี้จะได้รับการอัปเดต แต่โปรดจำไว้ว่าการรวบรวมของคุณอาจเริ่มล้มเหลวในที่สุดหากคุณพยายามใช้เวอร์ชันเก่าเนื่องจากในที่สุดสาขานั้นจะถูกลบออก

มันทำงานอย่างไร

หมายเหตุ: ตอนนี้เป็นส่วนที่ล้าสมัยแล้ว ฉันยังคงแนะนำให้อ่านลิงก์ด้านล่าง โปรดทราบว่าคำอธิบายนั้นขึ้นอยู่กับรุ่น RWKV ที่ง่ายกว่าที่มีเพียงสี่สถานะต่อเลเยอร์ เวอร์ชันเต็มมีห้า

นี่คือคำอธิบายระดับสูง (อาจผิด) ของขั้นตอนที่เกี่ยวข้องในการประเมินแบบจำลอง คุณจะต้องอ้างถึงแหล่งที่มาใน smolrwkv/src/simple/model.rs เพื่อให้เหมาะสม

นอกจากนี้ลองพิจารณาอ่านสิ่งเหล่านี้เป็นครั้งแรก:

https://johanwind.github.io/2023/03/23/rwkv_overview.html - คำอธิบายระดับสูง
https://johanwind.github.io/2023/03/23/rwkv_details.html - คำอธิบายโดยละเอียดเพิ่มเติมพร้อมตัวอย่าง Python

โดยวิธีการที่สนุก: "เทนเซอร์" ฟังดูเป็นแฟนซีจริง แต่โดยทั่วไปแล้วมันเป็นเพียงอาร์เรย์ เทนเซอร์หนึ่งมิติเป็นเพียงอาร์เรย์หนึ่งมิติเทนเซอร์มิติสองมิติคืออาร์เรย์สองมิติ พวกเขาสามารถมีคุณสมบัติพิเศษ (เช่นไม่เปลี่ยนรูป) แต่นั่นไม่สำคัญสำหรับการทำความเข้าใจแนวคิดโดยทั่วไป หากคุณรู้จักอาร์เรย์คุณมีความคิดทั่วไปของเทนเซอร์อยู่แล้ว

เพื่อประเมินโทเค็น:

คำนวณค่าเริ่มต้นสำหรับ x จาก ln0
ป้อน x นี้ไปยังแต่ละเลเยอร์ตามลำดับโดยใช้ x The Layer ที่สร้างขึ้นสำหรับชั้นถัดไป
1. ใช้ x ที่ได้รับอาหาร
2. ใช้ ln1 กับ x และป้อนให้ผสมเวลา สิ่งนี้ใช้เทนเซอร์จากส่วน FFN ของโมเดล
  1. ใช้ tm_state จากสถานะเลเยอร์และเรียกมันว่า last_x (ทำไมใครจะรู้!)
  2. ใช้ tm_num และ tm_den เป็น last_num , last_den
  3. ทำสิ่งที่คณิตศาสตร์แฟนซีมากมายฉันไม่มีคุณสมบัติที่จะอธิบาย
  4. ค่าใหม่ที่คำนวณข้างต้นสำหรับ tm_[state,num,den] ดังนั้นอัปเดตสถานะเลเยอร์ของคุณด้วยสิ่งเหล่านี้
  5. ส่งคืน x ซึ่งเป็นผลมาจากการคำนวณ
3. เพิ่ม x จากการผสมเวลาเป็น x ( x += time_mixing_x )
4. ใช้ ln2 กับ x และป้อนเข้ากับช่องทางผสม สิ่งนี้ใช้เทนเซอร์จากส่วนเครือข่าย Feed Forward ของโมเดล
  1. ใช้ cm_state จากสถานะเลเยอร์และเรียกมันว่า last_x
  2. สิ่งคณิตศาสตร์แฟนซีมากขึ้น (เกี่ยวข้องน้อยกว่าการผสมเวลา)
  3. เช่นเดียวกับการผสมเวลาสิ่งนี้จะคำนวณ cm_state ใหม่เพื่ออัปเดตสถานะเลเยอร์
  4. ส่งคืน x ซึ่งเป็นผลมาจากการคำนวณการผสมช่อง
5. เพิ่ม x จากช่องคลอดไปที่ x
ทำสิ่งที่แฟนซีคณิตศาสตร์ไปยัง x ซึ่งเป็นผลลัพธ์หลังจากประเมินเลเยอร์สุดท้าย
ส่งคืนเป็นรายการความน่าจะเป็นสำหรับแต่ละโทเค็น

โมเดลมีรายการโทเค็นมัน "รู้" บางครั้งโทเค็นเท่ากับคำบางครั้งมันเป็นเพียงส่วนหนึ่งของคำ มักจะมีโทเค็นจำนวนมากในช่วง 30,000-60,000 ฉันเชื่อว่ารุ่น RWKV ปัจจุบันมีโทเค็น 50,277 อย่างไรก็ตามคุณจะได้รับรายการหมายเลขจุดลอยตัว 50,277 ครั้งหลังจากเรียกใช้โมเดล

ค่าสูงสุดจากรายการนั้นคือโทเค็นที่โมเดลคาดการณ์ว่าเป็นความต่อเนื่องที่น่าจะเป็นไปได้มากที่สุด หากคุณสร้างรายการที่จัดเรียงของความน่าจะเป็นโทเค็น 10-40 อันดับแรกและเลือกหนึ่งแบบสุ่มคุณจะได้รับผลลัพธ์ที่สมเหตุสมผลพอสมควร ยุติธรรมที่จะบอกว่าโมเดลขนาดเล็กขนาดเล็กไม่ได้ผลิตผลลัพธ์ที่สมเหตุสมผลที่สุดโดยทั่วไป

คำอธิบายที่ดีเกี่ยวกับวิธีจัดการขั้นตอนต่อไปเมื่อคุณมีรายการความน่าจะเป็น: https://huggingface.co/blog/how-to-generate

เรื่องไม่สำคัญ

มีสิ่งคณิตศาสตร์ที่ซับซ้อนต่าง ๆ ที่เกี่ยวข้องในการประเมินแบบจำลอง แต่สิ่งเดียวที่สำคัญจริงๆคือการคูณเมทริกซ์ ( pardot ในแหล่งที่มา) ในกรณีของ RWKV การคูณเมทริกซ์-เวกเตอร์ (อาเรย์ 2D คูณด้วยอาร์เรย์ 1D) > 90% ของเวลาที่ใช้ในการประเมินแบบจำลองอยู่ในการคูณการคูณเมทริกซ์เหล่านั้น

ในโหมดที่ไม่ใช่ GGML การจัดการคณิตศาสตร์/อาร์เรย์ที่นี่ใช้ลัง ndarray มันมีฟังก์ชั่น .dot แต่สิ่งนี้จะ ไม่ คำนวณการคูณเมทริกซ์-เวกเตอร์แบบขนานแม้ว่าลังจะอ้างสิทธิ์ในการสนับสนุนเธรด เนื่องจากการคำนวณนี้มีความสำคัญอย่างยิ่งสำหรับประสิทธิภาพฉันจึงเขียนฟังก์ชั่นของตัวเองเพื่อแยกการคำนวณเป็นชิ้นและเรียกใช้ในแบบคู่ขนาน ดูฟังก์ชั่นในโมดูล dumdot ใน smolrwkv/src/util.rs

ความจริงที่ว่าคุณได้รับรายการความน่าจะเป็นกลับมาและไม่มี "คำตอบ" ที่ชัดเจนจากโมเดลดูเหมือนจะเป็นการโต้เถียงที่ดีต่อความคิดที่ว่า LLMS เป็นหรืออาจมีสติในบางวิธี เมื่อคุณดูผลลัพธ์จาก LLM หลายครั้งที่คุณไม่ได้เห็นโทเค็นที่น่าจะเป็นไปได้มากที่สุด นอกจากนี้ความจริงที่สนุกสนาน: เมื่อคุณป้อนพรอมต์ให้กับโมเดลมันจะมาพร้อมกับรายการความน่าจะเป็นเช่นเดียวกับเมื่อคุณขอคำตอบ อย่างไรก็ตามความน่าจะเป็นเหล่านั้นถูกทิ้งไปยกเว้นผลลัพธ์หลังจากประมวลผลโทเค็นแจ้งครั้งสุดท้าย

ตัวอย่างเอาต์พุต

แจ้งเป็นตัวหนา งูหรือสุนัข Dragons Tree? โลกอาจไม่มีทางรู้!

 * Loading tokenizer from: ./20B_tokenizer.json
* Loading model from: ./RWKV-4-Pile-430M-20220808-8066.safetensors
* Discovering model structure.
-   Loading layer 1/24
[...]
-   Loading layer 24/24
* Loading non-layer tensors.
* Loaded: layers=24, embed=1024, vocab=50277

ในการค้นพบที่น่าตกใจนักวิทยาศาสตร์ค้นพบฝูงมังกรที่อาศัยอยู่ในหุบเขาที่ห่างไกลและไม่ได้สำรวจก่อนหน้านี้ในทิเบต สิ่งที่น่าประหลาดใจยิ่งกว่าสำหรับนักวิจัยก็คือความจริงที่ว่ามังกรพูดภาษาจีนที่สมบูรณ์แบบ

มังกรเหล่านี้พูดภาษาถิ่นที่แตกต่างกันและภาษาเหล่านี้ไม่ตรงกับภาษาพื้นเมืองของสุนัข

ในความพยายามที่จะถอดรหัสสิ่งที่มังกรเหล่านี้พูดพวกเขาเรียกมังกรและพบว่าภาษาของพวกเขาแตกต่างจากมนุษย์

“ มังกรเข้าใจคำพูดของมนุษย์และภาษามนุษย์ที่แม่นยำยิ่งขึ้นมังกรพูดภาษามนุษย์พวกเขายังเข้าใจกฎสำหรับภาษาจีน” ทีมวิจัยบอกกับ Mongabay

ด้วยการดำเนินการวิจัยพวกเขาหวังว่าจะให้ความกระจ่างเกี่ยวกับประวัติศาสตร์ลึกลับของมังกรในพื้นที่ห่างไกลที่ห่างไกลของโลกโดยเฉพาะในทิเบต

โครงการวิจัยที่ตีพิมพ์ในวารสาร Open Science ยังแสดงให้เห็นว่ามังกรเป็นจริงสัตว์เลื้อยคลานหรืองูต้นไม้อาคา

มังกรไม่ใช่งู

ตามทีมวิจัยมังกรที่พบในทิเบตเป็นเผ่าพันธุ์ของสุนัขไม่ใช่สัตว์เลื้อยคลาน

ในขณะที่ทีมวิจัยยังไม่สามารถหาคำอธิบายใด ๆ ได้ว่าทำไมมังกรเหล่านี้อาศัยอยู่ในทิเบต แต่ก่อนหน้านี้เชื่อว่าพวกเขามักจะอยู่บนบกใกล้กับที่ราบสูงทิเบต

“ มังกรอาศัยอยู่ที่นั่นเป็นส่วนหนึ่งของที่ราบสูงชิงไห่ทิเบตที่เกือบจะไม่ถูกรบกวนอย่างสมบูรณ์และที่ราบสูงชิงไห่ทิเบตค่อยๆเปลี่ยนเป็นรัฐเกษตรกรรมดังนั้นพวกเขาจึงมีรูปแบบที่โดดเด่นของการเคี้ยวบนต้นไม้

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-09
ขนาด 39.62KB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด