ดาวน์โหลด gLM - ดาวน์โหลดซอร์สโค้ด gLM

gLM

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

GLM 0.4

GLM โมเดลภาษาที่ใช้ GPU คือการใช้แบบจำลองภาษา NGRAM ที่ใช้ในไฟล์ ARPA เป็นอินพุต, binarizes และสอบถามในชุด รายละเอียดเพิ่มเติมเกี่ยวกับการออกแบบและการใช้งานสามารถพบได้ในบทความนี้เผยแพร่ที่ ACL 2016

สร้าง

git clone https://github.com/XapaJIaMnu/gLM.git
cd gLM
mkdir release_build
cd release_build
cmake ..
make -j4
make test # Requires CUDA for GPU testing

CMake Build Flags เพิ่มเติม

-DBUILDTYPE=debug สร้างด้วย -O0 และ -G
-DCOMPUTE_VER ตั้งค่าเวอร์ชันการคำนวณของฮาร์ดแวร์ ค่าเริ่มต้นคือ 52 มันจะไม่สร้างคะแนนที่ถูกต้องหากรวบรวมด้วยเวอร์ชันการคำนวณที่ไม่ถูกต้อง !!! ตรวจสอบเวอร์ชันคำนวณของ GPU ของคุณที่นี่ หาก make test ไม่ล้มเหลวในการทดสอบ GPU หมายความว่าเวอร์ชันการคำนวณของคุณถูกต้อง
-DBAD_HOST สิ่งนี้จะช่วยสร้างระบบ Ubuntu รุ่นเก่าเช่น 12.04 และ 14.04 อย่าใช้มันเว้นแต่คุณจะมีปัญหาในการสร้าง
-DPYTHON_INCLUDE_DIR กำหนดเส้นทางไปยังไลบรารี Python เช่น /usr/include/python2.7/pyconfig.h หรือ /usr/include/python3.6m/pyconfig และสามารถสร้างส่วนประกอบ Python
-DPYTHON_VER ถูกตั้งค่าเป็นค่าเริ่มต้นเป็น 2.7 หากคุณต้องการสร้างส่วนประกอบ Python ด้วยเวอร์ชันอื่นตั้งค่าเป็นเวอร์ชันที่คุณต้องการ มันจะไม่มีผลเว้นแต่ -DPYTHON_INCLUDE_DIR ถูกตั้งค่า
--DYAMLCPP_DIR ควรเป็น SE ถ้า YAML-CPP ของคุณอยู่ในตำแหน่งที่ไม่ใช่มาตรฐาน (มาตรฐานคือ /usr/incude )

Binarize ARPA ไฟล์

 cd path_to_glm/release_build/bin
./binarize_v2 path_to_arpa_file output_path [btree_node_size]

btree_node_size ควรเป็นเลขคี่ โดยส่วนตัวฉันพบว่า 31 ทำงานได้ดีที่สุด แต่คุณควรทดลอง จำนวนอาจแตกต่างกันไปตามไฟล์ ARPA ขนาดที่แตกต่างกันและ GPU ที่แตกต่างกัน

แบบสอบถามแบตช์

เพื่อมาตรฐาน GLM ในการตั้งค่าแบทช์ทำ:

 cd path_to_glm/release_build/bin
./batch_query_v2 path_to_binary_lm path_to_text_file [gpuDeviceID] [add_begin_end_markers]

สิ่งนี้จะคำนวณความงุนงงของไฟล์ข้อความ หากตั้งค่า gpudeviceId มันจะบอกส่วน GPU ของรหัสที่จะดำเนินการใน GPU เฉพาะ คุณสามารถตรวจสอบ GPU ที่มีอยู่ในระบบโดยใช้คำสั่ง nvidia_smi 0 เป็นค่าเริ่มต้นที่ปลอดภัยหากคุณต้องการตั้งค่า หาก ADD_BEGIN_END_MARKERS ถูกตั้งค่าเป็น 0 การเริ่มต้นของประโยคและจุดสิ้นสุดของโทเค็นประโยค (<S> และ </s>) จะไม่ล้อมรอบทุกประโยค

ผลลัพธ์เบื้องต้น

ดังนั้น ... ทุกอย่างเริ่มทำงานอย่างถูกต้อง มาตรฐาน (เบื้องต้น) กับการตรวจสอบเกลียวเดี่ยว Kenlm (Titan X VS Core i7 4720HQ)

LM	การสอบถาม NGRAM ต่อวินาที	ข้อมูลรุ่น
เคนลม์	10 274 237	3.3G, 88720517 NGRAMS
GLM	65 459 102	3.3G, 88720517 NGRAMS

เกณฑ์มาตรฐานแบบมัลติเธรด, GPU เดียวกันกับ 2x Intel (R) Xeon (R) CPU E5-2680 0 @ 2.70GHz

LM	การสอบถาม NGRAM ต่อวินาที	ข้อมูลรุ่น
Kenlm 1 เธรด	8 310 761	3.3G, 88720517 NGRAMS
Kenlm 2 เธรด	15 823 376	3.3G, 88720517 NGRAMS
Kenlm 4 เธรด	27 201 337	3.3G, 88720517 NGRAMS
Kenlm 8 เธรด	43 336 444	3.3G, 88720517 NGRAMS
Kenlm 16 เธรด	49 218 076	3.3G, 88720517 NGRAMS
Kenlm 32 เธรด	119 539 677	3.3G, 88720517 NGRAMS
GLM	65 459 102	3.3G, 88720517 NGRAMS

ปัญหาการกำหนดเวลาน่าจะทำให้ประสิทธิภาพต่ำในกรณีเธรด 16 ตัว GLM บรรลุประสิทธิภาพที่ดีขึ้น 2 เท่าเมื่อเทียบกับค่าใช้จ่ายของฮาร์ดแวร์ ($ 1,000 สำหรับ GPU เทียบกับ $ 3500 สำหรับ CPU)

การเปลี่ยนแปลง

เวอร์ชัน 0.1
- การเปิดตัวครั้งแรก
เวอร์ชัน 0.2
- เขียนอัลกอริทึมการก่อสร้าง btree ใหม่อย่างสมบูรณ์เพื่อให้เร็วขึ้นกำหนดและสร้าง btrees ที่ดีขึ้นและปกติมากขึ้น
- ระดับ Trie แรกตอนนี้เป็นอาร์เรย์
- ประสิทธิภาพดีขึ้น ~ 2x เมื่อเทียบกับรุ่นก่อนหน้า
เวอร์ชัน 0.3
- ตัวอย่างการส่งออกการผูก Python ของ LM
เวอร์ชัน 0.4
- แก้ไขปัญหาที่หายากซึ่งจะทำให้เกิดการล่มหรือ ngrams ที่ไม่ถูกต้องด้วยชุดข้อมูลขนาดเล็ก
- ให้คลาส GPUSECHER ที่เหมาะสม (ดูที่ GPU/GPU_SEARCH_V2.HH) ที่ทำให้การสอบถาม LM ง่ายขึ้น
- อนุญาตให้ทั้งความน่าจะเป็นและความน่าจะเป็นบันทึกจะถูกส่งคืนเมื่อสอบถาม
- คลาส C ++ Fakernn ที่จะใช้สำหรับการรวมภายในชุดเครื่องมือ NeuralMT บางชุด

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-09
ขนาด 365.72KB
มาจาก Github

แอปที่เกี่ยวข้อง

GLM 4 Voice

2024-11-02

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด