gLM下載 - gLM源代碼下載

gLM

Ai源碼

1.0.0

下載

GLM 0.4

GLM基於GPU的語言模型是NGRAM語言模型實現，該模型實現將ARPA文件作為輸入，對其進行二進制並批次查詢。有關設計和實施的更多詳細信息，請參見本文，該論文在ACL 2016上發布。

建造

git clone https://github.com/XapaJIaMnu/gLM.git
cd gLM
mkdir release_build
cd release_build
cmake ..
make -j4
make test # Requires CUDA for GPU testing

其他CMAKE構建標誌

-DBUILDTYPE=debug用-o0和-g構建
-DCOMPUTE_VER設置硬件的計算版本。默認值為52。如果編譯錯誤的計算版本，它將不會產生正確的分數！！！在此處查看GPU的計算版本。如果make test不會失敗任何GPU測試，則意味著您的計算版本是正確的。
-DBAD_HOST這應該有助於建立在舊的Ubuntu系統（例如12.04和14.04）上。除非構建困難，否則不要使用它。
-DPYTHON_INCLUDE_DIR定義了python庫的路徑，例如/usr/include/python2.7/pyconfig.h or /usr/include/python3.6m/pyconfig include/python3.6m/pyconfig，並啟用構建Python組件。
-DPYTHON_VER設置為默認為2.7，如果要構建具有不同版本的Python組件，請將其設置為所需的版本。除非設置-DPYTHON_INCLUDE_DIR ，否則它將沒有效果。
- 如果您的yaml-cpp位於非標準位置（標準為/usr/incude ），則應為--DYAMLCPP_DIR 。

二進制ARPA文件

 cd path_to_glm/release_build/bin
./binarize_v2 path_to_arpa_file output_path [btree_node_size]

btree_node_size應該是一個奇數。我個人發現31條效果最好，但是您應該進行實驗。該數字可能會隨不同大小的ARPA文件和不同的GPU而變化

批次查詢

在批處理設置中基準GLM進行：

 cd path_to_glm/release_build/bin
./batch_query_v2 path_to_binary_lm path_to_text_file [gpuDeviceID] [add_begin_end_markers]

這將計算文本文件的困惑。如果設置了GPudeViceID ，它將告訴代碼的GPU部分將在特定的GPU上執行。您可以使用nvidia_smi命令檢查系統上的可用GPU。如果要設置0是安全默認值。如果add_begin_end_markers設置為0，則句子的開始和句子的結尾（<s>和</s>）不會包圍每個句子。

初步結果

所以...一切都開始正確運行。 A（初步）基準對單線探測Kenlm（Titan X vs Core i7 4720HQ）

LM	ngram查詢每秒	型號信息
肯爾姆	10 274 237	3.3G，88720517 ngrams
Glm	65 459 102	3.3G，88720517 ngrams

多線程基準，相同的GPU與2x Intel（R）Xeon（R）CPU E5-2680 0 @ 2.70GHz

LM	ngram查詢每秒	型號信息
Kenlm 1線程	8 310 761	3.3G，88720517 ngrams
Kenlm 2線程	15 823 376	3.3G，88720517 ngrams
Kenlm 4線程	27 201 337	3.3G，88720517 ngrams
Kenlm 8線程	43 336 444	3.3G，88720517 ngrams
Kenlm 16線程	49 218 076	3.3G，88720517 ngrams
Kenlm 32線	119 539 677	3.3G，88720517 ngrams
Glm	65 459 102	3.3G，88720517 ngrams

調度問題可能會導致16個線程案例的性能較低。 GLM相對於硬件的成本，其性能提高了2倍。（GPU $ 1000，CPU $ 3500）

ChangElog

版本0.1
- 初始版本。
版本0.2
- 完全重寫了BTREE Construction算法，以使其更快，確定性並產生更好，更常規的BTREES。
- 第一個Trie級別現在是一個數組。
- 與先前的版本相比，性能提高了約2倍。
版本0.3
- LM的導出示例Python結合。
版本0.4
- 修復一個罕見的問題，該問題會導致一些小數據集崩潰或不正確的NGRAM。
- 提供了一個適當的GPUSEARCHER類（查看GPU/GPU_SEARCH_V2.HH），可簡化查詢LM。
- 查詢時允許返回概率和日誌概率。
- C ++ Fakernn類用於某些神經工具包中的集成。

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-09-09
大小 365.72KB
來自於 Github

相關應用

GLM 4 Voice

2024-11-02

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部