Download do gLM - Download de código fonte gLM

gLM

Código-Fonte de IA

1.0.0

Baixar

GLM 0,4

GLM O modelo de linguagem baseado em GPU é uma implementação do modelo de idioma Ngram que recebe um arquivo ARPA como uma entrada, binariza -o e consulta -o em lote. Mais detalhes sobre o design e a implementação podem ser encontrados neste artigo, publicado na ACL 2016.

Construir

git clone https://github.com/XapaJIaMnu/gLM.git
cd gLM
mkdir release_build
cd release_build
cmake ..
make -j4
make test # Requires CUDA for GPU testing

Bandeiras de construção de cmake adicionais

-DBUILDTYPE=debug Builds com -o0 e -g
-DCOMPUTE_VER Defina a versão de computação do hardware. O padrão é 52. Não produzirá pontuações corretas se for compilado com uma versão de computação errada !!! Verifique a versão de computação da sua GPU aqui . Se make test não falhar nenhum dos testes da GPU, significa que sua versão de computação está correta.
-DBAD_HOST Isso deve ajudar a desenvolver sistemas mais antigos do Ubuntu, como 12.04 e 14.04. Não use, a menos que você tenha problemas para construir.
-DPYTHON_INCLUDE_DIR define o caminho para a biblioteca Python, como /usr/include/python2.7/pyconfig.h ou /usr/include/python3.6m/pyconfig e habilita a construção dos componentes do python.
-DPYTHON_VER está definido como padrão para 2.7 Se você deseja criar os componentes do Python com uma versão diferente, defina -o na versão desejada. Não teria efeito a menos que -DPYTHON_INCLUDE_DIR esteja definido.
--DYAMLCPP_DIR deve ser SE se o seu YAML-CPP estiver em um local não padrão (Standard Is /usr/incude ).

Binarize arquivos ARPA

 cd path_to_glm/release_build/bin
./binarize_v2 path_to_arpa_file output_path [btree_node_size]

btree_node_size deve ser um número ímpar. Pessoalmente, descobri que 31 funcionam melhor, mas você deve experimentar. O número pode variar com diferentes arquivos ARPA de tamanho e GPUs diferentes

Consulta em lote

Para comparar o GLM na configuração do lote:

 cd path_to_glm/release_build/bin
./batch_query_v2 path_to_binary_lm path_to_text_file [gpuDeviceID] [add_begin_end_markers]

Isso calculará a perplexidade de um arquivo de texto. Se o gpudeviceId estiver definido, ele informará a parte da GPU do código a ser executada em uma GPU específica. Você pode verificar as GPUs disponíveis em um sistema usando o comando nvidia_smi . 0 é um padrão seguro para ter se você deseja defini -lo. Se add_begin_end_markers estiver definido como 0, o início da frase e os tokens de final da frase (<s> e </s>) não cercarão todas as frases.

Resultados preliminares

Então ... tudo começou a correr corretamente. Uma referência (preliminar) contra Kenlm de sondagem de rosca única (Titan X vs Core i7 4720HQ)

LM	consultas de ngram por segundo	Informações do modelo
Kenlm	10 274 237	3.3G, 88720517 NGRAMS
Glm	65 459 102	3.3G, 88720517 NGRAMS

Benchmark multithread, a mesma GPU contra 2x Intel (R) Xeon (R) CPU E5-2680 0 @ 2.70GHz

LM	consultas de ngram por segundo	Informações do modelo
Kenlm 1 thread	8 310 761	3.3G, 88720517 NGRAMS
Thread Kenlm 2	15 823 376	3.3G, 88720517 NGRAMS
Kenlm 4 Thread	27 201 337	3.3G, 88720517 NGRAMS
Kenlm 8 Thread	43 336 444	3.3G, 88720517 NGRAMS
Kenlm 16 Thread	49 218 076	3.3G, 88720517 NGRAMS
Kenlm 32 Thread	119 539 677	3.3G, 88720517 NGRAMS
Glm	65 459 102	3.3G, 88720517 NGRAMS

O problema de agendamento provavelmente causa o baixo desempenho em 16 estojos. O GLM alcança 2 vezes melhor desempenho em relação ao custo do hardware. (US $ 1000 para a GPU vs $ 3500 para as CPUs)

Changelog

Versão 0.1
- Liberação inicial.
Versão 0.2
- Reescreva completamente o algoritmo de construção do BTREE para torná -lo mais rápido, determinístico e também produzindo Btrees melhores e mais regulares.
- O primeiro nível de trie agora é uma matriz.
- O desempenho melhorou ~ 2x em comparação com a versão anterior.
Versão 0.3
- Exemplo de exportação Python ligações do LM.
Versão 0.4
- Corrija um problema raro que causaria acidentes ou ngrams incorretos com alguns pequenos conjuntos de dados.
- Forneceu uma classe GPusearcher adequada (consulte a GPU/GPU_SEARCH_V2.HH) que simplifica a consulta do LM.
- Permita que as probabilidades e as probabilidades de log sejam devolvidas ao consultar.
- Classe C ++ Fakernn a ser usada para integração dentro de alguns kits de ferramentas neuralmt.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-09
tamanho 365.72KB
Vindo de Github

Aplicativos Relacionados

GLM 4 Voice

2024-11-02

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos