Download do ngramModelTrainer - ngramModelTrainer Download do código -fonte

ngramModelTrainer

Código-Fonte de IA

1.0.0

Baixar

NGrammodelTrainer

Aprende um modelo de idioma n-gramas dado um corpus. O corpus deve ser um arquivo de texto, com uma única palavra por linha, não contendo espaços entre palavras.

As quantidades aprendidas são:

Probabilidades de Unigrams, P (G _I )
Probabilidades de bigrams, p (g _i | g _i-1 )
Probabilidades de TriGramas, P (G _I | G _I-1 , G _I-2 )

Testando e executando

Teste o script executando sem argumento:

 python3 ngramModelTrainer

Use o sinalizador -h para obter detalhes sobre como usar a ferramenta com entrada adequada:

 python3 ngramModelTrainer -h

Existem alguns exemplos de entradas nos fixtures/ .

A saída é salva como quatro matrizes MATLAB.

Unigrams: u (i) significa p (i).
bigrams: B (i, j) significa p (j | i).
TriGramas: t (i, j, k) significa p (k | j, i).
Quadgrams (tetragramas): q (i, j, k, l) significa p (l | k, j, i).

Alfabeto

É necessário definir um alfabeto de unigramas aceitáveis específicos. Por padrão, estamos usando um alfabeto de 36 letras/dígitos possíveis. Estes são mantidos em uma lista de Python chamada 'Alphabet', na seguinte ordem:

Posições 0-25: Letters de alfabetos minúsculos latinos, em ordem alfabética padrão.
Posições 26-35: dígitos 0-9.

Alfabetos 'alternativos'

As versões não-padrão do alfabeto acima podem ser usadas. Isso inclui: Dutta_extended : vários caracteres extras (são notavelmente codificações dos personagens e pontuação encontrados no conjunto de documentos manuscritos de George Washington). Sophia : Personagens Gregos Polonônicos. Dummy : um conjunto de testes limitado de 3 caracteres

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-09
tamanho 4.89MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos