Descargar ngramModelTrainer - Descargar el código fuente ngramModelTrainer

ngramModelTrainer

Código Fuente de IA

1.0.0

Descargar

ngrammodeltrainer

Aprende un modelo de lenguaje N-Gram dado un corpus. El corpus debe ser un archivo de texto, con una sola palabra por línea, que no contiene espacios entre palabras.

Las cantidades aprendidas son:

Probabilidades de Unigrams, P (G _I )
Probabilidades de Bigrams, P (G _I | G _I-1 )
Probabilidades de Trigrams, P (G _I | G _I-1 , G _I-2 )

Prueba y ejecución

Pruebe el script ejecutándose sin argumento:

 python3 ngramModelTrainer

Use el indicador -h para obtener detalles sobre cómo usar la herramienta con la entrada adecuada:

 python3 ngramModelTrainer -h

Hay algunas entradas de ejemplo en fixtures/ .

La salida se guarda como cuatro matrices MATLAB.

Unigrams: U (i) significa P (I).
Bigrams: B (I, J) significa P (J | I).
Trigrams: T (I, J, K) significa P (K | J, I).
Quadgrams (tetragrams): Q (I, J, K, L) significa P (L | K, J, I).

Alfabeto

Se requiere que se define un alfabeto de unigramas aceptables específicos. Por defecto, estamos utilizando un alfabeto de 36 letras/dígitos posibles. Estos se llevan a cabo en una lista de Python llamada 'Alphabet', en el siguiente orden:

Posiciones 0-25: letras del alfabeto en minúsculas latinas, en orden alfabético estándar.
Posiciones 26-35: dígitos 0-9.

Alfabetos 'alternativos'

Se pueden usar versiones no estándar del alfabeto anterior. Estos incluyen: DUTTA_EXTENDED : Varios caracteres adicionales (estos son notablemente codificaciones de los caracteres y la puntuación que se encuentran en el conjunto de documentos escritos a mano George Washington). Sophia : personajes griegos polytonic. Dummy : un conjunto de pruebas limitadas de 3 caracteres

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-09
tamaño 4.89MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo