Descarga neural ngram - Descargar código fuente de neural ngram

neural ngram

Código Fuente de IA

1.0.0

Descargar

Modelo de lenguaje ngram neural

Una implementación de Pytorch de un modelo de lenguaje probabilístico neural. Código para capacitación y carga de datos basado en el modelo de lenguaje de nivel de palabras de ejemplo de Pytorch.

Configuración

Para obtener el conjunto de datos Wikitext-2, ejecute:

./get-data.sh

Uso

Un ejemplo de nivel de palabra:

./main.py train --name wiki --order 5 --batch-size 32

Un ejemplo de nivel de personaje:

./main.py train --name wiki-char --use-char --order 12 --emb-dim 20 --batch-size 1024

Si tiene vectores de guantes previos al estado de entrenamiento, puede usarlos:

./main.py train --name wiki --use-glove --glove-dir your/glove/dir --emb-dim 50

Algunos otros argumentos de datos son:

--lower        # Lowercase all words in training data.
--no-headers   # Remove all headers such as `=== History ===`.

Velocidad y perplejidad

Con los siguientes argumentos, una época toma alrededor de 45 minutos:

./main.py train --name wiki --order 5 --use-glove --emb-dim 50 --hidden-dims 100 
    --batch-size 128 --epochs 10   # Test perplexity 224.89

pérdida

Podemos explorar los límites:

./main.py train --name wiki --order 13 --emb-dim 100 --hidden-dims 500 
    --epochs 40 --batch-size 512 --dropout 0.5   # Test perplexity 153.12

pérdida

./main.py train --name wiki --order 13 --emb-dim 300 --hidden-dims 1400 
    --epochs 40 --batch-size 256 --dropout 0.65   # Test perplexity 152.64

pérdida

Generar texto

Para generar texto, use:

./main.py generate --checkpoint path/to/saved/model

El token <eos> se reemplaza con una nueva línea, y el resto se imprime como está.

Otros argumentos de generación son:

--temperature 0.9   # Temperature to manipulate distribution.
--start             # Provide an optional start of the generated text (can be longer than order)
--no-unk            # Do not generate unks, especially useful for low --temperature.
--no-sos            # Do not print <sos> tokens

Ver algún texto generado en Generate.txt.

Incrustaciones de la trama

Para visualizar los incrustaciones entrenadas del modelo, use:

./main.py plot --checkpoint path/to/saved/model

Esto se ajusta a una trama 2D T-SNE con coloración de clúster K-means de las 1000 palabras más comunes en el conjunto de datos. Requiere Bokeh para trazar y Scikit-Learn para T-SNE y K-Means.

Vea un ejemplo HTML aquí. (GitHub no representa archivos HTML. Para renderizar, descargar y abrir, o usar este enlace).

Requisitos

 python>=3.6
torch==0.3.0.post4
numpy
tqdm

HACER

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-18
tamaño 419.45KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Versión de Android de nube neuronal

2022-11-24

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo