Téléchargement neural ngram - Téléchargement du code source neural ngram

neural ngram

Code Source AI

1.0.0

Télécharger

Modèle de langue ngram neurale

Une mise en œuvre pytorch d'un modèle de langue probabiliste neuronale. Code pour la formation et le chargement des données basés sur le modèle de langage de niveau de mot Exemple de pytorch.

Installation

Pour obtenir l'ensemble de données wikitext-2, exécutez:

./get-data.sh

Usage

Un exemple de niveau de mot:

./main.py train --name wiki --order 5 --batch-size 32

Un exemple au niveau des caractères:

./main.py train --name wiki-char --use-char --order 12 --emb-dim 20 --batch-size 1024

Si vous avez des vecteurs à gants pré-entraînés, vous pouvez les utiliser:

./main.py train --name wiki --use-glove --glove-dir your/glove/dir --emb-dim 50

Certains autres arguments de données sont:

--lower        # Lowercase all words in training data.
--no-headers   # Remove all headers such as `=== History ===`.

Vitesse et perplexité

Avec les arguments suivants, une époque prend environ 45 minutes:

./main.py train --name wiki --order 5 --use-glove --emb-dim 50 --hidden-dims 100 
    --batch-size 128 --epochs 10   # Test perplexity 224.89

perte

Nous pouvons explorer les limites:

./main.py train --name wiki --order 13 --emb-dim 100 --hidden-dims 500 
    --epochs 40 --batch-size 512 --dropout 0.5   # Test perplexity 153.12

perte

./main.py train --name wiki --order 13 --emb-dim 300 --hidden-dims 1400 
    --epochs 40 --batch-size 256 --dropout 0.65   # Test perplexity 152.64

perte

Générer du texte

Pour générer du texte, utilisez:

./main.py generate --checkpoint path/to/saved/model

Le jeton <eos> est remplacé par une nouvelle ligne, et le reste est imprimé tel quel.

Les autres arguments de génération sont:

--temperature 0.9   # Temperature to manipulate distribution.
--start             # Provide an optional start of the generated text (can be longer than order)
--no-unk            # Do not generate unks, especially useful for low --temperature.
--no-sos            # Do not print <sos> tokens

Voir un texte généré dans generate.txt.

Tracer des intégres

Pour visualiser les intérêts entraînés du modèle, utilisez:

./main.py plot --checkpoint path/to/saved/model

Cela correspond à un tracé T-SNE 2D avec la coloration du cluster K-means des 1000 mots les plus courants dans l'ensemble de données. Le Bokeh nécessite le complot et le scikit-apprentissage pour T-SNE et K-Means.

Voir un exemple HTML ici. (GitHub ne rend pas les fichiers HTML. Pour rendre, télécharger et ouvrir ou utiliser ce lien.)

Exigences

 python>=3.6
torch==0.3.0.post4
numpy
tqdm

FAIRE

Convertir en torch4
Génération de texte par échantillonnage.
Tracer des incorporations avec T-SNE
Perplexité pour l'entrée de l'utilisateur.
Approximation SoftMax.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-18
taille 419.45KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Version Android du Cloud neuronal

2022-11-24

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout