Ce repo contient des tutoriels couvrant la compréhension et la mise en œuvre de modèles de classification de séquence à l'aide de Pytorch, avec Python 3.9. Plus précisément, nous allons entraîner des modèles pour prédire le sentiment des critiques de films.
Si vous trouvez des erreurs ou en désaccord avec l'une des explications, n'hésitez pas à soumettre un problème. Je salue tout commentaire, positif ou négatif!
Installez les dépendances requises avec: pip install -r requirements.txt --upgrade .
1 - Sac neuronal de mots
Ce tutoriel couvre le flux de travail d'un projet de classification de séquence avec Pytorch. Nous couvrirons les bases de la classification des séquences à l'aide d'un modèle simple mais efficace des mots neuronaux, et comment utiliser les ensembles de données / libaires TorchText pour simplifier le chargement / le prétraitement des données.
2 - Réseaux de neurones récurrents
Maintenant, nous avons le flux de travail de classification des séquences de base couvert, ce tutoriel se concentrera sur l'amélioration de nos résultats en passant à un modèle de réseau neuronal récurrent (RNN). Nous couvrirons la théorie derrière les RNN et examinerons une implémentation de la mémoire à court terme à court terme (LSTM) RNN, l'une des variantes les plus courantes de RNN.
3 - Réseaux de neurones convolutionnels
Ensuite, nous couvrirons les réseaux de neurones convolutionnels (CNNS) pour l'analyse des sentiments. Ce modèle sera une mise en œuvre de réseaux de neurones convolutionnels pour la classification des phrases.
4 - Transformers
Enfin, nous allons montrer comment utiliser la bibliothèque Transformers pour charger un modèle de transformateur pré-formé, en particulier le modèle Bert de cet article, et l'utiliser pour la classification des séquences.
Les versions précédentes de ces tutoriels ont utilisé des fonctionnalités de la bibliothèque TorchText qui ne sont plus disponibles. Ceux-ci sont stockés dans le répertoire hérité.
Voici quelques choses que j'ai regardées en faisant ces tutoriels. Une partie peut être obsolète.