Ce référentiel contient toutes les ressources pour l'atelier d'apprentissage des machines appliquée Rencontrez votre moi artificiel: générer du texte qui vous ressemble.
Dans cet atelier, les participants sont chargés de télécharger leurs propres journaux de chat et de créer un bot de discussion qui génère du texte similaire à leur écriture. Comme alternative à l'utilisation de journaux de chat, nous fournissons un certain nombre d'autres ensembles de données conversationnels (et non conversationnels) dans ce référentiel.
N'hésitez pas à rejoindre notre gitter pendant l'atelier:
Trouvez les diapositives d'atelier ici.
L'atelier est divisé en 3 tâches. Vous pouvez exécuter chaque tâche localement (en clonage ce référentiel) ou en exécutant le cahier Colab (voir les liens ci-dessous). Si vous exécutez localement, assurez-vous d'avoir accès à GPU et vous exécutez Python 3.6+ (assurez-vous également d'avoir suffisamment d'espace de stockage). Des instructions plus détaillées sont fournies dans les différents sous-dossiers.
Fine-tune GPT-2 sur divers ensembles de données (y compris les tweets, la poésie, le code de programmation, les échecs, la musique et plus encore!). Merci à @manueth d'avoir compilé les ensembles de données!
➡️ En savoir plus
Nous utilisons la même approche de transfert de style pour former un modèle conversationnel à partir de nos journaux de chat. Vous pouvez soit utiliser des chats pour analyser vos propres journaux de chat, soit utiliser certaines des ressources fournies. Merci à @masterscrat d'avoir compilé les ensembles de données conversationnels!
➡️ En savoir plus
Nous étendons l'approche dans la tâche 2 en introduisant l'apprentissage multi-tâches, en améliorant le prétraitement des données et en ajoutant des types de jetons.
➡️ En savoir plus