Dieses Repository enthält alle Ressourcen für den Workshop für angewandte maschinelle Lernen von Maschinenlerntagen Treffen Sie Ihr künstliches Selbst: Generieren Sie Text, der wie Sie klingt.
In diesem Workshop haben die Teilnehmer die Aufgabe, ihre eigenen Chat -Protokolle herunterzuladen und einen Chat -Bot zu erstellen, der Texte ähnelt, das ihrem Schreiben ähnelt. Als Alternative zur Verwendung von Chat-Protokollen stellen wir in diesem Repository eine Reihe anderer Konversationsdatensätze (und nicht-konversiatorischer Datensätze) an.
Fühlen Sie sich frei, während des Workshops unserem Gitter beizutreten:
Hier finden Sie die Workshop -Folien.
Der Workshop ist in 3 Aufgaben geteilt. Sie können jede Aufgabe lokal ausführen (indem Sie dieses Repository klonen) oder das Colab -Notizbuch (siehe Links unten). Wenn Sie lokal laufen, stellen Sie sicher, dass Sie Zugriff auf GPU (s) haben und Python 3.6+ ausführen (stellen Sie auch sicher, dass Sie über ausreichende Speicherplatz verfügen). In den verschiedenen Unterordnern werden detailliertere Anweisungen angegeben.
Fine-Tune GPT-2 auf verschiedenen Datensätzen (einschließlich Tweets, Gedichten, Programmiercode, Schach, Musik und mehr!). Vielen Dank an @ManUeth für das Zusammenstellen der Datensätze!
➡️ Lesen Sie mehr
Wir verwenden den gleichen Ansatz des Stiltransfers, um ein Konversationsmodell aus unseren Chat -Protokollen zu trainieren. Sie können entweder Chatistics verwenden, um Ihre eigenen Chat -Protokolle zu analysieren, oder Sie können einige der bereitgestellten Ressourcen verwenden. Vielen Dank an @masterscrat für das Zusammenstellen der Konversationsdatensätze!
➡️ Lesen Sie mehr
Wir erweitern den Ansatz in Aufgabe 2, indem wir das Lernen von Multitaskieren einführen, die Datenvorverarbeitung verbessern und Token-Typen hinzufügen.
➡️ Lesen Sie mehr