Este repositorio contiene todos los recursos para el taller de días de aprendizaje automático aplicado para cumplir con su ser artificial: genere texto que suene como usted.
En este taller, los participantes tienen la tarea de descargar sus propios registros de chat y construir un bot de chat que genere texto similar a su escritura. Como alternativa al uso de registros de chat, proporcionamos una serie de otros conjuntos de datos conversacionales (y no conversacionales) en este repositorio.
Siéntase libre de unirse a nuestro Gitter durante el taller:
Encuentra las diapositivas del taller aquí.
El taller se divide en 3 tareas. Puede ejecutar cada tarea localmente (clonando este repositorio) o ejecutando el cuaderno Colab (consulte los enlaces a continuación). Si ejecuta localmente, asegúrese de tener acceso a GPU (s) y está ejecutando Python 3.6+ (también asegúrese de tener suficiente espacio de almacenamiento). Se proporcionan instrucciones más detalladas en las diferentes subcarpetas.
Fine-tune GPT-2 en varios conjuntos de datos (¡incluidos tweets, poesía, código de programación, ajedrez, música y más!). ¡Gracias a @Manueth por compilar los conjuntos de datos!
➡️ Leer más
Utilizamos el mismo enfoque de transferencia de estilo para entrenar un modelo de conversación de nuestros registros de chat. Puede usar chatística para analizar sus propios registros de chat o puede usar algunos de los recursos proporcionados. ¡Gracias a @Masterscrat por compilar los conjuntos de datos de conversación!
➡️ Leer más
Extendemos el enfoque en la Tarea 2 introduciendo el aprendizaje de varias tareas, mejorando el preprocesamiento de datos y agregando tipos de token.
➡️ Leer más