scaling laws for language transfer
1.0.0
Código y modelos de las leyes de escala de publicación de blog para el aprendizaje de transferencia de idiomas
Sobre la base del trabajo de las leyes de escala para la transferencia (Hernández et. Al. 2021), mis experimentos se centraron en explorar las relaciones entre el ajuste fino en los idiomas que no son del inglés y tratando de responder a la pregunta: ¿cuánto ayuda previa al inglés al transferir diferentes idiomas a medida que variamos el tamaño del conjunto de datos y el tamaño del modelo?
Este repositorio contiene el código para:
Todos los modelos previamente capacitados en inglés fueron entrenados para 26 mil millones de tokens sin repeticiones: