Un hermano que codifica contigo



¿Por qué siempre Python? ¡Finetunemos un modelo de generación de código solo para TypeScript!
Creé un conjunto de datos TypeScript-Instructo 20K. Son 20,000 pares de {instrucción, salida} que no puede encontrar en ningún conjunto de datos LLMS de generación de código actual (o tal vez pueda)

Para la salida, gracias a Huggingface, obtengo datos de código TypeScript del proyecto Stack
Por la instrucción, gracias OpenAi, hice una solicitud de llamadas de API de 20k para generar instrucción y explicación de esos datos de código
Cualquier otra cosa sobre el entrenamiento (parámetros, registros, ...) Puede verlo aquí (enlace el enlace de métricas de entrenamiento Huggingface más tarde)
Utilizo el punto de referencia multiplicado (Cassano et al., 2023) al igual que el Llama del código base que usa en su papel
(Enlace la tabla de resultados de evaluación más tarde)
Puedes encontrar mis obras aquí:
O contácteme aquí: https://levuminhhuy.site/about