Um irmão que codifica com você



Por que sempre Python? Vamos Finetune, um modelo de geração de código apenas para TypeScript!
Criei um conjunto de dados de instrução de texto datilografado 20K. São 20.000 pares de {Instrução, saída} que você não consegue encontrar em nenhum conjunto de dados atual de geração de código LLMS (ou talvez você possa)

Para a saída, obrigado Huggingface, eu recebo dados de código TypeScript do projeto de pilha
Para a instrução, obrigado OpenAI, fiz uma solicitação de chamada de API 20K para gerar instruções e explicações para esses dados de código
Todas as outras coisas sobre treinamento (parâmetros, logs, ...) você pode vê -lo aqui (vincular as métricas de treinamento do Huggingface mais tarde)
Eu uso o benchmark multipl-e (Cassano et al., 2023), assim como o código do modelo básico que está usando em seu artigo
(Link a tabela de resultados da avaliação posterior)
Você pode encontrar meus trabalhos aqui:
Ou entre em contato comigo aqui: https://levuminhhuy.site/about