Title Generator with LLM PEFT
1.0.0
[ATUALIZAÇÃO]: Llama2 de ajuste fino com Qlora será adicionado em breve!
Este projeto tem como objetivo gerar um título a partir do resumo fornecido para artigos acadêmicos. Os modelos foram ajustados com PEFT usando o conjunto de dados ARXIV. Dois modelos diferentes foram ajustados com Lora (Hu et al., 2021). Somente artigos na categoria de ciência da computação foram selecionados no conjunto de dados ARXIV . Esse número também foi reduzido devido à memória e aos limites de tempo. Os modelos ajustados estão disponíveis nos espaços Huggingface:
O projeto inclui:
Rouge ScoreBibliotecas e pacotes externos:
Parâmetros de treinamento e limitações
R=8 , alpha=64 , dropout=0.01 , learning rate=2e-4 , paged_adamW_32bit optimizer | Título original | Título gerado | |
|---|---|---|
| 1 | Circuitos quânticos para sistemas quânticos fortemente correlacionados | Simulação quântica de hamiltonianos fortemente correlacionados |
| 2 | Teko: redes neurais gráficas ricas em texto com conhecimento externo | Redes de gráficos ricos em texto com conhecimento externo |
| 3 | Carga: armazenamento compactado e efetivo de informações genômicas | Carga: Arquivamento comprimido para genômica |
| 4 | Controle de energia eficiente em termos de energia da comunicação de mmwave do solo de trem para | Eficiência energética da comunicação de mmwave do solo de trem para trens de alta velocidade |
| 5 | Uma pesquisa sobre preconceitos na pesquisa de aprendizado de máquina | Compreendendo as fontes e conseqüências do viés no aprendizado de máquina |
| 6 | SA-Unet: Atenção espacial U-Net para segmentação de vasos da retina | Atenção espacial U-net: atenção espacial para doenças relacionadas aos olhos |
| 7 | Um novo algoritmo heurístico para segmentação rápida | Um novo algoritmo heurístico para segmentação K |
| 8 | Progressão e desafios da IoT na assistência médica: uma breve revisão | Smart Healthcare and Healthcare: uma análise comparativa de cuidados de saúde e segurança inteligentes |
| 9 | FVC: uma nova estrutura para compressão de vídeo profunda no espaço de recursos | Compressão de vídeo em espaço de recurso para codificação de vídeo baseada em aprendizado |
Perda de treinamento/teste de Bart (6 épocas)
T5 Treinamento/perda de teste (6 épocas)