Title Generator with LLM PEFT
1.0.0
[ACTUALIZACIÓN]: ¡pronto se agregará Llama2 con Qlora!
Este proyecto tiene como objetivo generar un título del resumen dado para artículos académicos. Los modelos se sintonizaron con PEFT utilizando el conjunto de datos ARXIV. Se sintonizaron dos modelos diferentes con Lora (Hu et al., 2021). Solo se seleccionaron artículos en la categoría de informática en el conjunto de datos ARXIV . Este número también se ha reducido debido a los límites de memoria y tiempo. Los modelos ajustados están disponibles a través de espacios Huggingface:
El proyecto incluye:
Rouge ScoreBibliotecas y paquetes externas:
Parámetros y limitaciones de entrenamiento
R=8 , alpha=64 , dropout=0.01 , learning rate=2e-4 , paged_adamW_32bit optimizer | Título original | Título generado | |
|---|---|---|
| 1 | Circuitos cuánticos para sistemas cuánticos fuertemente correlacionados | Simulación cuántica de hamiltonianos de muchos cuerpos fuertemente correlacionados |
| 2 | Teko: redes neuronales gráficas ricas en texto con conocimiento externo | Redes neuronales gráficas ricas en texto con conocimiento externo |
| 3 | Cargo: almacenamiento comprimido de información genómica sin formato efectivo | Cargo: Archivado comprimido para la genómica |
| 4 | Control de energía de eficiencia energética de la comunicación de MMWAVE en tren para | Eficiencia energética de la comunicación de MMWave en el campo de tren para trenes de alta velocidad |
| 5 | Una encuesta sobre sesgo en la investigación del aprendizaje automático | Comprender las fuentes y las consecuencias del sesgo en el aprendizaje automático |
| 6 | SA-Unet: Atención en U-Net espacial para la segmentación de los vasos retinianos | Atención espacial U-Net: atención espacial para enfermedades relacionadas con los ojos |
| 7 | Un nuevo algoritmo heurístico para la segmentación K rápida | Un nuevo algoritmo heurístico para la segmentación K |
| 8 | Progresión y desafíos de IoT en la atención médica: una breve revisión | Smart Healthcare and Healthcare: un análisis comparativo de la salud y la seguridad inteligentes |
| 9 | FVC: un nuevo marco hacia una compresión de video profunda en el espacio de funciones | Compresión de video-espacio-espacio para la codificación de video basada en el aprendizaje |
Pérdida de entrenamiento/prueba de BART (6 épocas)
Pérdida de entrenamiento/prueba T5 (6 épocas)