Title Generator with LLM PEFT
1.0.0
[Обновление]: мелко настроенный Llama2 с Qlora будет добавлен в ближайшее время!
Этот проект направлен на создание названия из данного реферата для академических статей. Модели были точно настроены с PEFT с использованием набора данных ARXIV. Две разные модели были настроены с Lora (Hu et al., 2021). Только статьи в категории информатики были выбраны в наборе данных ARXIV . Это число также было уменьшено из -за пределов памяти и времени. Модели с тонкой настройкой доступны через пространства для Huggingface:
Проект включает в себя:
Rouge ScoreВнешние библиотеки и пакеты:
Параметры и ограничения обучения
R=8 , alpha=64 , dropout=0.01 , learning rate=2e-4 , paged_adamW_32bit optimizer | Оригинальный заголовок | Сгенерированный заголовок | |
|---|---|---|
| 1 | Квантовые схемы для сильно коррелированных квантовых систем | Квантовое моделирование сильно коррелированных многоцветных гамильтоновцев |
| 2 | Teko: богатые текстами нейронные сети графиков с внешними знаниями | Графические нейронные сети, богатые текстами с внешними знаниями |
| 3 | Груз: эффективное бесплатное сжатое хранение геномной информации | Груз: сжатое архивирование для геномики |
| 4 | Энергоэффективное управление мощностью в общении MMWAVE Train-Ground | Энергетическая эффективность общения MMWAVE Train-Ground для высокоскоростных поездов |
| 5 | Опрос о предвзятости в исследованиях машинного обучения | Понимание источников и последствий предвзятости в машинном обучении |
| 6 | SA-Unet: пространственное внимание U-Net для сегментации сосудов сетчатки | Пространственное внимание u-net: пространственное внимание при заболеваниях, связанных с глазами, |
| 7 | Новый эвристический алгоритм для быстрой K-сегментации | Новый эвристический алгоритм для K-сегментации |
| 8 | Прогресс и проблемы IoT в здравоохранении: короткий обзор | Умное здравоохранение и здравоохранение: сравнительный анализ умного здравоохранения и безопасности |
| 9 | FVC: новая структура для глубокого сжатия видео в пространстве функций | Сжатие видео-пространства для кодирования видео на основе обучения |
Барт обучение/потеря тестирования (6 эпох)
Т5 обучение/потеря тестирования (6 эпох)