Title Generator with LLM PEFT
1.0.0
[更新]:與Qlora的微調Llama2很快將添加!
該項目旨在從給定的學術文章摘要中產生標題。使用ARXIV數據集對模型進行微調。用洛拉調整了兩個不同的模型(Hu等,2021)。 ARXIV數據集中只選擇了計算機科學類別中的文章。由於內存和時間限制,此數字也已減少。可以通過擁抱面空間獲得微調型號:
該項目包括:
Rouge Score評分外部庫和軟件包:
培訓參數和限制
R=8 , alpha=64 , dropout=0.01 , learning rate=2e-4 , paged_adamW_32bit optimizer | 原始標題 | 生成的標題 | |
|---|---|---|
| 1 | 與量子系統密切相關的量子電路 | 密切相關的多體哈密頓量的量子模擬 |
| 2 | Teko:具有外部知識的文本豐富的圖形神經網絡 | 文本豐富的圖形神經網絡具有外部知識 |
| 3 | 貨物:基因組信息的有效無格式壓縮存儲 | 貨物:基因組學的壓縮歸檔 |
| 4 | 火車地面MMWave通信的節能功率控制 | 高速火車的火車地面MMWave通信的能源效率 |
| 5 | 關於機器學習研究偏見的調查 | 了解機器學習中偏見的來源和後果 |
| 6 | SA-UNET:視網膜血管分割的空間注意U-NET | 空間注意力U-NET:與眼睛有關疾病的空間關注 |
| 7 | 快速K分段的一種新的啟發式算法 | 一種新穎的啟發式算法,用於K段 |
| 8 | IOT在醫療保健中的進步和挑戰:簡短的評論 | 智能醫療保健和醫療保健:智能醫療保健和安全的比較分析 |
| 9 | FVC:在特徵空間中進行深視頻壓縮的新框架 | 功能空間視頻壓縮,用於基於學習的視頻編碼 |
巴特訓練/測試損失(6個時代)
T5訓練/測試損失(6個時代)