Title Generator with LLM PEFT
1.0.0
[更新]:Qloraを含む微調整されたLlama2がまもなく追加されます!
このプロジェクトの目的は、アカデミック記事の特定の要約からタイトルを生成することを目的としています。モデルは、ARXIVデータセットを使用してPEFTで調整されました。 2つの異なるモデルがLoraで調整されました(Hu et al。、2021)。 ARXIVデータセットでは、コンピューターサイエンスカテゴリの記事のみが選択されました。この数は、記憶と時間の制限のためにも削減されています。微調整されたモデルは、Huggingfaceスペースを介して利用できます。
プロジェクトには以下が含まれます:
Rouge Scoreの評価メトリック外部ライブラリとパッケージ:
トレーニングパラメーターと制限
R=8 、 alpha=64 、 dropout=0.01 、 learning rate=2e-4 、 paged_adamW_32bit optimizer | オリジナルタイトル | 生成されたタイトル | |
|---|---|---|
| 1 | 強く相関した量子システム用の量子回路 | 強く相関した多体ハミルトニアンの量子シミュレーション |
| 2 | Teko:外部知識を持つテキストリッチグラフニューラルネットワーク | 外部知識を持つテキストリッチグラフニューラルネットワーク |
| 3 | 貨物:ゲノム情報の効果的な形式の圧縮ストレージ | 貨物:ゲノミクス用の圧縮アーカイブ |
| 4 | 列車の地上通信のエネルギー効率の高い電力制御 | 高速列車のための電車の地上mmwave通信のエネルギー効率 |
| 5 | 機械学習研究におけるバイアスに関する調査 | 機械学習におけるバイアスのソースと結果を理解する |
| 6 | SA-UNET:網膜血管セグメンテーションのための空間的注意u-net | 空間的注意u-net:目に関連する疾患に対する空間的注意 |
| 7 | 高速kセグメンテーションのための新しいヒューリスティックアルゴリズム | Kセグメンテーションのための新しいヒューリスティックアルゴリズム |
| 8 | ヘルスケアにおけるIoTの進歩と課題:短いレビュー | スマートヘルスケアとヘルスケア:スマートヘルスケアとセキュリティの比較分析 |
| 9 | FVC:機能空間での深いビデオ圧縮に向けた新しいフレームワーク | 学習ベースのビデオコーディングのための機能空間ビデオ圧縮 |
BARTトレーニング/テスト損失(6エポック)
T5トレーニング/テスト損失(6エポック)