AFTERV1.0下載AFTERV1.0源代碼下載

AFTERV1.0

Ai源碼

1.0.0

下載

之後- 作為e e e e emularizer

該存儲庫包含我們的EMNLP 2020發現論文的源代碼：作為有效的正規器的域名微調。

介紹

在這項工作中，我們建議一種新型的常規器，用於預審前的語言模型（LMS）。我們將驗證的LMS在微調過程中丟失是災難性遺忘的一種形式。對抗性術語充當正規化器，可保留LM在訓練過程中捕獲的大多數知識，從而阻止了災難性的遺忘。

模型

為了解決這個問題，我們以對抗性目標擴展了預驗證的LMS的標準微調過程。該額外的損失項與對抗性分類器有關，該分類器區分域內和室外文本表示。

內域：手頭任務（主）的數據集
外域：來自不同域的未標記數據（輔助）

我們最大程度地減少了特定於任務的損失，同時使用梯度反轉層最大程度地提高了域分類器的損失。

我們提出的損失函數如下：

l _after = l_主-λl_域

其中l_主要是特定於任務的損失和l_領域，具有對抗性損失，在微調的同時，在不同域中實現了文本表示的不變性。 λ是可調的超參數。

after_fig-1

結果

在4個膠水數據集（COLA，MRPC，SST-2和RTE）上進行的實驗Wιth兩個不同的LMS（BERT和XLNET）表明，與標準微調相比，性能提高了。我們從經驗上表明，對抗性術語充當正規器，可保留LM在預訓練期間捕獲的大多數知識，從而阻止了災難性的遺忘。

先決條件

依賴性

Python 3.6
Pytorch 1.1.0
numpy 1.16.4
變形金剛2.5.2
Sklearn 0.0

安裝要求

創建環境（可選）：理想情況下，您應該為項目創建一個環境。

 conda create -n after_env python=3.6
conda activate after_env

如果要使用GPU，則安裝帶有所需CUDA版本的Pytorch 1.1.0 ：

 conda install pytorch==1.1.0 torchvision -c pytorch

克隆項目：

 git clone https://github.com/GeorgeVern/AFTERV1.0.git
cd AFTERV1.0

然後安裝其餘要求：

 pip install -r requirements.txt

下載數據

主要數據

要下載主要數據集，我們從此處使用download_glue_data.py腳本。您可以通過運行以下命令來選擇論文中使用的數據集：

 python download_glue_data.py --data_dir './Datasets' --tasks 'CoLA,SST,RTE,MRPC

數據集的默認路徑是afterv1.0/數據集，但可以使用任何其他路徑（應與sys_config腳本中指定的DATA_DIR路徑一致）

輔助數據

作為輔助數據，我們使用來自各個域的語料庫。我們提供腳本以下載和預處理我們實驗中使用的語料庫，而其他任何語料庫也可以使用。

之後 - 微調一個驗證的模型

要與Bert一起運行，您需要以下命令：

 python after_fine-tune.py -i afterBert_finetune_cola_europarl --lambd 0.1

lambd是指我們使用的關節損失函數的重量。

在configs/中，您可以看到我們用於實驗的YAML文件列表，還可以更改其超參數。

參考

如果您在研究中使用此倉庫，請引用論文：

 @inproceedings{vernikos-etal-2020-domain,
    title = "{D}omain {A}dversarial {F}ine-{T}uning as an {E}ffective {R}egularizer",
    author = "Vernikos, Giorgos  and
      Margatina, Katerina  and
      Chronopoulou, Alexandra  and
      Androutsopoulos, Ion",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    year = "2020",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.278",
    doi = "10.18653/v1/2020.findings-emnlp.278",
    pages = "3103--3112",
}

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-06-13
大小 119.89KB
來自於 Github

相關應用

mfhzcc5.0版本

2024-07-24
攪拌機4.0

2024-02-21
魯弗斯4.0

2024-02-21
小虎隊app3.0

2024-02-18
jmcommicron.mic2.0

2024-01-09
Indy9.0.例程

2009-05-29

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
promptl

Ai源碼

1.0.0
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

其他源碼

1.0.0

相關資訊全部