該存儲庫包含用於膠水和小隊2.0基準測試的微調AMOS預測模型的腳本。
論文:訓練信號發生器的對抗混合物進行預訓練的文本編碼

我們基於兩個廣泛使用的開源代碼庫,Fairseq庫和HuggingFace Transfereers庫,以兩個版本提供腳本。這兩個代碼版本大多在功能上等效,您可以免費使用其中的兩個代碼。但是,我們注意到FairSeq版本是我們在實驗中使用的,它將最好地重現論文中的結果。稍後將實現HuggingFace版本,以提供與Huggingface Transfereers庫的兼容性,並可能產生略有不同的結果。
請按照兩個目錄下的“讀書文件”文件運行代碼。
一般語言理解評估(GLUE)基準是句子或句子的語言理解任務的集合,用於評估和分析自然語言理解系統。
AMOS鹼++模型的膠水開發集結果如下(5種隨機種子的中位數):
| 模型 | MNLI-M/mm | QQP | Qnli | SST-2 | 可樂 | rte | MRPC | STS-B | avg |
|---|---|---|---|---|---|---|---|---|---|
| AMOS基礎++ | 90.5/90.4 | 92.4 | 94.4 | 95.5 | 71.8 | 86.6 | 91.7 | 92.0 | 89.4 |
AMOS base ++模型的膠水測試集結果如下(沒有集合,特定於任務的技巧等):
| 模型 | MNLI-M/mm | QQP | Qnli | SST-2 | 可樂 | rte | MRPC | STS-B | avg |
|---|---|---|---|---|---|---|---|---|---|
| AMOS基礎++ | 90.4/89.9 | 90.2 | 94.6 | 96.8 | 69.2 | 83.6 | 88.9 | 91.3 | 88.1 |
Stanford問題回答數據集(小隊)是一個閱讀理解數據集,由人群工人對Wikipedia文章提出的問題組成,每個問題的答案是來自相應的閱讀段落中的文本或跨度的部分,否則問題可能是無法回答的。
AMOS base ++和大++模型的Squad 2.0 DEV集結果如下(5種隨機種子的中值):
| 模型 | Em | F1 |
|---|---|---|
| AMOS基礎++ | 85.0 | 87.9 |
如果您發現代碼和模型對您的研究有用,請引用以下論文:
@inproceedings{meng2022amos,
title={Pretraining Text Encoders with Adversarial Mixture of Training Signal Generators},
author={Meng, Yu and Xiong, Chenyan and Bajaj, Payal and Tiwary, Saurabh and Bennett, Paul and Han, Jiawei and Song, Xia},
booktitle={International Conference on Learning Representations},
year={2022}
}
該項目歡迎貢獻和建議。大多數捐款要求您同意撰寫貢獻者許可協議(CLA),宣布您有權並實際上授予我們使用您的貢獻的權利。有關詳細信息,請訪問https://cla.opensource.microsoft.com。
當您提交拉動請求時,CLA機器人將自動確定您是否需要提供CLA並適當裝飾PR(例如狀態檢查,評論)。只需按照機器人提供的說明即可。您只需要使用我們的CLA在所有存儲庫中進行一次。
該項目採用了Microsoft開源的行為代碼。有關更多信息,請參見《行為守則常見問題守則》或與其他問題或評論聯繫[email protected]。