TempoSum
1.0.0
يحتوي هذا المستودع على بيانات للورقة التي يمكن أن تعمم LMS على البيانات المستقبلية؟ تحليل تجريبي على تلخيص النص
@inproceedings{temposum23,
title="{Can LMs Generalize to Future Data? An Empirical Analysis on Text Summarization}",
author = {Chi Seng Cheang and
Hou Pong Chan and
Derek F. Wong and
Xuebo Liu and
Zhaocong Li and
Yanming Sun and
Shudong Liu and
Lidia S. Chao},
booktitle = "Proceedings of the Conference on Empirical Methods in Natural Language Processing ({EMNLP})",
month = {December},
year = "2023",
publisher = "Association for Computational Linguistics",
}
قم بتشغيل الأوامر التالية لتحميل مجموعات البيانات من مكتبة HuggingFace لمكتبة.
import datasets
# BBC in-distribution test set
dataset = datasets . load_dataset ( 'chiseng-cheang/TempoSum' , 'BBC_in-distribution' )
# BBC future test set
dataset = datasets . load_dataset ( 'chiseng-cheang/TempoSum' , 'BBC_future' )
# CNN in-distribution test set
dataset = datasets . load_dataset ( 'chiseng-cheang/TempoSum' , 'CNN_in-distribution' )
# CNN future test set
dataset = datasets . load_dataset ( 'chiseng-cheang/TempoSum' , 'CNN_future' )جميع مجموعات البيانات متاحة أيضًا على: https://drive.google.com/drive/folders/1bdetfqoea8gd240h78pgxbo68e53e9e؟usp=sharing