
คำแนะนำเกี่ยวกับการดาวน์โหลดชุดข้อมูลที่ประมวลผลล่วงหน้าและชุดข้อมูลชุดเครื่องแต่งกายล่วงหน้าสามารถดูได้ที่นี่
ดาวน์โหลด checkpoints จาก: https://uofi.box.com/s/wnt6cv7icuir4q3wb2a6viuyklme5dga ใส่ไดเรกทอรีจุดตรวจใน checkpoints ใต้ zemi/output/p3_finetuning
ตั้งค่าสภาพแวดล้อม conda ด้วย conda env create -f environment.yml เรียกใช้ accelerate config เพื่อกำหนดค่าอุปกรณ์
สคริปต์สำหรับการทำซ้ำผลลัพธ์หลักในตารางที่ 1: การดำเนินการ (กึ่ง) พารามิเตอร์มัลติทาสก์พารามิเตอร์ได้รับแจ้งการฝึกอบรมและการประเมินผลเป็นศูนย์ คำแนะนำโดยละเอียดเกี่ยวกับการกำหนดค่าสามารถดูได้ที่นี่ สคริปต์ทั้งหมดควรทำงานภายใต้ zemi/ SETUP_ENV.sh จะถูกเรียกในสคริปต์ต่อไปนี้สำหรับการตั้งค่าตัวแปร Env หนึ่งอาจปรับเปลี่ยนตัวแปรหากไม่ได้ใช้โครงสร้างโฟลเดอร์เดียวกันที่แน่นอนเช่นการตั้งค่าด้านบน
bash ./training/no_aug_base.shbash ./training/no_aug_large.shbash ./training/concat_base.shbash ./training/concat_large.shbash ./training/fid_base.shbash ./training/fid_large.shbash ./training/zemi_base.shbash ./training/zemi_large.sh zemi/modeling_t5.py จากบรรทัดนี้และ zemi/modeling_xattn.pyzemi/multi_task_fine_tune_baseline.pyzemi/multi_task_fine_tune_xattn.pyzemi/eval_original_task_only.pyzemi/eval_original_task_only_xattn.py visualization/ มีตัวอย่างของเอกสารที่ดึงมาสำหรับแต่ละงาน เรารวมตัวอย่าง 50 อันดับแรกที่มีคะแนน BM25 สูงสุดและต่ำสุดใน visualization/top50_highest_score_retrieval_instances และ visualization/top50_lowest_score_retrieval_instances นอกจากนี้เรายังรวมถึง 50 อินสแตนซ์แรกสำหรับแต่ละชุดข้อมูลโดยไม่ต้องเรียงลำดับใหม่ใน visualization/first50_retrieval_instances
@article{wang2022zemi,
title={Zemi: Learning Zero-Shot Semi-Parametric Language Models from Multiple Tasks},
author={Wang, Zhenhailong and Pan, Xiaoman and Yu, Dian and Yu, Dong and Chen, Jianshu and Ji, Heng},
journal={arXiv preprint arXiv:2210.00185},
year={2022}
}