ชุดข้อมูล QA & VQA การแพทย์ที่มีอยู่เดิม
การตอบคำถามหลายรูปแบบ (QA) ในโดเมนการแพทย์: บทสรุปของชุดข้อมูลและระบบที่มีอยู่
ฉันเตรียมบทสรุปนี้สำหรับการพูดคุย CMU/LTI ของฉันเกี่ยวกับ QA หลายรูปแบบ สไลด์ของฉันมีอยู่ที่ https://www.slideshare.net/benabacha/multimodal-question-answering-in-the-medical-domain-cmulti-2020
รายการนี้ไม่ครบถ้วนสมบูรณ์ คุณสามารถส่งอีเมลลิงค์และการอ้างอิงของชุดข้อมูลและระบบการแพทย์ที่เกี่ยวข้องกับฉันและฉันจะอัปเดตรายการโดยเร็ว นอกจากนี้ชุดข้อมูลที่เกี่ยวข้องกับความท้าทายหลายชุดจะไม่เปิดเผยต่อสาธารณะอีกต่อไป คุณสามารถติดต่อผู้จัดงานเพื่อรับข้อมูล
*** สองภารกิจหลัก: การตอบคำถามทางการแพทย์ (QA) และการตอบคำถามด้วยภาพ (VQA) ***
i) ชุดข้อมูล QA ทางการแพทย์:
- คลังข้อมูลการสรุปยาตามหลักฐาน (Mollá, 2010): https://sourceforge.net/projects/ebmsumcorpus
- งานของ Clef Qa4mre Alzheimer (Peñas et al, 2012)
- ชุดข้อมูล Bioask (2012-2020): http://bioasq.org/partipicate/challenges
- TREC Liveqa-Med (Ben Abacha et al, 2017): https://github.com/abachaa/liveqa_medicaltask_trec2017
- ชุดข้อมูล MEDIQA-2019 เกี่ยวกับ NLI, RQE และ QA (Ben Abacha et al., 2019): https://github.com/abachaa/mediqa2019
- ชุดข้อมูล Mediqa-ans ของบทสรุปคำถามที่ขับเคลื่อนด้วยคำถาม (Savery et al., 2020): https://osf.io/fyg46/ กระดาษ: https://www.nature.com/articles/S41597-020-00667-zz
- คอลเลกชัน Medquad ของคู่ QA 47K (Ben Abacha และ Demner-Fushman, 2019): https://github.com/abachaa/medquad
- การรวบรวมยา QA (Ben Abacha et al., 2019): https://github.com/abachaa/medication_qa_medinfo2019
- การสรุปคำถามสุขภาพของผู้บริโภค (Ben Abacha และ Demner-Fushman, 2019): https://github.com/abachaa/meqsum
- EMRQA: QA เกี่ยวกับเวชระเบียนอิเล็กทรอนิกส์ (Pampari et al., 2018) สคริปต์เพื่อสร้าง EMRQA จากข้อมูล I2B2: https://github.com/panushri25/emrqa
- ชุดข้อมูล EPIC-QA บน COVID-19 (Goodwin et al., 2020): https://bionlp.nlm.nih.gov/epic_qa/
- Biqa Corpus (Lamurias et al., 2020): https://github.com/lasigebiotm/biqa Paper: https: //ieeexplore.ieee.org/document/9184044
- ชุดข้อมูล HealthQa (Zhu et al., 2019): https://github.com/mingzhu0527/har กระดาษ: https://dmkd.cs.vt.edu/papers/www19.pdf
- ชุดข้อมูล MASH-QA บนคำตอบหลายคำตอบคำถามการดูแลสุขภาพด้วยการตอบคำถาม 35K QA (Zhu et al., 2020): https://github.com/mingzhu0527/mashqa กระดาษ: https://ww.aclweb.org/anthology/2020
- Medmcqa: ชุดข้อมูลหลายตัวเลือกหลายตัวเลือกขนาดใหญ่สำหรับการตอบคำถามโดเมนทางการแพทย์ (Pal et al., Chil, PMLR 2022): https://github.com/medmcqa/medmcqa กระดาษ: https://proceedings.mlr.press/v174/pal22a.html
ii) ชุดข้อมูลการแพทย์ VQA (รังสีวิทยา):
- VQA-RAD (Lau et al. 2018): https://osf.io/89kps
- VQA-MED 2018 (Hasan et al. 2018): https://www.aicrowd.com/challenges/imageclef-2018-vqa-med
- VQA-MED 2019 (Ben Abacha et al. 2019): https://github.com/abachaa/vqa-med-2019
- VQA-MED 2020 (Ben Abacha et al. 2020): https://github.com/abachaa/vqa-med-2020
iii) ระบบ QA ออนไลน์:
- ฉันค้นหาและทดสอบหลายระบบ (เช่น Askhermes, MIPACQ, SIMQ) รายการนี้รวมเฉพาะระบบที่ยังคงรักษาไว้
- Chiqa (ระบบตอบคำถามสุขภาพของผู้บริโภค): chiqa.nlm.nih.gov
- Neural Covidex: covidex.ai
iv) ชุดข้อมูลทางการแพทย์ที่เกี่ยวข้องกับการตอบคำถาม:
- งานที่ใช้ร่วมกันของ I2B2 (2549-2559): www.i2b2.org/nlp
- N2C2 NLP ความท้าทายทางคลินิก (2018-2019): https://n2c2.dbmi.hms.harvard.edu https://dbmi.hms.harvard.edu/programs/national-nlp-clinical-challenges-n2c2
- TREC Medical Medical Track (2012-2013)
- เส้นทางสนับสนุนการตัดสินใจทางคลินิก TREC (2014-2016): http://www.trec-cds.org
- TREC Precision Medicine Track (2017-2019): http://www.trec-cds.org
- Clef EHealth (2013-2020): https://clefehealth.imag.fr
- ชุดข้อมูล COVID (Cord-19): https://www.kaggle.com/allen-institute-for-ai/cord-19-research-challenge
v) ชุดข้อมูลทางการแพทย์ที่เกี่ยวข้องกับ VQA:
- Imageclef Medical Automatic Image Annotation (2008-2009): https://www.imageclef.org/2008/medaat และ https://www.imageclef.org/2009/medanno
- ImageClef งานการดึงภาพผู้ใช้ที่เน้นการแพทย์ (2011): https://www.imageclef.org/2011/medicaluseroriented
- Imageclef Task Retrieval Task (2008-2012): https://www.imageclef.org/2012/medical
- Imageclef Amia: งานทางการแพทย์ (2013): https://www.imageclef.org/2013/medical
- Imageclefmed: การจำแนกประเภททางการแพทย์ (2015): https://www.imageclef.org/2015/medical
- Imageclef Medical Clustering (2015): https://www.imageclef.org/2015/clustering
- Imageclefmed (2016): https://www.imageclef.org/2016/medical
- ImageClefcaption (2017-2020): https://www.imageclef.org/2017/caption
- งาน Imageclefmedical (2019-2020): https://www.imageclef.org/2019/medical and https://www.imageclef.org/2020/medical
- ฐานข้อมูล MIMIC-CXR (2019): https://physionet.org/content/mimic-cxr/2.0.0/
ติดต่อ
- Asma Ben abacha (abenabacha at microsoft dot com)