现有的医疗质量检查和VQA数据集
医疗领域中的多模式问答(QA):现有数据集和系统的摘要
我为我的CMU/LTI关于多模式质量检查的演讲准备了此摘要。我的幻灯片可在https://www.slideshare.net/benabacha/multimodal-question-swering-in-the-the-medical-domain-comulti-2020
此列表并不详尽。您可以通过电子邮件将相关医疗质量检查数据集和系统的链接和引用发送给我,我将尽快更新列表。此外,几个与挑战有关的数据集不再公开可用。您可以联系组织者以获取数据。
***两个主要任务:医疗问题回答(QA)和视觉问题回答(VQA)***
i)医疗质量检查数据集:
- 基于证据的医学摘要(Mollá,2010年):https://sourceforge.net/projects/ebmsumcorpus
- CLEF QA4MRE阿尔茨海默氏症的任务(Peñas等,2012)。
- Bioask数据集(2012-2020):http://bioasq.org/participate/challenges
- TREC LIVEQA-MED(Ben Abacha等,2017):https://github.com/abachaa/liveqa_medicaltask_treec_trec2017
- MEDIQA-2019 NLI,RQE和QA的数据集(Ben Abacha等,2019):https://github.com/abachaa/mediqa2019
- 问题驱动的答案摘要的Mediqa-ans数据集(Savery等,2020):https:///osf.io/fyg46/ paper:https://wwww.nature.com/articles/s41597-020-020-00667-z-00667-z667-zz67-zz67-z
- 47K QA对的Medquad Collection(Ben Abacha和Demner-Fushman,2019年):https://github.com/abachaa/medquad
- 药物质量质量检查(Ben Abacha等,2019):https://github.com/abachaa/medication_qa_medinfo2019
- 消费者健康问题摘要(Ben Abacha和Demner-Fushman,2019年):https://github.com/abachaa/meqsum
- EMRQA:电子病历质量检查(Pampari等,2018)。从i2b2数据生成EMRQA的脚本:https://github.com/panushri25/emrqa
- Covid-19上的Epic-QA数据集(Goodwin等,2020):https://bionlp.nlm.nih.gov/epic_qa/
- Biqa Corpus(Lamurias等,2020):https://github.com/lasigebiotm/biqa论文:https://ieeexplore.ieee.org/document/91840444
- HealthQA数据集(Zhu等,2019):https://github.com/mingzhu0527/har paper:https://dmkd.cs.vt.edu/papers/papers/wwww19.pdf
- MASH-QA Dataset on Multiple Answer Spans Healthcare Question Answering, with 35k QA pairs (Zhu et al., 2020): https://github.com/mingzhu0527/MASHQA Paper: https://www.aclweb.org/anthology/2020.findings-emnlp.342.pdf
- MEDMCQA:用于医疗域问题答案的大型多项式多项选择数据集。 (Pal等,Chil,PMLR 2022):https://github.com/medmcqa/medmcqa纸:https://proceedings.mlr.press/v174/pal22a.html
ii)医学VQA数据集(放射学):
- VQA-RAD(Lau等,2018):https://osf.io/89kps
- VQA-MED 2018(Hasan等人2018):https://www.aicrowd.com/challenges/imageclef-2018-vqa-med
- VQA-MED 2019(Ben Abacha等,2019):https://github.com/abachaa/vqa-med-2019
- VQA-MED 2020(Ben Abacha等,2020):https://github.com/abachaa/vqa-med-2020
iii)在线质量检查系统:
- 我搜索并测试了多个系统(例如AskHermes,MipACQ,SIMQ)。此列表仅包括仍维护的系统。
- chiqa(消费者健康问题答复系统):chiqa.nlm.nih.gov
- 神经covidex:covidex.ai
iv)与问题回答相关的医学数据集:
- I2B2共享任务(2006-2016):www.i2b2.org/nlp
- N2C2 NLP临床挑战(2018-2019):https://n2c2.dbmi.hms.harvard.edu https://dbmi.hms.harvard.edu/programs/programs/national-national-national-nalital-nlational-nlp-clinical-nlp-clinical-challenges-nlp-challenges-n2c2
- TREC医疗记录曲目(2012-2013)。
- TREC临床决策支持轨道(2014-2016):http://www.trec-cds.org
- TREC Precision Medicine Track(2017-2019):http://www.trec-cds.org
- Clef Ehealth(2013-2020):https://clefehealth.imag.fr
- COVID数据集(CORD-19):https://www.kaggle.com/allen-institute-for-ai/cord-19-research-challenge-challenge
v)与VQA相关的医学数据集:
- ImageClef医疗自动图像注释(2008-2009):https://www.imageclef.org/2008/medaat和https://www.imageclef.org/2009/medanno
- ImageClef医学面向用户的图像检索任务(2011年):https://www.imageclef.org/2011/medicaluserororeded
- ImageClef医疗检索任务(2008-2012):https://www.imageclef.org/2012/medical
- Imageclef Amia:医疗任务(2013):https://www.imageclef.org/2013/medical
- ImageClefmed:医学分类(2015):https://www.imageclef.org/2015/medical
- ImageClef Medical Clustering(2015):https://www.imageclef.org/2015/clustering
- ImageClefmed(2016):https://www.imageclef.org/2016/medical
- Imageclefcaption(2017-2020):https://www.imageclef.org/2017/caption
- ImageClefmedical任务(2019-2020):https://www.imageclef.org/2019/medical and Medical and Medical and https://www.imageclef.org/2020/medical
- MIMIC-CXR数据库(2019):https://physionet.org/content/mimic-cxr/2.0.0/
接触
- Asma Ben abacha (abenabacha at microsoft dot com)