現有的醫療質量檢查和VQA數據集
醫療領域中的多模式問答(QA):現有數據集和系統的摘要
我為我的CMU/LTI關於多模式質量檢查的演講準備了此摘要。我的幻燈片可在https://www.slideshare.net/benabacha/multimodal-question-swering-in-the-the-medical-domain-comulti-2020
此列表並不詳盡。您可以通過電子郵件將相關醫療質量檢查數據集和系統的鏈接和引用發送給我,我將盡快更新列表。此外,幾個與挑戰有關的數據集不再公開可用。您可以聯繫組織者以獲取數據。
***兩個主要任務:醫療問題回答(QA)和視覺問題回答(VQA)***
i)醫療質量檢查數據集:
- 基於證據的醫學摘要(Mollá,2010年):https://sourceforge.net/projects/ebmsumcorpus
- CLEF QA4MRE阿爾茨海默氏症的任務(Peñas等,2012)。
- Bioask數據集(2012-2020):http://bioasq.org/participate/challenges
- TREC LIVEQA-MED(Ben Abacha等,2017):https://github.com/abachaa/liveqa_medicaltask_treec_trec2017
- MEDIQA-2019 NLI,RQE和QA的數據集(Ben Abacha等,2019):https://github.com/abachaa/mediqa2019
- 問題驅動的答案摘要的Mediqa-ans數據集(Savery等,2020):https:///osf.io/fyg46/ paper:https://wwww.nature.com/articles/s41597-020-020-00667-z-00667-z667-zz67-zz67-z
- 47K QA對的Medquad Collection(Ben Abacha和Demner-Fushman,2019年):https://github.com/abachaa/medquad
- 藥物質量質量檢查(Ben Abacha等,2019):https://github.com/abachaa/medication_qa_medinfo2019
- 消費者健康問題摘要(Ben Abacha和Demner-Fushman,2019年):https://github.com/abachaa/meqsum
- EMRQA:電子病歷質量檢查(Pampari等,2018)。從i2b2數據生成EMRQA的腳本:https://github.com/panushri25/emrqa
- Covid-19上的Epic-QA數據集(Goodwin等,2020):https://bionlp.nlm.nih.gov/epic_qa/
- Biqa Corpus(Lamurias等,2020):https://github.com/lasigebiotm/biqa論文:https://ieeexplore.ieee.org/document/91840444
- HealthQA數據集(Zhu等,2019):https://github.com/mingzhu0527/har paper:https://dmkd.cs.vt.edu/papers/papers/wwww19.pdf
- MASH-QA Dataset on Multiple Answer Spans Healthcare Question Answering, with 35k QA pairs (Zhu et al., 2020): https://github.com/mingzhu0527/MASHQA Paper: https://www.aclweb.org/anthology/2020.findings-emnlp.342.pdf
- MEDMCQA:用於醫療域問題答案的大型多項式多項選擇數據集。 (Pal等,Chil,PMLR 2022):https://github.com/medmcqa/medmcqa紙:https://proceedings.mlr.press/v174/pal22a.html
ii)醫學VQA數據集(放射學):
- VQA-RAD(Lau等,2018):https://osf.io/89kps
- VQA-MED 2018(Hasan等人2018):https://www.aicrowd.com/challenges/imageclef-2018-vqa-med
- VQA-MED 2019(Ben Abacha等,2019):https://github.com/abachaa/vqa-med-2019
- VQA-MED 2020(Ben Abacha等,2020):https://github.com/abachaa/vqa-med-2020
iii)在線質量檢查系統:
- 我搜索並測試了多個系統(例如AskHermes,MipACQ,SIMQ)。此列表僅包括仍維護的系統。
- chiqa(消費者健康問題答复系統):chiqa.nlm.nih.gov
- 神經covidex:covidex.ai
iv)與問題回答相關的醫學數據集:
- I2B2共享任務(2006-2016):www.i2b2.org/nlp
- N2C2 NLP臨床挑戰(2018-2019):https://n2c2.dbmi.hms.harvard.edu https://dbmi.hms.harvard.edu/programs/programs/national-national-national-nalital-nlational-nlp-clinical-nlp-clinical-challenges-nlp-challenges-n2c2
- TREC醫療記錄曲目(2012-2013)。
- TREC臨床決策支持軌道(2014-2016):http://www.trec-cds.org
- TREC Precision Medicine Track(2017-2019):http://www.trec-cds.org
- Clef Ehealth(2013-2020):https://clefehealth.imag.fr
- COVID數據集(CORD-19):https://www.kaggle.com/allen-institute-for-ai/cord-19-research-challenge-challenge
v)與VQA相關的醫學數據集:
- ImageClef醫療自動圖像註釋(2008-2009):https://www.imageclef.org/2008/medaat和https://www.imageclef.org/2009/medanno
- ImageClef醫學面向用戶的圖像檢索任務(2011年):https://www.imageclef.org/2011/medicaluserororeded
- ImageClef醫療檢索任務(2008-2012):https://www.imageclef.org/2012/medical
- Imageclef Amia:醫療任務(2013):https://www.imageclef.org/2013/medical
- ImageClefmed:醫學分類(2015):https://www.imageclef.org/2015/medical
- ImageClef Medical Clustering(2015):https://www.imageclef.org/2015/clustering
- ImageClefmed(2016):https://www.imageclef.org/2016/medical
- Imageclefcaption(2017-2020):https://www.imageclef.org/2017/caption
- ImageClefmedical任務(2019-2020):https://www.imageclef.org/2019/medical and Medical and Medical and https://www.imageclef.org/2020/medical
- MIMIC-CXR數據庫(2019):https://physionet.org/content/mimic-cxr/2.0.0/
接觸
- Asma Ben abacha (abenabacha at microsoft dot com)