기존 의료 QA 및 VQA 데이터 세트
의료 영역의 멀티 모달 질문 응답 (QA) : 기존 데이터 세트 및 시스템 요약
Multimodal QA에 대한 CMU/LTI 대화에 대한이 요약을 준비했습니다. 내 슬라이드는 https://www.slideshare.net/benabacha/multimodal-question-answering-in-the-medical-domain-cmulti-2020에서 제공됩니다
이 목록은 철저하지 않습니다. 관련 의료 QA 데이터 세트 및 시스템의 링크 및 참조를 이메일로 보내 주시면 최대한 빨리 목록을 업데이트하겠습니다. 또한 몇 가지 챌린지 관련 데이터 세트는 더 이상 공개적으로 제공되지 않습니다. 주최자에게 문의하여 데이터를 가질 수 있습니다.
*** 두 가지 주요 작업 : 의료 질문 응답 (QA) 및 시각적 질문 답변 (VQA) ***
i) 의료 QA 데이터 세트 :
- 증거 기반 의학 요약에 대한 코퍼스 (Mollá, 2010) : https://sourceforge.net/projects/ebmsumcorpus
- Clef qa4mre Alzheimer의 과제 (Peñas et al, 2012).
- Bioask DataSets (2012-2020) : http://bioasq.org/participate/challenges
- Trec LiveQa-med (Ben Abacha et al, 2017) : https://github.com/abachaa/liveqa_medicaltask_trec2017
- NLI, RQE 및 QA의 Mediqa-2019 데이터 세트 (Ben Abacha et al., 2019) : https://github.com/abachaa/mediqa2019
- 질문 중심의 답변 요약의 Mediqa-ans 데이터 세트 (Savery et al., 2020) : https://osf.io/fyg46/ 논문 : https://www.nature.com/articles/s41597-020-00667-z
- 47K QA 쌍의 Medquad 컬렉션 (Ben Abacha and Demner-Fushman, 2019) : https://github.com/abachaa/medquad
- 약물 QA 수집 (Ben Abacha et al., 2019) : https://github.com/abachaa/medication_qa_medinfo2019
- 소비자 건강 질문 요약 (Ben Abacha and Demner-Fushman, 2019) : https://github.com/abachaa/meqsum
- EMRQA : 전자 의료 기록에 대한 QA (Pampari et al., 2018). i2b2 데이터에서 emrqa를 생성하는 스크립트 : https://github.com/panushri25/emrqa
- Covid-19의 Epic-QA 데이터 세트 (Goodwin et al., 2020) : https://bionlp.nlm.nih.gov/epic_qa/
- Biqa Corpus (Lamurias et al., 2020) : https://github.com/lasigebiotm/biqa 논문 : https : //ieeexplore.ieee.org/document/9184044
- HealthQa Dataset (Zhu et al., 2019) : https://github.com/mingzhu0527/har 논문 : https://dmkd.cs.vt.edu/papers/www19.pdf
- 다중 답변에 대한 MASH-QA 데이터 세트 35K QA 쌍 (Zhu et al., 2020) : https://github.com/mingzhu0527/mashqa 용지 : https://www.aclweb.org/anthology/2020.findings-embp.342.pdf.
- MEDMCQA : 의료 도메인 질문 답변을위한 대규모 다중 대상 다중 선택 데이터 세트. (Pal et al., Chil, PMLR 2022) : https://github.com/medmcqa/medmcqa 용지 : https://proceedings.mlr.press/v174/pal22a.html
ii) 의료 VQA 데이터 세트 (방사선) :
- vqa-rad (Lau et al. 2018) : https://osf.io/89kps
- VQA-Med 2018 (Hasan et al. 2018) : https://www.aicrowd.com/challenges/imageclef-2018-vqa-med
- VQA-Med 2019 (Ben Abacha et al. 2019) : https://github.com/abachaa/vqa-med-2019
- VQA-Med 2020 (Ben Abacha et al. 2020) : https://github.com/abachaa/vqa-med-2020
iii) 온라인 QA 시스템 :
- 여러 시스템을 검색하고 테스트했습니다 (예 : Askhermes, MIPACQ, SIMQ). 이 목록에는 여전히 유지되는 시스템 만 포함됩니다.
- Chiqa (소비자 건강 질문 응답 시스템) : Chiqa.nlm.nih.gov
- 신경 코비드X : Covidex.ai
iv) 질문 답변과 관련된 의료 데이터 세트 :
- I2B2 공유 작업 (2006-2016) : www.i2b2.org/nlp
- N2C2 NLP Clinical Challenges (2018-2019) : https://n2c2.dbmi.hms.harvard.edu https://dbmi.hms.harvard.edu/programs/national-nlp-clinical-challenges-n2c2
- Trec Medical Records Track (2012-2013).
- TREC 임상 의사 결정 지원 트랙 (2014-2016) : http://www.trec-cds.org
- Trec Precision Medicine Track (2017-2019) : http://www.trec-cds.org
- Clef EHealth (2013-2020) : https://clefehealth.imag.fr
- Covid Dataset (Cord-19) : https://www.kaggle.com/allen-institute-for-ai/cord-19-research-challenge
v) VQA와 관련된 의료 데이터 세트 :
- ImageClef Medical 자동 이미지 주석 (2008-2009) : https://www.imageclef.org/2008/medaat 및 https://www.imageclef.org/2009/medanno
- ImageClef Medical 사용자 지향 이미지 검색 작업 (2011) : https://www.imageclef.org/2011/medicaluseroriented
- Imageclef Medical Retrieval Task (2008-2012) : https://www.imageclef.org/2012/medical
- Imageclef Amia : Medical Task (2013) : https://www.imageclef.org/2013/medical
- imageclefmed : 의료 분류 (2015) : https://www.imageclef.org/2015/medical
- ImageClef Medical Clustering (2015) : https://www.imageclef.org/2015/clustering
- imageclefmed (2016) : https://www.imageclef.org/2016/medical
- imageclefcaption (2017-2020) : https://www.imageclef.org/2017/caption
- ImageClefmedical Tasks (2019-2020) : https://www.imageclef.org/2019/medical 및 https://www.imageclef.org/2020/medical
- MIMIC-CXR 데이터베이스 (2019) : https://physionet.org/content/mimic-cxr/2.0.0/
연락하다
- Asma Ben abacha (abenabacha at microsoft dot com)