Awesome_chinese_medical_nlp
한약 NLP 공공 자원 조직 : 용어 세트/코퍼스/워드 벡터/사전 처리 된 모델/지식 그래프/명명 된 엔티티 인식/QA/정보 추출/등
기준
- 중국 의료 정보 처리 챌린지 목록 CBLUE 데이터 세트 기준선 중국 의료 정보 처리 챌린지 목록 CBLUE (중국 생물 의학 언어 이해 평가)는 법적 공개 공유 개념에 따라 중국 중국 정보 학회의 의료 건강 및 생물 정보학 처리 전문위원회에 의해 시작됩니다. Alibaba Cloud Tianchi 플랫폼이 주최하고 YIDU Cloud (Beijing) Technology Co., Ltd., Ping 의료 기술, Zhengzhou University, Pengcheng Laboratory, Harbin Institute of Technology (Shenzhen), Tongji University, Quark 및 Alibaba Damo Academy 및 기타 Smart Rooding이 공동 구성했습니다. 한약 NLP 기술 및 커뮤니티 개발을 홍보하는 것을 목표로합니다.
용어 세트/코퍼스
- 의료 뉴스 중국 의료 뉴스 크롤러
- 의료 책 중국어 라텍스 오픈 소스 의료 도서
- Thuocl Tsinghua University Thunlp 그룹 의료 어휘
- ICD9 ICD-9 중국어 해당
- ICD10 ICD-10 중국어 해당
- ICD11 ICD-11 중국인
- Omaha Tangram Medical Terminology Collection 샘플 데이터
- 중국 당뇨병 주석 데이터 세트에는 엔티티 주석 및 관계 주석이 포함되어 있습니다.
단어 벡터/사전 치료 모델
- Chineseehrbert 중국 전자 의료 기록 사전 훈련 버트; Bert를 사용하여 명명 된 엔티티 인식, 질문 및 답변 모델, 관계 추출 작업을 테스트하십시오.
- MC-Bertchneseblue 데이터 세트 및 모델
- 지명 된 엔티티 인식을위한 Bertcner 미리 훈련 된 한약 Bert 모델
- PCL-MEDBERT PENGCHENG MEDICAL BERT 사전 훈련 모델
- 중국 임상 자연 언어 처리에서 Medbert Bert 모델의 적용에 대한 탐색 및 연구
- 중국의 생물 의학 분야의 중국-워드 2VEC- 의학 단어 벡터
- Smedbert Smedbert
- 다단계 텍스트 차별을 통한 중국 생물 의학 언어 모델
분사
- pkuseg pkuseg 단어 세분화 도구, 모델은 의학 선택을 지원합니다.
- CMEKG 의료 단어 세분화 도구 Github CMEKG 의료 단어 세분화 도구
- GTS에는 922 개의 중국 의료 단어 분사 테스트가 포함되어 있습니다.
지식 그래프/관계형 추출
- cmekg github 중국 의료 지식 그래프
- Ruijin Hospital 인공 지능 보조 지식 그래프 컨테스트의 구성 당뇨병 및 실체 관계 작업 당뇨병의 주석 및 추출 임상 지침
- Omaha Knowledge Graph (약물 적응증) Open Medical and Healthcare Alliance (Omaha)에 의해 구성된 약물 및 약물 표시에 대한 지식 그래프 데이터
- 의료 지식 그래프 데이터 의료 지식 그래프 데이터 (OWNTHINK)
- 환자 이벤트 맵 데이터 세트 환자 이벤트 맵은 임상 검사, 진단 및 치료와 같은 다양한 이벤트 유형뿐만 아니라 사건의 타이밍 관계를 명확하게 표현할 수있는 새로운 RDF 기반 의료 관찰 데이터 표현 모델입니다. 3 개의 상하이 등급 A 병원의 전자 의료 기록 데이터, 3 개의 전문 분야, 173,395 개의 의료 이벤트, 501,335 개의 이벤트 타이밍 관계 및 5,313 개의 지식 기반 개념과의 연결이 구성되었습니다.
- 중국 증상 라이브러리 이것은 증상 실체와 증상 관련 트리플렛을 포함하는 데이터 세트입니다. 중국 증상 데이터베이스의 데이터는 8 개의 주류 건강 상담 웹 사이트, 3 개의 중국 백과 사전 웹 사이트 및 전자 의료 기록에서 나온 것입니다. 또한 중국 증상의 결과와 UML의 개념이 포함되어 있습니다.
- 전통적인 한약의 지식 그래프는 의료 사례의 임상 지식을 추출하여 사용자가 전통적인 중국 의약 치료의 임상 증상과 질병의 임상 적 표현 (예 : "만성 위염"), 관련 치료, 관련 건강 관리 방법 등을 이해하는 데 도움이되는 지식 그래프를 구축합니다.
- Herbnet은 전통 중국 의학 연구를 목표로하고 전통 한약 질병, 처방전, 한약, 화학 성분, 약리학 적 효과, 한약 전통 실험 및 전통적인 한약 필드 모델의 특성을 기반으로 한 화학 실험 방법을 포함한 한약 기관을 구성합니다. 또한, 온톨로지를 기반으로 일련의 데이터베이스 통합이 실현되어 한약 지식 그래프를 구축합니다.
- Chip2020 중국 의료 텍스트 엔티티 관계 추출
- CCKS2020 NEW CORONAVIRUS 지식 그래프 구성 및 Q & A
- CMEKG 의료 관계 추출 도구 CMEKG 의료 관계 추출
지명 된 엔티티 인식
- CCKS2017 중국 전자 의료 기록에 대한 의료 기관 식별 및 속성 추출 데이터 세트
- CCKS2018 중국 전자 의료 기록에 대한 의료 기관 식별 및 속성 추출 데이터 세트
- CCKS2019 데이터 다운로드 중국 전자 의료 기록에 대한 의료 기관 식별 및 속성 추출 데이터 세트
- Chip2020 중국 의료 텍스트 명명 엔터티 인식
- Chip2020 전통 중국 의학 지시 기관 식별
- CCKS2020 중국 전자 의료 기록을위한 의료 기관 및 이벤트
- CMEKG Medical NER 도구 CMEKG Medical NER
- CCKS2021 중국 전자 의료 기록을위한 의료 기관 및 이벤트 추출
QA
- CCIR2019 CCIR 2019 데이터 쿼리 카테고리 전자 의료 기록을 기반으로합니다.
- CMEDQA 중국 의료 QA 데이터 세트
- CMEDQA2 중국 의료 QA 데이터 세트
- CMID 중국 의료 QA 데이터 세트를 이해하려는 의도
- 의료 지식 그래프를 기반으로 한 KGQA 지능형 Q & A 시스템
- Chatbot-Base-on-Knowledge Graph는 딥 러닝 방법을 사용하여 문제 지식 그래프 스토리지 쿼리 지식 지점 의료 수직 필드를 기반으로하는 대화 시스템을 분석합니다.
- 중국 의료 대화 데이터 중국 의료 대화 데이터 중국 의료 대화 데이터
- WebMedQa WebMedQa
- Meddialog Meddialog 데이터 세트에는 의사와 환자 간의 대화 (중국어)가 포함되어 있습니다. 110 만 대화와 4 백만 건의 발언이 있습니다.
- Chip2020 전통 중국 의약 문학 문제의 세대
- NLPEC 중국의 전국 면허 약사 시험을위한 의료 다중 체결 질문 데이터 세트
- CCKS2021 중국 의료 대화 세대가 포함되어 있습니다
- IMCS21 CBLUE@TIANCHI 중국 의료 대화 데이터 세트 IMCS21
- EMPEC 시험에서의 의료진-중국인 (EMPEC)
용어의 표준화
- Chip2019 임상 용어 표준화 작업 : YIDU 클라우드 표준화 7K 데이터 세트
- Chip2020 임상 용어 표준화 작업
판사와 비슷한 문장
- "Public Welfare AI Star"Challenge- 새로운 코로나 바이러스 전염병 판단 경쟁에 대한 유사한 문장은 전염병 관련 폐렴, Mycoplasma pneumonia, 기관지염, 기관지 감염, 결핵, Asthma, vleurma, contor work on the contince and the content worge on the content working on the content working on that concound working on the content wefited on expiratory tract 감염, 상부 호흡기 감염, 대상 감염, 상위 트랙 감염, 상부 트랙트 감염, 상부 트랙 감염, 상부 트랙 감염, 상부 트랙트 감염 및 자연어 처리 기술을 통해 유사한 환자 문제를 식별합니다.
텍스트 분류
- Chip2019 임상 시험 선별 기준 짧은 텍스트 분류
다른
- Chip2018 : 실제 중국 환자 건강 상담 코퍼스의 경우 일치 질문 의도
- Chip2019 의료 기술 질병 Q & A 이전 학습 경쟁
- CCLUE 중국 임상 자연어 처리 알고리즘 평가 벤치 마크
- CCKS2021 대중의 중국 의료 지식에 대한 콘텐츠 이해