Awesome_chinese_medical_nlp
Obat Sumber Daya Publik NLP Chinese NLP: Term Set/Corpus/Word Vector/Pretrained Model/Pengetahuan Grafik/Pengenalan Entitas Bernama/Ekstraksi Informasi/Dll
Benchmark
- Daftar Tantangan Pemrosesan Informasi Medis Tiongkok Dataset Dataset CBLUE Baseline Daftar Tantangan Pemrosesan Informasi Medis Tiongkok CBLUE (Evaluasi Pemahaman Bahasa Biomedis Cina) diprakarsai oleh Komite Profesional Pemrosesan Kesehatan Medis dan Bioinformatika dari Masyarakat Informasi Tiongkok Tiongkok di bawah konsep pembagian terbuka hukum. Ini diselenggarakan oleh Alibaba Cloud Tianchi Platform dan Co-Organized oleh Yidu Cloud (Beijing) Technology Co, Ltd., Ping An Medical Technology, Peking University, Zhengzhou University, Pengcheng Laboratory, Harbin Institute of Technology (Shenzhen), Universitas Tongji, Quark, Alibaba, Shenzhen), Universitas Tongji, Quark, Alibaba, Shenzhen), Tongji University, Quark, Alibaba, Shenzhen), Tongji University, Quark, Alibaba, Shenzhen), Tongji University, Quark, Alibaba, Shenzhen), Tongji University, Quark, Alibaba. Ini bertujuan untuk mempromosikan pengembangan teknologi dan komunitas NLP kedokteran Tiongkok.
Set Term/Corpus
- Medical-News Chinese News Crawler
- Buku Medis Buku Medis Lateks Lateks Tiongkok
- Thuocl Tsinghua University Thunlp Group Medical Vocabulary
- ICD9 ICD-9 China sesuai
- ICD10 ICD-10 China sesuai
- ICD11 ICD-11 China sesuai
- Omaha Tangram Medical Terminology Collection Data Sampel
- Dataset anotasi diabetes Cina berisi anotasi entitas dan anotasi relasi
Model kata vektor/pretrained
- Chineseehrbert Chinese Electronic Medical Record Pre-Training Bert; Gunakan Bert untuk menguji pengakuan entitas yang disebutkan, model tanya jawab, tugas ekstraksi hubungan
- Dataset dan model MC-BERTCHNESEBLUE
- Bert Model Bert Tiongkok Pra-Terlatih Bertcner Untuk Pengakuan Entitas Bernama
- Model pra-pelatihan PCL-Medbert Pengcheng Medical Bert
- Eksplorasi dan Penelitian tentang Penerapan Model Medbert Bert dalam Pemrosesan Bahasa Alami Klinis Cina
- Vektor kata-word-word2vec-medis di bidang biomedis Cina
- Smedbert Smedbert
- EHealth Membangun Model Bahasa Biomedis Cina Melalui Diskriminasi Teks Multi-Level
Partisip
- Alat segmentasi kata pkuseg pkuseg, model mendukung pemilihan obat
- Alat Segmentasi Kata Medis CMEKG Github CMEKG Medical Word Segmentation Tool
- GTS berisi 922 set tes kata -kata medis Tiongkok Participle dengan dua ukuran partikel yang ditandai dengan ketebalan
Grafik Pengetahuan/Ekstraksi Relasional
- CMEKG GITHUB Grafik Pengetahuan Medis Cina
- Rumah Sakit Ruijin Kecerdasan Buatan Bantuan Konstruksi Kontes Knowledge Grafik Kontes Diabetes dan Tugas Hubungan Entitas untuk Anotasi Entitas dan Ekstraksi Pedoman Klinis Diabetes
- Grafik Pengetahuan Omaha (Indikasi Obat) Data grafik pengetahuan tentang obat dan indikasi obat yang dibangun oleh Open Medical and Healthcare Alliance (Omaha)
- Data Grafik Pengetahuan Medis Data Grafik Pengetahuan Medis (Milik Petupia)
- Peta Event Peta Pasien Dataset Peta Acara Pasien adalah model representasi data observasi medis berbasis RDF baru yang dapat dengan jelas mewakili berbagai jenis peristiwa seperti pemeriksaan klinis, diagnosis, dan perawatan, serta hubungan waktu kejadian. Menggunakan data rekam medis elektronik dari tiga rumah sakit Shanghai Grade A, satu set data medis termasuk 3 spesialisasi, 173.395 acara medis, 501.335 hubungan waktu acara, dan menghubungkan dengan 5.313 konsep basis pengetahuan dibangun.
- Perpustakaan Gejala Cina Ini adalah dataset yang mengandung entitas gejala dan kembar tiga terkait gejala. Data dari database gejala Cina berasal dari 8 situs web konsultasi kesehatan utama, 3 situs web ensiklopedia Cina dan catatan medis elektronik. Ini juga berisi hasil gejala Cina dan konsep -konsep dalam UML.
- Grafik pengetahuan kasus obat tradisional Tiongkok mengekstraksi pengetahuan klinis dari kasus medis untuk membangun grafik pengetahuan untuk membantu pengguna memahami manifestasi klinis perawatan obat tradisional Tiongkok, serta manifestasi klinis penyakit (seperti "gastritis kronis"), terapi terkait, metode perawatan kesehatan terkait, dll.
- Herbnet bertujuan untuk penelitian obat tradisional Tiongkok dan membangun badan obat Tiongkok termasuk penyakit obat tradisional Tiongkok, resep, obat tradisional Tiongkok, komponen kimia, efek farmakologis, eksperimen obat tradisional Tiongkok, dan metode eksperimental kimia berdasarkan karakteristik model lapangan obat tradisional Tiongkok. Selain itu, serangkaian integrasi basis data direalisasikan berdasarkan ontologi, sehingga membangun grafik pengetahuan obat Cina.
- CHIP2020 Ekstraksi Hubungan Entitas Teks Medis Cina
- CCKS2020 Konstruksi Grafik Pengetahuan Coronavirus Baru dan Tanya Jawab
- alat ekstraksi hubungan medis cmekg ekstraksi hubungan medis cmekg
Pengakuan entitas yang disebutkan
- CCKS2017 Identifikasi Entitas Medis dan Atribut Ekstraksi Data Set untuk Catatan Medis Elektronik Cina
- CCKS2018 Identifikasi Entitas Medis dan Data Ekstraksi Atribut untuk Catatan Medis Elektronik Cina
- CCKS2019 Data Unduh Identifikasi Entitas Medis dan Atribut Ekstraksi Data Set untuk Catatan Medis Elektronik Cina
- CHIP2020 Pengakuan Entitas Penamaan Teks Medis Tiongkok
- CHIP2020 Identifikasi Entitas Instruksi Obat Tiongkok Tradisional
- CCKS2020 Entitas Medis dan Acara untuk Catatan Medis Elektronik Cina
- CMEKG Medical Ner Tool CMEKG Medical Ner
- CCKS2021 Ekstraksi Entitas dan Acara Medis untuk Catatan Medis Elektronik Cina
Qa
- CCIR2019 CCIR 2019 Kategori Kueri Data Berdasarkan Catatan Medis Elektronik
- Dataset QA Medis Medis CMEDQA
- Dataset CMEDQA2 China Medical QA
- CMID Chinese Medical QA Niat untuk Memahami Dataset
- KGQA Sistem Tanya Jawab Cerdas Berdasarkan Grafik Pengetahuan Medis
- chatbot-base-on-chnowledge-graph menggunakan metode pembelajaran mendalam untuk menganalisis masalah pengetahuan grafik penyimpanan poin pengetahuan sistem dialog berdasarkan bidang vertikal medis
- Data Dialog Medis Tiongkok Data Dialog Medis Medis Data Dialog Medis Cina
- WebMEDQA WebMedqa
- Meddialog Dataset meddialog berisi percakapan (dalam bahasa Cina) antara dokter dan pasien. Ini memiliki 1,1 juta dialog dan 4 juta ucapan.
- CHIP2020 Generasi Masalah Sastra Kedokteran Tiongkok Tradisional
- NLPEC Dataset pertanyaan multi-pilihan medis untuk pemeriksaan apoteker berlisensi nasional di Cina
- CCKS2021 Generasi Dialog Medis Tiongkok yang Berisi Entitas
- Imcs21 cblue@tianchi dataset dialog medis Cina IMCS21
- Pemeriksaan Empec untuk Medis-Peronnel-in-Chinese (EMPEC)
Standardisasi terminologi
- CHIP2019 Tugas Standardisasi Terminologi Klinis: Dataset Standardisasi Cloud Yidu 7K
- Tugas Standardisasi Terminologi Klinis CHIP2020
Hukuman serupa untuk menilai
- Tantangan "Public Welfare AI Star" - Kalimat serupa untuk Kompetisi Penilaian Epidemi Coronavirus yang baru menyusun hampir 10.000 pertanyaan yang diajukan oleh pasien yang terkait dengan pneumonia terkait epidemi, pneumonia mikoplasma, konteks, dll. Identifikasi masalah pasien yang serupa melalui teknologi pemrosesan bahasa alami.
Klasifikasi Teks
- CHIP2019 Kriteria Skrining Uji Klinis Klasifikasi Teks Pendek
lainnya
- CHIP2018: Untuk Konsultasi Kesehatan Pasien Cina Nyata Corpus, Match Question Intent
- CHIP2019 Ping An Medical Technology Disease T&J Transfer Learning Competition
- CCLUE Chines China Klinis Bahasa Pemrosesan Algoritma Evaluasi Evaluasi Benchmark
- CCKS2021 Pemahaman Konten tentang Pengetahuan Medis Tiongkok Populer