génial_chinese_medical_nlp
Organisation des ressources publiques de la NLP en médecine chinoise: ensemble de termes / corpus / vecteur de mots / modèle prétrainé / graphique de connaissances / reconnaissance d'entité nommée / QA / Extraction d'informations / etc.
Référence
- Liste des défis de traitement des informations médicales chinoises CBLUE BASELINE LISTE CHINED INFORMATION DES INFORMATIONS MÉDICAL LISTE (Évaluation de la compréhension du langage biomédical chinois) est lancée par le Comité professionnel de traitement de la santé médicale et de la bioinformatique de la Société chinoise des informations chinoises sous le concept de partage ouvert légal. Il est hébergé par Alibaba Cloud Tianchi Platform et co-organisé par Yidu Cloud (Beijing) Technology Co., Ltd., Ping An Medical Technology, Peking University, Zhengzhou University, Pengcheng Laboratory, Harbin Institute of Technology (Shenzhen), Tongji University, Quark, Alibaba DaMo Academy et autres units qui exercent une recherche médicale intelligente. Il vise à promouvoir le développement de la technologie et de la communauté NLP de médecine chinoise.
Terme Set / Corpus
- Medical-News Chine Medical News Crawler
- Livres médicaux en latex chinois Open Source Livres médicaux
- Thuocl Tsinghua University Thunlp Group Medical Vocabulary
- ICD9 ICD-9 chinois correspondant
- ICD10 ICD-10 chinois correspondant
- ICD11 ICD-11 Chinois correspondant
- Omaha Tangram Medical Terminology Collection Sample Data
- L'ensemble de données de l'annotation du diabète chinois contient l'annotation et l'annotation de la relation d'entité
Vector de mot / modèle pré-entraîné
- Chineseehrbert Chinois Electronic Medical Record pré-formation Bert; Utilisez Bert pour tester la reconnaissance des entités nommée, le modèle de questions et réponses, les tâches d'extraction des relations
- Ensemble de données et modèle MC-BERTCHNESEBLUE
- Médecin chinois pré-formé de Bertner modèle Bert pour la reconnaissance des entités nommées
- PCL-MEDBERT PENGCHENG MEDICAL BERT Pré-formation
- Exploration et recherche sur l'application du modèle de Medbert Bert dans le traitement chinois du langage naturel clinique
- Vecteur de mots chinois-mot-mot2vec-médicine dans le champ biomédical chinois
- Smedbert Smedbert
- Bâtiment eHealth Modèles de langue biomédicale chinoise via une discrimination de texte à plusieurs niveaux
Participe
- PKUSEG PKUSEG Word Segmentation Tool, le modèle soutient la sélection de la médecine
- outil de segmentation des mots médicaux CMEKG GitHub CMEKG MEDICAL Word Segmentation Tool
- GTS contient 922 ensemble de tests de participe de mot médical chinois avec deux tailles de particules marquées d'épaisseur
Graphique de connaissances / extraction relationnelle
- Graphique de connaissances médicales chinoises Cmekg Github
- Hôpital Ruijin Hôpital Artificiel Intelligence Construction de connaissances du concours Graphique de connaissance
- Graphique de connaissances Omaha (indications de médicament) Données sur les graphiques de connaissances sur les médicaments et les indications de médicament construites par l'Open Medical and Healthcare Alliance (Omaha)
- Données sur le graphique des connaissances médicales Données de graphique médicale (Propoute)
- La carte des événements de données sur les événements de données du patient est un nouveau modèle de représentation médicale des données d'observation médicale basée sur le RDF qui peut clairement représenter différents types d'événements tels que l'examen clinique, le diagnostic et le traitement, ainsi que la relation de synchronisation des événements. En utilisant les données électroniques des enregistrements médicaux de trois hôpitaux Shanghai de grade A, un ensemble de données médicales comprenant 3 spécialités, 173 395 événements médicaux, 501 335 relations de synchronisation des événements et un lien avec 5 313 concepts de base de connaissances ont été construits.
- Bibliothèque de symptômes chinois Il s'agit d'un ensemble de données contenant des entités de symptômes et des triplets liés aux symptômes. Les données de la base de données chinoises des symptômes proviennent de 8 sites Web de consultation de santé traditionnels, de 3 sites Web chinois d'encyclopédie et de dossiers médicaux électroniques. Il contient également les résultats des symptômes chinois et des concepts dans les UML.
- Le graphique de connaissances de la médecine traditionnelle chinoise extrait les connaissances cliniques des cas médicaux pour construire un graphique de connaissances pour aider les utilisateurs à comprendre les manifestations cliniques des traitements de médecine traditionnelle chinoise, ainsi que les manifestations cliniques des maladies (telles que la "gastrite chronique"), les thérapies connexes, les méthodes de soins de santé connexes, etc.
- Herbnet vise la recherche traditionnelle en médecine chinoise et construit un corps de médecine chinoise, notamment les maladies traditionnelles de la médecine chinoise, les prescriptions, la médecine traditionnelle chinoise, les composants chimiques, les effets pharmacologiques, les expériences de médecine chinoise traditionnelles et les méthodes expérimentales chimiques basées sur les caractéristiques du modèle traditionnel de champ de médecine chinoise. En outre, une série d'intégration de la base de données est réalisée sur la base de l'ontologie, créant ainsi un graphique de connaissances en médecine chinoise.
- Chip2020 Extraction de la relation d'entité de texte médical chinois
- CCKS2020 NOUVEAU CORONAVIRUS CONSTRUCTION CONSTRUCTION ET Q&R
- outil d'extraction de relation médicale CMEKG CMEKG Extraction de la relation médicale
Reconnaissance d'entité nommée
- Ensemble de données d'identification et d'extraction d'attribut de CCKS2017 pour les dossiers médicaux électroniques chinois
- CCKS2018 Ensemble de données d'identification des entités médicales et d'extraction d'attribut pour les dossiers médicaux électroniques chinois
- CCKS2019 Téléchargement des données Téléchargement médical Identification et extraction d'attribut Ensemble de données pour les dossiers médicaux électroniques chinois
- Chip2020 Chinois Medical Text Naming Entity Reconnaissance
- Chip2020 Identification de l'entité d'instruction de médecine chinoise traditionnelle
- Entités médicales et événements médicaux CCKS2020 pour les dossiers médicaux électroniques chinois
- CMEKG Medical Ner Tool Cmekg Medical Ner
- CCKS2021 Extraction des entités et événements médicaux pour les dossiers médicaux électroniques chinois
QA
- CCIR2019 CACTHORY DE DONNÉES DE DONNÉES CCIR 2019 Basé sur des dossiers médicaux électroniques
- ensemble de données de QA médical chinois CMEDQA
- ensemble de données de données médicale chinoise CMEDQA2 chinois
- CMID chinois médical QA intention de comprendre l'ensemble de données
- Système de questions et réponses intelligentes KGQA basées sur un graphique de connaissances médicales
- Chatbot-Base-on-Knowledge-Graph utilise la méthode d'apprentissage en profondeur pour analyser le problème de dialogue des points de stockage de connaissances du graphique des connaissances basées sur un champ vertical médical
- Données de dialogue médical chinois Données de dialogue médical chinois Données de dialogue médical chinois
- webmedqa webmedqa
- MedDialog le jeu de données MedDialog contient des conversations (en chinois) entre les médecins et les patients. Il a 1,1 million de dialogues et 4 millions d'énoncés.
- CHIP2020 Génération de problèmes de littérature de médecine chinoise traditionnelle
- NLPEC A DATASE DE QUESTIONS MULTIQUES MÉDICAL
- CCKS2021 Génération de dialogue médical chinois contenant des entités
- IMCS21 CBLUE @ Tianchi Chinese Medical Dialogue Medical Dataset IMCS21
- EMPEC Examens-for-Medical-Personnel-in-Chinese (EMPEC)
Standardisation de la terminologie
- Chip2019 Tâche de normalisation de la terminologie clinique: ensemble de données de normalisation du cloud Yidu 7k
- Tâche de normalisation de terminologie clinique ChIP2020
Des phrases similaires au juge
- Défi "Public Welfare AI Star" - Des peines similaires pour le nouveau concours de jugement épidémique du coronavirus ont compilé près de 10 000 questions posées par des patients liés à une pneumonie épidémique, une infection des voies respiratoires supérieures, une tuberculose, l'asthma, la pleurante, l'emphysème, le froid, le CHEGHING de sang, le concours réel, et le concours de concours, et le concours de concours, et le concours de contes Identifiez les problèmes similaires des patients grâce à la technologie de traitement du langage naturel.
Classification de texte
- Chip2019 Critères de dépistage des essais cliniques Classification de texte court
autre
- CHIP2018: Pour le vrai corpus de consultation chinoise de la santé des patients, les questions de correspondance
- CHIP2019 Ping et compétition d'apprentissage des transfert de maladies de technologie médicale
- CCLUE Chinois Clinical Natural Language Processing Algorithm Evaluation Benchmark
- CCKS2021 Compréhension du contenu des connaissances médicales chinoises populaires