Awesome_chinese_medical_nlp
漢方薬NLP公共リソース組織:用語セット/コーパス/ワードベクトル/事前に守られたモデル/知識グラフ/名前付きエンティティ認識/QA/情報抽出/など
ベンチマーク
- 中国の医療情報処理チャレンジリストCBLUEデータセットベースライン中国の医療情報処理チャレンジリストCBLUE(中国生物医学言語理解評価)は、法的開かれた共有の概念の下で中国情報の中国情報の医学的健康とバイオインフォマティクスのプロフェッショナル委員会によって開始されます。 Alibaba Cloud Tianchi Platformがホストし、Yidu Cloud(Beijing)Technology Co.、Ltd。、Ping An Medical Technology、Ping An Medical University、Zhengzhou University、Pengcheng Laboratory、Harbin Institute of Technology(Shenzhen)、Tongji University、Quark、Alibaba Damo Academy and Smart Chysaint ecains exting dirics disis and中国医学NLP技術とコミュニティの開発を促進することを目指しています。
用語セット/コーパス
- 医療ニュース中国の医療ニュースクローラー
- 医療書中国のラテックスオープンソース医療書
- Thuocl Tsinghua University Thunlp Group Medical Vocabulary
- ICD9 ICD-9中国語対応
- ICD10 ICD-10中国語対応
- ICD11 ICD-11中国語対応
- オマハタングラム医療用語収集サンプルデータ
- 中国の糖尿病注釈データセットにはエンティティの注釈と関係注釈が含まれています
単語ベクトル/前処理モデル
- Chinesehrbert Chinese Electronic Medical Record Pre-Training Bert; BERTを使用して、名前付きエンティティ認識、質問と回答モデル、関係抽出タスクをテストします
- MC-BERTCHNESEBLUEデータセットとモデル
- Bertcnerは、名前付きエンティティ認識のための事前に訓練された漢方薬バートモデル
- PCL-Medbert Pengcheng Medical Bert Pre-Trainingモデル
- 中国の臨床自然言語処理におけるメドバートバートモデルの応用に関する調査と研究
- 中国の生物医学分野における中国語-WORD2VECメディシンワードベクトル
- Smedbert Smedbert
- マルチレベルのテキスト差別による中国の生物医学的言語モデルの構築
分詞
- pkusegpkusegの単語セグメンテーションツール、モデルは医学の選択をサポートしています
- cmekg医療単語セグメンテーションツールgithub cmekg医療語セグメンテーションツール
- GTSには、厚さでマークされた2つの粒子サイズの中国の医療語分詞テスト922が含まれています
知識グラフ/リレーショナル抽出
- cmekg github中国の医療知識グラフ
- Ruijin Hospital Assisted Knowledge Graph Contest糖尿病とエンティティ関係タスクの構築の構築糖尿病の注釈と抽出のための臨床ガイドラインの抽出
- オマハ知識グラフ(薬物適応)知識グラフオープンメディカルアンドヘルスケアアライアンス(オマハ)によって構築された薬物および薬物適応に関するデータ
- 医療知識グラフデータ医学知識グラフデータ(OwnShink)
- 患者イベントマップデータセット患者イベントマップは、新しいRDFベースの医療観察データ表現モデルであり、臨床検査、診断、治療など、イベントのタイミング関係など、さまざまなイベントタイプを明確に表すことができます。 3つの上海グレードA病院の電子医療記録データ、3つの専門分野、173,395の医療イベント、501,335のイベントタイミング関係、5,313の知識ベースの概念とのリンクを含む医療データセットを使用して構築されました。
- 中国の症状ライブラリこれは、症状エンティティと症状関連のトリプレットを含むデータセットです。中国の症状データベースからのデータは、8つの主流の健康相談のウェブサイト、3つの中国百科事典のウェブサイト、電子医療記録に由来しています。また、中国の症状の結果とUMLSの概念も含まれています。
- 伝統的な漢方薬症例の知識グラフは、医療ケースから臨床知識を抽出して知識グラフを作成して、従来の漢方薬治療の臨床症状、および疾患の臨床症状(「慢性胃炎」など)、関連療法、関連するヘルスケア方法などを理解するのに役立ちます。
- ハーブネットは、伝統的な漢方薬の研究を目指しており、伝統的な漢方薬、処方、伝統的な漢方薬、化学成分、薬理学的効果、伝統的な漢方薬実験、伝統的な漢方薬の分野モデルの特性に基づいた化学実験方法を含む漢方薬を構築しています。さらに、一連のデータベース統合がオントロジーに基づいて実現され、それによって漢方薬の知識グラフが構築されます。
- CHIP2020中国の医療テキストエンティティ関係抽出
- CCKS2020新しいコロナウイルス知識グラフ構造とQ&A
- CMEKG医学関係抽出ツールCMEKG医学関係抽出
名前付きエンティティ認識
- CCKS2017中国の電子医療記録の医療エンティティの識別と属性抽出データセット
- CCKS2018中国の電子医療記録の医療エンティティの識別と属性抽出データセット
- CCKS2019データダウンロード中国の電子医療記録の医療エンティティの識別と属性抽出データセット
- Chip2020中国の医療テキスト命名エンティティの認識
- CHIP2020従来の漢方薬の指導エンティティの識別
- 中国の電子医療記録のためのCCKS2020医療エンティティとイベント
- CMEKG Medical Ner Tool Cmekg Medical Ner
- CCKS2021中国の電子医療記録のための医療機関とイベント抽出
Qa
- CCIR2019 CCIR 2019データクエリカテゴリは、電子医療記録に基づいています
- CMEDQA中国の医療QAデータセット
- CMEDQA2中国の医療QAデータセット
- データセットを理解するための中国の医療QAの意図
- 医療知識グラフに基づくKGQAインテリジェントQ&Aシステム
- Chatbot-base-on-knowledge-graphディープラーニング方法を使用して問題知識を分析するグラフストレージクエリ知識ポイントダイアログシステムを医療垂直分野に基づいてダイアログシステム
- 中国の医療対話データ中国の医療対話データ中国の医療対話データ
- webmedqa webmedqa
- Meddialog Meddialogデータセットには、医師と患者の間の会話(中国語)が含まれています。 110万のダイアログと400万の発話があります。
- Chip2020の伝統的な漢方薬の文献問題の生成
- NLPEC中国での全国認可された薬剤師試験のための医療マルチ選択質問データセット
- CCKS2021中国の医療対話を含むエンティティを含む
- IMCS21 CBLUE@TIANCHI中国の医療対話データセットIMCS21
- empec試験 - 医療者の間の中国語(EMPEC)
用語の標準化
- CHIP2019臨床用語標準化タスク:Yiduクラウド標準化7Kデータセット
- CHIP2020臨床用語標準化タスク
裁判官の同様の文
- "Public Welfare AI Star" Challenge - Similar Sentences for the New Coronavirus Epidemic Judgment Competition compiled nearly 10,000 questions asked by patients related to epidemic-related pneumonia, mycoplasma pneumonia, bronchitis, upper respiratory tract infection, tuberculosis, asthma, pleuritis, emphysema, cold, coughing of blood, etc. in the real context, and asked the contestants自然言語処理技術を通じて同様の患者の問題を特定する。
テキスト分類
- CHIP2019臨床試験スクリーニング基準短いテキスト分類
他の
- CHIP2018:実際の中国の患者の健康相談コーパスについては、質問の意図を一致させる
- CHIP2019医療技術疾患Q&A転送学習競争
- CCLUE中国の臨床自然言語処理アルゴリズム評価ベンチマーク
- CCKS2021人気の中国の医学知識のコンテンツの理解