NLP Knowledge Graph
1.0.0
このオープンソースプロジェクトに貢献する必要がある場合は、私に連絡してください。
認知インテリジェンスシリーズ---トレンド:1。データ融合知識。 2。すべてLLM。知識の習得、知識ベースの構築、および知識ベースに基づくQ&Aシステムの一連の技術研究と適用を含む。これには、NLPの分野に最先端のテクノロジーと論文が含まれます。
NLP-PROGRESS
データセットや最も一般的なNLPタスクの現在の最先端を含む、自然言語処理(NLP)の進捗状況を追跡するリポジトリ。
PaperSwithCode
論文とコードが提供されています。
テクノロジーオンライン
個人的な毎日のテクノロジーとチャットウェブサイト。
| シリアルナンバー | 記事 |
|---|---|
| 1 | 「知識グラフ」が1956年に戻るのはなぜですか? |
| シリアルナンバー | 名前 | 学年 | タイプ | 分野 |
|---|---|---|---|---|
| 1 | ACL | クラスA | 学会 | ai |
| 2 | CVPR | クラスA | 学会 | ai |
| 3 | ICML | クラスA | 学会 | ai |
| 4 | ijcai | クラスA | 学会 | ai |
| 5 | emnlp | クラスb | 学会 | ai |
| 6 | cikm | クラスb | 学会 | データベース/データマイニング/コンテンツの取得 |
| 7 | aaai | クラスA | 学会 | ai |
| 8 | sigkdd | クラスA | 学会 | データベース/データマイニング/コンテンツの取得 |
| 9 | TKDE | クラスA | 学術雑誌 | (データベース/データマイニング/コンテンツの取得) |
| 10 | シギル | クラスA | 学会 | データベース/データマイニング/コンテンツの取得 |
| シリアルナンバー | 名前 | 住所 |
|---|---|---|
| 1 | QuestionAnsweringsystem | QuestionAnsweringsystemは、質問を自動的に分析して候補者の回答を与えることができるJavaが実装した人間コンピューターの質問と回答システムです。 |
| 2 | QabasedOnMedIcakNowledgeGraph | ゼロから、特定の疾患中心の医療フィールドナレッジグラフを構築し、この知識グラフを使用して、自動的な質問と回答および分析サービスを完了します。 Python |
| 3 | deeppavlov | エンドツーエンドのダイアログシステムとチャットボットを深く学習するためのオープンソースライブラリ。 Python |
| シリアルナンバー | 名前 |
|---|---|
| 1 | Tencent Wenzhi Chinese Semantic Platform |
| 2 | iflytekオープンセマンティックプラットフォーム |
| 3 | 中国のセマンティクスオープンプラットフォームを骨折しました |
| 4 | Harbin Institute of Technology Language Cloud |
| シリアルナンバー | 名前 | 主な関数 |
|---|---|---|
| 1 | thulac | 中国の語彙分析ツールは、TsinghuaによるC ++/Java/Pythonをサポートしています |
| 2 | LTP | 言語技術プラットフォームPylyp LTP Python Packaging by Harbin Institute of Technology |
| 3 | hanlp | Javaをサポートします |
| 4 | st音分詞 | 中国語の単語分詞(単語分詞分詞のみ)、java、python、c ++ |
| 5 | jiagu | 中国語の単語セグメンテーション、スピーチの一部のアニット、命名エンティティ認識、キーワード抽出、テキストの概要、新しい単語発見などの一般的な自然言語処理機能を提供します。 Python |
| 6 | fudannlp | 中国語の単語分詞(単語分詞、一部の語り方、エンティティ認識の命名)は、Javaをサポートします |
| 7 | ディープディーブディーディーブ | スタンフォード大学のオープンソースナレッジ抽出ツール(トリプル抽出)は、Pythonをサポートしています |
| 8 | fudandnnnlp3.0 | 中国語の単語のセグメンテーション、命名認識、一部の語り方、文の分類、セマンティック分析、知識ベースのアクセス、対話の質問と回答に使用され、Javaをサポートし、javaをサポートします。 |
| 9 | スタンフォード・コレンルプ | 多言語の品物マーカー、ネーミングエンティティ認識者、パーサー(文および文法構造)、参照ダイジェスター(つまり、この章で代名詞が指す名詞を決定するという問題)、センチメントアナライザー、ガイド付きモード学習者、オープン情報抽出者、Java/Python----スタンフォードコレンプはスターンフォード大学の責任者向けexplesed expect jeva |
| シリアルナンバー | 名前 | 主な関数 |
|---|---|---|
| 1 | neo4j | Javaが開発したオープンソースグラフデータベース。 |
| 2 | OrientDB | ドキュメント、グラフィックス、従来のデータベースコンポーネントを処理できるオープンソースNOSQLデータベース。 Javaによって書かれた、高速ストレージ。 |
| 3 | 名手 | RDFおよびSPARQLクエリをサポートします。 |
| 4 | タイタン | Gremlin/HBaseと統合して、分散ストレージおよびコンピューティンググラフデータ処理を可能にすることができます。 |
| 5 | Apache Jena-Idb | JavaでRDFを操作します。その中で、TDBはトリプルストアを使用して、RDFデータに永続的なストアを提供しています。 TDBは、RDBおよびSDBよりも高速でスケーラブルです。 |
| 6 | cypher | 宣言的なグラフクエリ言語、効率的なクエリ、および更新グラフデータベースを表現します。 |
| 7 | グレムリン | ユーザーが複雑なプロパティグラフのトラバーサルまたはクエリを簡潔な方法で表現できるようにする機能的なデータフロー言語。 |
| 8 | sparql | RDF向けに開発されたクエリ言語およびデータ収集プロトコル。 |
| 9 | rdflib | Python、RDF/XML、N3、NTRIPLES、N-QUADS、TURTLE、TRIX、RDFA、MICRODATAに基づいて書かれたパーサーとシリアイザーは、SPARQL 1.1クエリと更新ステートメントをサポートします。 |
| シリアルナンバー | 名前 | 主な関数 |
|---|---|---|
| 1 | echarts | Baiduオープンソースツール、完全なAPIカプセル化、シンプルで使いやすい、使いやすいが、イベント処理をサポートしていない。 |
| 2 | cytoscape.js | グラフィックとネットワークの場合、イベントのインタラクティブは良好で使いやすいです。 |
| 3 | d3.js | 使用のしきい値は高いですが、イベントプロセッサをサポートしています。 D3は非常に小さく、大きなデータセットとインタラクティブなアニメーションの動的な動作をサポートし、豊富なグラフィックスをサポートしています。 |
| シリアルナンバー | 名前 | アプリケーションタスク |
|---|---|---|
| 1 | openkg | オープンナレッジグラフ |
| 2 | CN-Probase | 大規模な中国のコンセプトマップ |
| 3 | センチブリッジ | 中国の団体感情的知識ベース、人々がニュース、観光、ケータリングなどのエンティティをどのように説明するかを描いています。合計300,000ペア |
| 4 | 音楽知識グラフ | 中国の音楽知識グラフ、歌手、歌、その他の情報 |
| 5 | キャラクターRDFの知識 | Encyclopedia Webサイトから収集されたキャラクターの知識、合計650,000 RDFトリプル |
| 6 | 中国の観光アトラクションの知識グラフ | 中国の観光アトラクションの中国の知識マップは、Casia-KBナレッジマップの一部です。 Baidu百科事典とインタラクティブな百科事典から抽出されました。観光名所の知識マップは、地理、生活、エンターテイメント、その他のアプリケーションで使用できます。 |
| 7 | 200万の製品ポートレートデータ | このデータは、7年間の運用でBai Danによって蓄積された製品のポートレートデータの概要です。 Bai Danは、豊富なeコマース分類システムとメディア分類システムを構築しました。 |
| 8 | 中国の症状銀行 | これは、症状エンティティと症状関連のトリプレットを含むデータセットです。中国の症状データベースからのデータは、8つの主流の健康相談のウェブサイト、3つの中国百科事典のウェブサイト、電子医療記録に由来しています。 |
| 9 | CNSchema空港の知識グラフ | CNSchemaに基づく空港の知識グラフは、名前、タイムゾーン、空港コード、地理的位置(緯度と経度)など、世界中の空港のプロパティを照会できます。 |
| 10 | セブンキャラクターの詩総知識グラフ | このデータには、7文字の詩のサブセットの一部である合計8,000万百万百万百万百科大学のトリプレットが含まれており、将来はさらにオープンになります。 Qiluo-7loreは、Dogtail Grassテクノロジーによって慎重に作成された百科事典の知識グラフです。それは人間の世界における膨大な知識のコレクションです。物事、事実、概念、ルールなどが含まれています。 |
<strong>テキストデータの構造については、機械学習方法を使用することに加えて、正規表現をデータ抽出、モデリングの中間処理リンクなどにも使用できます。たとえば、正規表現と深い学習</strong>