素晴らしいNLPプロジェクト
これは、オタクが存在するために笑顔になる自然言語処理(NLP)に直接接続されている、または有用なプロジェクトのキュレーションされたリストです。 Joseph MisitiのGithubプロジェクトに触発されました
関連リスト:
- Awesome-nlp
- nlp-with-ruby
- Awesome-Community-Curated-NLP
- Awesome-dl4nlp
- Awesome-D3
- 素晴らしいパイソン
- Awesome-data-science-viz
- 素晴らしい学習
- Awesome-rl
- Awesome-rnn
- 素晴らしいパブリックデイタセット
コンテンツ
- リソースとフレームワーク
- 関連リスト
- 深い学習グッズ
- 機械学習
- 言語モデリング
- その他のML
- 他のかっこいいもの
- 貢献する
- ライセンス
- ダイアログフレームワーク
周期表
チートシート
- MLチートシート
- ディープラーニングチートシート
- データのschience
- NLPベストプラクティスの深い学習
- データ視覚化ウィキペディア
リソースとフレームワーク
- ApacheNLPcraft-自然言語をアクションリンクに変換するAPI
- 旅行。セマンティックレキシコンリンク。セマンティックパーサーリンク。 [リンク](http://trips.ihmc.us/parser/cgi/parse)
- C&Cボクサー。セマンティックパーサーリンク
- エピログ。エピソードロジックフレームワークリンク
- Knext(伝承プロジェクトの継続)。エピソードロジックへの知識抽出(babelnetに類似)リンク
- フレッド。セマンティックパーサー/知識抽出器リンク。 link2。関連ツールlink3
- Legaloは、直接使用可能なマシン読み取り可能な情報を作成するために、教師なしでオープンドメイン、およびテキストからの抽象的な知識抽出を実行する新しいオープンナレッジ抽出アプローチです。リンク
- Delph-in。 NLPのより広範なプロジェクト。文法、パーサー、リンク
- LKB。 LKBシステムは、統一ベースの言語形式主義で使用する文法および辞書開発環境です。リンク
- モルトパーサー。依存科の構文パーサーリンク
- ヤゴ。ナレッジベースリンク
- ゲート 。テキストエンジニアリングパイプラインリンク
- enju。構文パーサーリンク
- NLPを開きます。 JavaリンクのNLPフレームワーク
- Corenlp。解析リンクのためのスタンフォードコアNLPフレームワーク
- nltk。 PythonリンクのAwersome NLPフレームワーク
- pynlpl。自然言語処理のためのPythonライブラリ。一般的であまり一般的ではないNLPタスクに役立つさまざまなモジュールが含まれています。リンク
- バレックス。英語動詞リンクの分類
- 統一された動詞インデックス。 VerbnetおよびFramenet togetehrリンク
- Scikit-Learn。 Pythonでの機械学習。データマイニングとデータ分析リンクのためのシンプルで効率的なツール
- タフィ。スケーラブルなマルコフロジック推論エンジンリンク
- fexlix。 Tuffy Linkの後継者
- 錬金術。マルコフロジック表現リンクに基づいて、統計的リレーショナル学習と確率論的論理推論のためのアルゴリズム
- pracmln。 PythonのMarcov Logic、このプロジェクトはProbcongプロジェクトへのフォークとして始まりました。もっとリンクを見つけてください
- probcog。 ProbCogは、リレーショナルドメインリンクの効率的な学習と推論をサポートする統計的リレーショナル学習および推論システムです
- Kreator。 Kreatorは、リレーショナル確率的知識表現言語の統合開発環境(IDE)です。現時点では、Kreatorはベイジアンロジックプログラム(BLPS)、マルコフロジックネットワーク(MLNS)、リレーショナル最大エントロピー(RME)、リレーショナルベイジアンネットワーク(RBN)、および確率的Prolog(Problog)をサポートしています。リンク
- pyhtm。 Pyhtm- Pythonの階層的時間的メモリ。 。当社のマシンインテリジェンステクノロジーは、新皮質の詳細な計算理論である階層時間メモリ(HTM)と呼ばれます。 HTMのコアには、空間パターンと時間的パターンを保存およびリコールする時間ベースの学習アルゴリズムがあります。 HTMは、さまざまな問題、特に次の特性を持つ問題に適しています。静的データベースではなくストリーミングデータ。データの根底にあるパターンは時間とともに変化します。ハンドクラフト別々のモデルが非現実的である多くの個々のデータソース。常に人間に見られない微妙なパターン。時間ベースのパターン。しきい値などの単純な手法は、かなりの誤検知と偽陰性をもたらします。 [リンク](https://github.com/carver/pyhtm)
- 知っている。 Knowrobは、知識表現と推論方法を、知識を習得し、物理システムの知識を接地するための技術を組み合わせた知識処理システムであり、さまざまなソースから情報を統合するための共通のセマンティックフレームワークとして機能します。 Knowrobは、静的な百科事典の知識、常識的な知識、タスクの説明、環境モデル、オブジェクト情報、さまざまなソースから取得された観察されたアクション(手動で公理化された、観察から派生、またはWebからインポートされた)を組み合わせます。さまざまな決定論的および確率的推論メカニズム、クラスタリング、分類、セグメンテーション方法をサポートし、クエリインターフェイスと視覚化ツールを含んでいます。リンク
- ghmm。一般的なHidden Markov Model Library(MMM)は、個別の排出量と連続排出量を備えた基本および拡張HMMの効率的なデータ構造とアルゴリズムを実装する自由に利用可能なCライブラリです。より良いインターフェイスと追加の機能を提供するPythonラッパーが付属しています。リンク 。 Pyhsmm "これは、ベイジアン隠されたマルコフモデル(HMMS)および明示的な期間の隠れた半マルコフモデル(HSMMS)における近似監視されていない推論のためのPythonライブラリです。要因モデル
- プリズム。シンボリック統計モデル。時間的論理と定量的拡張のモデルチェッカー。リアルタイムシステムの検証。マルコフモデルなど。リンク
- ウービー。大規模な統一された語彙セマンティックリソースリンク
- ダックリング。寸法の確率CFGパーサー(時間、温度、サイズなど)リンク
- スリング - 自然言語フレームセマンティクスパーサー。ディープリカレントニューラルネットワークリンクを使用して実装されたセマンティックパーサー
- 機知。意図パーサーリンク
- Mycroft。 Pythonリンクで別の意図パーサー、Speech2Text、およびText2speechフレームワークを作成する会社
- iepy。 IEPYは、関係抽出に焦点を当てた情報抽出のためのオープンソースツールです。
- マイティ。このプロジェクトは、最先端の情報抽出ツールを無料で(商業用に使用する場合でも)提供します。現在のリリースには、名前付きエンティティ抽出およびバイナリ関係検出を実行するためのツール、およびカスタム抽出器と関係検出器をトレーニングするためのツールが含まれています。リンク
- SynTaxNet。自然言語理解(NLU)システムの基礎を提供するTensorflowのオープンソースニューラルネットワークフレームワーク。リリースには、独自のデータで新しいSyntaxNetモデルをトレーニングするために必要なすべてのコードと、Parsey McParseface、英語のパーサーであるParsey McParsefaceが含まれています。リンク
- オープンジム。強化学習アルゴリズムを開発および比較するためのツールキット。リンク
- スピフワークフロー。 Spiffワークフローは、ワークフローのフレームワークを実装するライブラリです。 http://www.workflowpatterns.comに基づいており、Pure Pythonに実装されています。 Link [ワークフローパターン](http://www.workflowpatterns.com/)このイニシアチブの目的は、プロセステクノロジーの概念的基盤を提供することです。特に、この研究では、ワークフロー言語またはビジネスプロセスモデリング言語でサポートする必要があるさまざまな視点(制御フロー、データ、リソース、例外処理)の徹底的な調査を提供します。
- ニュースリーダープロジェクト。リンク
- word2vec(データセットも含む)リンクを使用して、pythonのワードセンス分解ツールキット
- Folia形式のリンク用の注釈付きドキュメントサーバー
- Foliaおよびその他の形式でコーパスアノテーションを操作するのに役立つツールキット(Dan's Corpkitと比較)リンク
- Pythonリンク用のVaderSentiment Sentiment Analysis Tool
- Wowpal Wabbit-構造化された予測技術リンクを使用した再導入学習セットアップ。 Vowpal Wabbitは、オンライン、ハッシュ、AllReduce、削減、Learning2Search、アクティブ、インタラクティブな学習などのテクニックを使用して、機械学習のフロンティアをプッシュする機械学習システムです。リンク
- TIMBL-いくつかのメモリベースの学習アルゴリズムを実装するオープンソースソフトウェアパッケージ。その中には、シンボリック機能スペースに適した機能の重み付けとIB1-IGの意思決定ツリー近似に適した機能の重み付けを伴うK-NEARest Neighbor分類の実装です。リンクlink1 link3
- パイクス - 知識抽出スイートリンクリンク
- rdfpro -Swiss knowfe ro rdf操作、ストリームベースRDF処理リンク
- スペイシー - PythonおよびCythonリンクを備えた産業強度自然言語処理(NLP)
- テキスタシー - スペイシーリンクの上に構築された高レベルNLP
- UKB-グラフベースのWSDおよび類似性リンク
- マルセイユ - 表現力のある推論を伴うマイニング引数構造(線形およびLSTMエンジン)リンク
- 流体構造文法 - リンク
- Python認知モデリングスイート - リンク
- RASA-自然言語理解リンク
- SenticNet- SenticNetについて話すことは、コンセプトレベルの感情分析、つまり、単語の共起頻度のみに依存してセマンティクスや言語学を活用することにより、極性検出や感情認識などのタスクを実行することです。リンクリンク
深い学習グッズ
- ニューラルストーリーテラーコード
- オープンタイプのエンティティ認識システムコード
リソース
- BABELNET-多言語エキシクロペディックディクショナリリンク
- Nasari -Babelnetリンクのセマンティックベクトル表現
言語モデリング
- ジュリアリンクでのアダプティブスキップグラム実装
- Skip Sente Encoderコード、ペーパー
- 気配りのある読者コード、紙
- gensim- pythonのトピックモデリングライブラリには、vord2vec実装リンクも含まれています
- vord2vec-元のC実装といくつかの事前計算されたリソースリンク
- Skip Sente Encoderコード、ペーパー
- 気配りのある読者コード、紙
- FastText-高速でより良いテキスト分類、高速テキストの表現と分類のためのライブラリ。リンク
- ERERSENT-NLIリンクの文章埋め込み(インサーセント)とトレーニングコード
その他のML
- ディープラーニングプラットフォームMXNET + Nuympyコード
他のかっこいいもの
- ノードボックス。 Nodeboxを使用すると、データの視覚化、生成設計、複雑な生産の課題を簡単に実行できます。リンク
- Callimacus-リンクされたオープンデータ、RDF、Webアプリケーション、データの視覚化など
- 機能Forge。このライブラリは、多くの機械学習アプリケーション(分類、クラスタリング、回帰など)で役立つ可能性のある一連のツールを提供し、特にScikit-Learnを使用する場合に役立ちます(ただし、これは別のアルゴリズムがある場合に機能します)。 [リンク] [https://github.com/machinalis/featureforge/tree/master]
- ストーリージェネレーターアルゴリズム。 [リンク] [http://wikis.sub.uni-hamburg.de/lhn/index.php/story_generator_algorithms]
- OpenCog AI Framework OpenCogは、数学的および生物学的インスピレーションと専門的なソフトウェアエンジニアリング技術を使用して、人工的な一般情報(AGI)チャレンジに直接立ち向かうことを目的としたオープンソースソフトウェアプロジェクトです。 。リンク
- Folia Linguistic Annotation Toolリンク
- Webanno-言語アノテーションツールリンク
- Visom-ライブの豊富なデータの視覚化を作成、整理、共有するための柔軟なツール。リンク
ダイアログフレームワーク
- チャットスクリプト - 自然言語ツール/ダイアログマネージャー-link1、link2、
- Chatter Bot -Chatterbotは、ユーザーの入力に対する自動化された応答を簡単に生成できるPythonライブラリです。 Chatterbotは、さまざまな種類の応答を作成するために、機械学習アルゴリズムの選択を使用しています。
- rivescript -rivescriptは、フレンドリーで学習しやすい構文を備えたチャットボット用のシンプルなスクリプト言語です。 Go、Java、JavaScript、Perl、またはPythonで独自のチャットボットを作成します。
- SuperScript-会話型UI用のダイアログシステムとボットエンジン。
- BOTKIT -BOTKITは、メッセージングプラットフォーム内に住んでいる便利で創造的なボットの設計と実行のプロセスを容易にするように設計されています。
同様のリスト
- 素晴らしいNLP
- 素晴らしいDL NLP
- ロチェスター大学プロジェクトリスト。潜在的に有用なリンク。リンク
- Misitiのリスト。リンク
- 説明論理推論者。 Reashersリンクのリスト
- イリノイ州プロジェクトリスト。 Illinois Cognitive Computation Groupリンクのソフトウェア
貢献する
貢献を歓迎します!最初に貢献ガイドラインを読んでください。
ライセンス
法律の下で可能な限り、Eugeniu Costezkiは、この作業に対するすべての著作権および関連または隣接する権利を放棄しました。