
[rubyml | rubydatascience | rubyinterop]

Rubyのテキスト処理に役立つリソース
このキュレーションされたリストは、Rubyプログラミング言語を使用した人間言語のテキストの計算処理に関する素晴らしいリソース、ライブラリ、情報源で構成されています。その分野は、多くの場合、NLP、計算言語学、HLT(人間の言語技術)と呼ばれ、人工知能、機械学習、情報検索、テキストマイニング、知識抽出、その他の関連分野と連携して持ち込むことができます。
このリストは、言語モデルとNLPツールに関する日々の作業からのものです。このリストが素晴らしい理由を読んでください。私たちのFAQは、あなたが興味を持っているかもしれない重要な決定と有用な答えを説明しています。
すべての貢献は大歓迎です!プルリクエストを介してリンクを追加するか、問題を作成してディスカッションを開始します。
Twitterでフォローしてください。 #RubyNLPハッシュタグを使用して単語を広めてください!
このセクションに記入するのを手伝ってください! ?
NLPパイプラインは、プレーンテキストから始まります。
言語識別は、すべてのNLPパイプラインで最初の重要なステップの1つです。
トークン化、単語および文の境界検出および曖昧性を除去するためのツール。
STEMMINGは、いくつかのベース表現にワードフォーフォームを縮小するプロセスを説明するために情報検索で使用される用語です。 stems必ずしも言語的動機を持っているわけではないため、茎は皮肉化と区別する必要があります。
一化は、単語のベース形式を見つけるプロセスと見なされます。補題はしばしば辞書で収集されます。
StringとHashオブジェクトのワードカウンター。純粋なルビーの機械学習アルゴリズム、またはルビーに適切なバインディングを備えた他のプログラミング言語で記述されています。
最新のリストについては、Rubyリスト付きのAwesome MLをご覧ください。
Rubyリストを使用して、データサイエンスのデータ視覚化セクションを参照してください。
言語認識文字列の操作、すなわちパターンマッチング、ケース変換、トランスコーディング、基礎となる言語に関する情報が必要な正規表現のライブラリ。
ActiveSupport Gemには、ケースを処理できるさまざまな文字列拡張機能があります。このセクションのすべてのプロジェクトは、コミュニティにとって本当に重要ですが、もっと注意が必要です。空き時間と献身がある場合は、ここでコードに数時間費やしてください。
Andrei Beliankouと貢献者によるAwesome NLP with Ruby 。
法律の下で可能な限り、CC0をAwesome NLP with Rubyに関連付けた人はAwesome NLP with Rubyに対するすべての著作権および関連する権利または近隣の権利を放棄しました。
この作業とともに、CC0 LegalCodeのコピーを受け取る必要があります。そうでない場合は、https://creativecommons.org/publicdomain/zero/1.0/を参照してください。