テクノロジーGolang+GoleveldBを使用します
組み込みのXiaobaiデータベースシステム(テキストレベルのフルテキストインデックスデータベースシステム)、組み込みの「フルテキストインデックス」、辞書セグメンテーションは必要ありませんが、検索できない単語はありません。
研究は、元の「Qianlong Tripitaka Search Engine」および「Siku Quanshu検索エンジン」から徐々に改善および改善されました。
大量の情報を整理するために使用でき、テキストレベルのレベルで検索機能を備えています。
また、次のような検索仲介者としてのみ使用できます。
独立して開発されたトラバーサルワードセグメンテーションテクノロジーは、検索エンジンの画期的なテクノロジーであるため、語彙セグメンテーションを必要とせず、検索成功率は100%です。
シソーラスは検索エンジンの中核です。セグメンテーションという言葉は、検索エンジンの目です。目がなければ、何も見えず、何も探していません。
ただし、語彙データベースは基本的に完璧にするのが難しく、完全性を達成することは不可能です。したがって、検索できない単語がいくつかなければなりません。
特に新しい単語の場合、語彙ライブラリにはないため、初めて新しい単語を検索することは不可能です。
新しい単語を検索できない場合、特にeコマース分野で、イノベーションの原動力を殺すことに相当します。
セグメンテーション管理という単語管理ができるだけ早くライブラリに新しい単語を追加したとしても、検索するには、すべての元のデータを通過して結果を得る必要があります。
システムのデータボリュームが大きいほど、新しい単語を追加し、時間が遅いほど慎重になります。
調査、辞書を放棄します。
セグメンテーションライブラリという言葉が他の検索エンジンの目である場合、この目は肉眼です。分詞を横断する目は天国の目です。
他の単語セグメンテーション手法は、単語セグメンテーションデータベースの不完全性のために結果を検索できない可能性につながります。つまり、検索成功率は100%です。
極端な例を示すには:
すべての記事を逆さまにして、逆の単語でも検索します。
他の単語分詞手法では、おそらく何も検索できません。
検索成功率は、トラバーサルワードセグメンテーションテクノロジーで100%です。
検索の粒度をカスタマイズできます。
GoogleやBaiduなどの一般的な検索エンジンでは、検索の粒度は記事全体です。
調査では、段落、文などにカスタマイズできます。
通常、正確な粒度は文として定義されます。
数百億のデータ、ミリ秒の応答。
単語セグメンテーションの必要はなく、単語セグメンテーションを解析する必要はないため、他の単語セグメンテーションテクノロジーを使用した検索エンジンよりも高いパフォーマンスを持っています。
リアルタイム検索をリアルタイムで追加します。
10Gレベルのテキストデータには、数十mのメモリのみが必要です。
対応するシステムの実行可能ファイルを開き、実行します。