search engine systemダウンロード - search engine systemソースコードのダウンロード

search engine system

その他のソースコード

v1.0.0

ダウンロード

検索エンジンシステム

ベクトルの類似性を使用して、画像とテキストの両方の検索機能をサポートするスケーラブルな検索エンジンシステム。

画像検索

テキスト検索

システムアーキテクチャ

システムアーキテクチャ

特徴

画像検索エンジン：深い学習埋め込みを使用して同様の画像を検索する
- 詳細なドキュメント
- QDRANTを使用したベクトルの類似性検索
- 複数の画像形式のサポート
- リアルタイムの画像処理と埋め込み生成
- 機能抽出のためのResNet/EfficientNetアーキテクチャに基づいています
テキスト検索エンジン：ElasticSearchを使用した高度なテキスト検索
- 詳細なドキュメント
- デュアル検索機能：
  - エッジNGRAMトークネイザーを使用して、オートコンプリート（検索タイプ）
  - ファジーマッチングによるフルテキスト検索
- ビジネスメトリックに基づくカスタムスコアリング
- アイテムとショップ名を横切るマルチフィールド検索
- ベトナム語のサポート

技術的な詳細

画像検索パイプライン

前処理：
- 画像のサイズ変更と正規化
- トレーニングのためのデータ増強
- JPEG、PNG、およびWebP形式のサポート
機能抽出：
- ディープCNNアーキテクチャ（resnet/efficientnet）
- クロスプラットフォーム互換性のONNX形式
- GPU推論のためのTensortの最適化
- 出力：512/1024次元の埋め込みベクター
ベクトルストレージと検索：
- 効率的な類似性検索のためのQDRANTベクターデータベース
- 高速近くの近隣検索のためのHNSWインデックス
- 構成可能な距離メトリック（Cosine/Euclidean）

テキスト検索パイプライン

テキスト処理と分析：
- カスタムElasticsearchアナライザー：
  - 小文字とASCII折りたたみを備えたキーワードアナライザー
  - Autocomplete用のEdgeNgramアナライザー（min_gram：2、max_gram：5）
  - フルテキスト検索用の標準アナライザー
- キャラクターフィルターとトークン化
- ベトナムのテキストのサポート
検索アプローチ：
1. AutoComplete（検索タイプ） ：
  - プレフィックスマッチング用のエッジNGRAMトークネザー
  - カスタム完了提案者
  - 即座の提案用に最適化されています
  - 提案のための最低2文字
2. フルテキスト検索：
  - フィールド全体のマルチマッチクエリ：
    - item_name
    - shop_name
  - オートファジネスと一致するファジー
  - ビジネスメトリックに基づくカスタムスコアリング：
    - 販売率（割引率）
    - 販売量（> 1000販売ボーナス）
    - アイテムの価格正規化
検索最適化：
- ElasticSearchスクリプトを使用したカスタムスコアリングテンプレート
- 効率的なデータ摂取のためのバッチインデックス
- 非同期検索操作
- 構成可能な結果サイズ
- エラー処理とロギング
ElasticSearch機能：
- カスタムインデックスマッピング
- 複数のフィールドタイプとアナライザー
- 関数スコアクエリ
- スクリプトベースのスコアリング
- バルクインデックス操作

テクノロジースタック

モデルサービング

Nvidia Triton Inference Server ：
- Tritonサーバーのドキュメント
- モデルバージョン化とA/Bテスト
- 動的バッチ
- 同時モデルの実行
- Tensortを使用したGPU最適化
- モデル形式変換パイプライン：
  - pytorch→onnx→tensorrt

インフラストラクチャー

コンテナ化：
- Dockerマルチステージビルド
- 最適化されたコンテナ画像
- Dockerは開発のために作曲します
オーケストレーション：
- Kubernetesの展開
- パッケージ管理のためのヘルムチャート
- 水平ポッドの自動化
- リソース管理とスケーリング
監視とロギング：
- プロメテウスメトリック
- グラファナダッシュボード
- 分散トレース
- パフォーマンス監視

はじめる

リポジトリをクローンします：

git clone https://github.com/vectornguyen76/search-engine-system.git

Docker Composeを使用してサービスを開始します。

docker-compose up -d

サービスへのアクセス：

画像検索UI：http：// localhost：8501
テキスト検索UI：http：// localhost：8502
Triton Server：http：// localhost：8000

発達

CI/CDパイプライン

開発環境：
- コードリント（flake8）
- ユニットテスト
- 統合テスト
ステージング環境：
- パフォーマンステスト
- 負荷テスト
- セキュリティスキャン
生産環境：
- 青緑色の展開
- 自動ロールバック
- パフォーマンス監視

コード品質

Pythonコードの糸くずのFLAKE8
ヒントとドキュメントを入力します
CI/CDパイプラインでの自動テスト
コードレビュープロセス

貢献

リポジトリをフォークします
機能ブランチを作成します
あなたの変更をコミットします
枝に押します
新しいプルリクエストを作成します

ライセンス

このプロジェクトは、MITライセンスに基づいてライセンスされています。詳細については、ライセンスファイルを参照してください。

拡大する

追加情報

バージョン v1.0.0
タイプその他のソースコード
更新時間 2025-05-27
サイズ 92.8MB
から Github

search engine system

検索エンジンシステム

システムアーキテクチャ

特徴

技術的な詳細

画像検索パイプライン

テキスト検索パイプライン

テクノロジースタック

モデルサービング

インフラストラクチャー

はじめる

発達

CI/CDパイプライン

コード品質

貢献

ライセンス

FNF JS Engine

単語検索 800

リスクシステム

ハンフォックス検索エンジン

データライフエンジン

XOOPS エンジン

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express