CUDAQuest Semantic Crawl to Answer Engineダウンロード-Cudaquest CUDAQuest Semantic Crawl to Answer Engine

CUDAQuest Semantic Crawl to Answer Engine

その他のソースコード

1.0.0

ダウンロード

CUDAドキュメントQAシステム

このプロジェクトは、CUDAドキュメントのための質問応答（QA）システムを実装しています。 Nvidia Cudaのドキュメントをクロールし、データを処理し、ベクトルデータベースに保存し、高度な検索技術を使用してユーザークエリに答える。

特徴

nvidia cudaドキュメントのWebクローリング
セマンティックの類似性に基づいて、高度なデータチャンキング
Milvusデータベースの作成とストレージのベクトル埋め込み
改善された検索のためのクエリ拡張
BM25とBERTベースの方法を組み合わせたハイブリッド検索
言語モデルを使用した質問に答える

セットアップ手順

前提条件

Python 3.7+
PIP（Pythonパッケージインストーラー）

インストール

リポジトリをクローンします：
仮想環境を作成します（オプションですが推奨）：
必要な依存関係をインストールします。

依存関係

このプロジェクトの主な依存関係は次のとおりです。

スクラピー：ウェブクロール用
Sente-Transformers：テキストの埋め込み用
NLTK：自然言語処理タスク用
RANK_BM25：BM25検索用
トーチとトランス：トランスモデルを操作するため
Restream -Lit：Webアプリケーションを作成するため
Selenium and webdriver_manager：Webスクレイピング用
Pymilvus：Milvus Vectorデータベースと対話するため

依存関係の完全なリストについては、 requirements.txtファイルを参照してください。

システムを実行します

Milvusサーバーが実行されていることを確認してください。インストールおよびセットアップの手順については、Milvusドキュメントを参照してください。
メインスクリプトを実行します。3。システムは、CUDAドキュメントをクロールし、データを処理し、Milvusデータベースに保存することから始めます。この最初のセットアップには時間がかかる場合があります。
セットアップが完了したら、CUDAについて質問を始めることができます。システムは、取得された情報に基づいて回答を提供します。
システムを終了するには、質問が求められたら「QUIT」と入力します。

プロジェクト構造

main.py ：プロセス全体を調整するメインスクリプト。
crawler/web_crawler.py ：Webクロールロジックが含まれています。
data_processing/chunking.py ：高度なデータチャンキングテクニックを実装します。
data_processing/embedding.py ：ベクトル埋め込みの作成を処理します。
vector_db/milvus_db.py ：Milvusデータベースとの相互作用を管理します。
retrieval/query_expansion.py ：クエリ拡張手法を実装します。
retrieval/hybrid_retrieval.py ：ハイブリッド検索ロジックが含まれています。
qa/llm_qa.py ：言語モデルを使用して質問回答プロセスを管理します。

カスタマイズ

main.pyのSentenceTransformerモデルを変更することにより、埋め込みモデルを調整できます。
Webクロールの深さは、 crawl_data関数（現在5レベルに設定されている）で調整できます。
回答用の検索されたチャンクの数は、 retrieveメソッド呼び出しでtop_kパラメーターを変更することで変更できます。

トラブルシューティング

問題が発生した場合：

すべての依存関係が正しくインストールされていることを確認してください。
Milvusサーバーが実行され、アクセス可能であることを確認してください。
Webクロールとモデルのダウンロードのための安定したインターネット接続があることを確認してください。

永続的な問題については、GitHubリポジトリで問題を開いてください。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-05-31
サイズ 8.78KB
から Github

CUDAQuest Semantic Crawl to Answer Engine

CUDAドキュメントQAシステム

特徴

セットアップ手順

前提条件

インストール

依存関係

システムを実行します

プロジェクト構造

カスタマイズ

トラブルシューティング

FNF JS Engine

プロジェクトクロール

PHPnow テンプレートエンジン

データライフエンジン

XOOPS エンジン

Xmark テンプレートエンジン

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express