Flask Based API for Document Retrievalダウンロード - Flask Based API for Document Retrievalダウンロード

Flask Based API for Document Retrieval

その他のソースコード

1.0.0

ダウンロード

松ぼっくり、キャッシュ、レートの制限、および背景スクレイピングを備えたドキュメント検索用のフラスコベースのAPI

プロジェクトの概要

このプロジェクトは、ベクトル検索のためにPineconeを使用してドキュメントを取得するように設計されたフラスコベースのAPIです。次のような機能が含まれています。

より速い検索のためのキャッシュ
API使用量を制御するためのレート制限
データベースを定期的に更新するためのバックグラウンドスクレイピング
展開とスケーラビリティを簡単にするためのドキュカリゼーション

アプリケーションは使用します：

ベクトルベースのドキュメント検索用の松ぼっくり
テキストの埋め込みを生成するためのフェイストランス（BERT）を抱きしめます
ユーザー管理とAPI使用の追跡のためのFlask-sqlalchemy
APIのキャッシュ結果のためのフラスコキャッシング
レート制限ユーザー用のフラスコリミター
コンテナ化された環境にアプリをパッケージ化するためのDocker

アプローチとプロジェクトの流れ

1.フラスコAPIのセットアップ

基本的なフラスコアプリケーションとAPIエンドポイントをセットアップすることから始めました。

/health ：APIが実行されているかどうかを確認するための簡単なエンドポイント。
/search ：テキスト埋め込みを使用してPineconeを照会し、結果を取得するエンドポイント。

2。バートに生成を埋め込みます

クエリごとに、事前に訓練されたBERTモデルを使用して埋め込みを生成します（Faceのtransformersライブラリを抱き締める）。これらの埋め込みは、Pineconeを使用してベクトル検索を実行するために使用されます。

3。Pineconeとの統合

ベクトルデータベースであるPineconeを統合して、ドキュメントの埋め込みを保存およびクエリしました。これにより、類似性検索に基づいて、ドキュメントの効率的かつ迅速な検索が可能になります。

4。レート制限とユーザー管理

Flask-Limiterを使用してレート制限を実装して、ユーザーが毎分5つ以上のリクエストを作成することを制限します。

ユーザーは、 Flask-sqlalchemyのSQLiteデータベースを使用して追跡されます。
ユーザーがレート制限を超えた場合、APIはHTTP 429エラーを返します（リクエストが多すぎます）。

5。より速い検索のためのキャッシュ

Flask-Cachingを使用してキャッシングを追加しました。キャッシングにより、メモリから同一のクエリが提供されるようになり、データベースとベクトル検索エンジンに繰り返しヒットする必要性が減ります。キャッシュされた結果は5分後に期限切れになります。

6。背景スクレイピング

記事やデータのユーザーが提供するWebサイトをこすり、新しいドキュメントでPineconeインデックスを更新できる背景スクレーパーを実装しました。

スクレイピングはBeautifulSoupによって処理されます。
スクレイピングタスクは、別のスレッドでバックグラウンドで実行され、定期的にPineconeインデックスを更新します。

7。ドキュカリゼーション

DockerFileを使用してプロジェクトをDockerizしました。これにより、プロジェクトは、さまざまなシステムで一貫した動作を持つあらゆる環境に簡単に展開できます。

特徴

ドキュメント取得：埋め込みを使用した類似性検索に基づいてドキュメントを取得します。
レート制限：ユーザーごとにリクエストを1分あたり5に制限することにより、APIの悪用を防ぎます。
キャッシング：応答時間を速くするために、同様のクエリの結果をキャッシュします。
ユーザー管理：各ユーザーが作成したAPI呼び出しの数を追跡します。
バックグラウンドスクレイピング：バックグラウンドでWebサイトをこすり、Pineconeインデックスを継続的に更新します。
Dockerization ：Dockerを使用してアプリケーションを簡単に実行および展開します。

プロジェクト構造

 project/
├── app.py               # Main Flask application
├── database.py          # Database setup for user management
├── cache.py             # Caching configuration
├── limiter.py           # Rate limiting configuration
├── utils.py             # Utility functions (embedding, Pinecone query)
├── scraping.py          # Background scraping logic
├── requirements.txt     # Python dependencies
├── Dockerfile           # Docker configuration
├── .env                 # Environment variables (not committed to version control)
├── .dockerignore        # Ignore unnecessary files in the Docker build
└── README.md            # Project documentation

キーファイル：

app.py ：フラスコアプリケーションとすべてのAPIルートが含まれています。
database.pyを使用してユーザー管理のセットアップとスキーマを処理します。
cache.py ：応答時間を速くするためにキャッシュを管理します。
limiter.py ：レート制限機能を実装します。
utils.py ：埋め込みを生成し、松ぼっくりを照会するためのヘルパー関数を提供します。
scraping.py ：バックグラウンドのスクレイピングと更新のロジックが含まれています。
Dockerfile ：Dockerコンテナでアプリケーションを構築および実行するために使用されます。

セットアップとインストール

前提条件：

Python 3.9+
Docker

ステップ1：リポジトリをクローンします

 git clone <repository-url>
cd project

ステップ2：仮想環境を設定します（オプションですが推奨）

 python -m venv venv
source venv/bin/activate  # On Windows, use venvScriptsactivate

ステップ3：依存関係をインストールします

 pip install -r requirements.txt

ステップ4：環境変数を設定します

プロジェクトルートに.ENVファイルを作成し、Pinecone APIキーと環境を追加します。

 PINECONE_API_KEY=your_pinecone_api_key
PINECONE_ENVIRONMENT=your_pinecone_environment

ステップ5：データベースを初期化します

データベースを設定するには、次のコードを実行します。

 >>> from app import db, app
>>> with app.app_context():
>>>     db.create_all()

ステップ6：アプリケーションを実行します

 python app.py

アプリはhttp://localhost:5000で実行されます。

Dockerセットアップ

ステップ1：Docker画像を作成します

 docker build -t flask-app .

ステップ2：Dockerコンテナを実行します

 docker run -p 5000:5000 flask-app

これで、アプリはhttp://localhost:5000で実行されます。

APIエンドポイント

健康チェック

url ： /health方法： GET ：APIが実行されているかどうかを確認します。応答：

 json
Copy code
{
  "status": "API is running"
}

検索

URL ： /search方法： POST説明：テキストクエリに基づいてドキュメントを検索します。リクエストボディ：

 json
Copy code
{
  "query": "Your search query",
  "user_id": "user123",
  "top_k": 3
}

応答：クエリに基づいて一致するドキュメントのリストを返します。

url ： /start_scrapingメソッドのスクレイピングを開始： POST説明：特定のサイトのバックグラウンドスクレイピングプロセスを開始します。リクエストボディ：

 json
Copy code
{
  "url": "https://example.com"
}

応答：

 json

{
  "message": "Started scraping for https://example.com"
}

トラブルシューティング

一般的な問題：

レート制限が超えられました：レート制限を押した場合、APIは429エラーを返します。
キャッシュ遅延：キャッシュ結果が返された場合、新しい結果が表示されるまで5分間待つ必要がある場合があります。
ログ：アプリケーションは、 api.logのすべてのリクエストとエラーをログに記録します。バックグラウンドスクレイピングログは、scraping.logに書き込まれます。

将来の強化

認証：セキュリティを追加するためのAPIキーベースの認証の追加。
改善されたエラー処理：無効なクエリまたはスクレイピング障害のためのより詳細なエラーメッセージ。
複数のスクレイピングサイトのサポート：スクレーパーを強化して、複数のサイトを並行して処理します。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-05-30
サイズ 15.66KB
から Github