CheatSheet Langchain Projectダウンロード - CheatSheet Langchain Projectソースコードダウンロード

CheatSheet Langchain Project

AI ソースコード

1.0.0

ダウンロード

AIエージェントプロジェクト：自動データ抽出

このプロジェクトは、自動化されたデータ抽出と処理のためにAIエージェントを活用します。このシステムを使用すると、ユーザーはCSVファイルをアップロードしたり、Googleシートに接続してから、自然言語クエリを使用してデータと対話できます。エージェントは、クエリに基づいてPythonコードを生成し、コードを実行してデータを操作し、テーブル、プロット、文字列、またはファイルの便利なデータを削るなどのさまざまな形式で結果を提示します。

コンテンツの表

導入
特徴
インストール
使用法
プロジェクト構造
エラー処理
ライセンス

特徴

データソースの選択：CSVファイルのアップロードまたはGoogleシートの接続を選択します。
自然言語クエリ：自然言語クエリを使用してデータと対話します（{Company}のメールアドレスを取得してください」）。
動的コード生成：システムは、クエリに基づいてPythonコードを生成し、その後、データを操作するために実行されます。
出力形式：結果は、クエリに応じて、テーブル、プロット（バー/パイ）、または文字列などのさまざまな形式で表示されます。
エラー処理：堅牢なエラー処理により、ファイル形式が無効な問題やデータ操作エラーなどの問題が発生した場合でも、スムーズなユーザーインタラクションが保証されます。

展開リンク

reirllitのチートシートアプリ

インストール

このプロジェクトを実行するには、Python 3.7以降が必要です。このプロジェクトでは、PIP経由でインストールできるいくつかのサードパーティライブラリを使用しています。

レポをクローンします

    git clone https://github.com/UjjawalGusain/CheatSheet-Langchain-Project.git
    cd Langchain-Web-Agent

依存関係のインストール：仮想環境を作成し、必要なライブラリをインストールします。

    python3 -m venv venv
    source venv/bin/activate  # On Windows, use `venvScriptsactivate`
    pip install -r requirements.txt

GoogleシートAPIをセットアップします：
- GoogleシートAPIドキュメントの手順に従って、Google API資格情報を取得します。
- 資格情報をダウンロードして、プロジェクトのルートディレクトリに配置します。
アプリケーションを実行します：

    streamlit run dashboard.py

このコマンドを実行した後、アプリケーションが開始され、ブラウザを介してアクセスできます。

API

このプロジェクトでは、データの削減やモデルとの相互作用など、複数のAPIを使用してさまざまな操作を処理します。統合されたAPIは次のとおりです。

GROQ API：
- モデル：llama-3.1-70b-versatile
- 目的：GROQ APIは、応答を生成するための大規模な言語モデルと対話し、データセットで操作を実行し、複雑なクエリを処理するために使用されます。モデルのllama-3.1-70b- ververatileは、効率的な自然言語の理解と生成のために利用され、クエリの処理を支援し、実用的な結果を生み出します。
- 使用法：
  - APIは、抽出、フィルタリング、概要の生成などの操作など、データに関連するクエリを処理するために呼び出されます。モデルからの応答は、データセットに適用される操作の形成に役立ちます。
  - モデルに使用されるプロンプトは、目的の応答を確保し、実行中のエラーを回避するために特定の形式で構成されています。
スクレーパーAPI：
- 目的：スクレーパーAPIは、外部ソースから追加のデータを収集し、このデータをデータセットに追加するために使用されます。
- 使用法：
  - データセットが処理され、必要な操作が実行されると、スクレーパーAPIは、外部リソースから削られた追加の列でデータを濃縮するのに役立ちます。これは、データフレームに「スクレイプされた」列を追加することによって行われます。

使用法

データのアップロード：

サイドバーからデータソースを選択します。CSVをアップロードするか、Googleシートを接続します。
- CSVをアップロードする場合は、アップロードするファイルを選択します。 Googleシートに接続する場合は、シートのURLを提供します。
クエリを入力してください：
- アプリのメインエリアで、入力ボックスに自然言語クエリを入力します。たとえば、「{company}のメールアドレスを取得してください」。
結果を表示：
- クエリに基づいて、AIエージェントはPythonコードを生成し、データに適用し、結果を返します。結果は、テーブル、プロット、または文字列として表示できます。

遭遇した課題

プロンプトのフォーマットと複雑さ：重要な課題は、モデルに渡されたプロンプトがシステムによって正しくフォーマットされ、処理されることを保証することでした。このモデルは、クエリの構造と複雑さに基づいて正確な応答を生成するために必要でした。また、特に複雑なクエリを使用して、ユーザーに情報の抽出と提示方法の明確さと一貫性を維持することも重要でした。
LLMSでセキュリティリスクの管理：大規模な言語モデル（LLM）を活用すると、特にデータプライバシーと機密情報の処理に関するセキュリティリスクが潜在的に導入されました。モデルとの対話中に、機密データやプライベートデータが不注意に公開されなかったことを確認することは、開発プロセスの重要な側面でした。これらのリスクを最小限に抑えるために、コードデータを生成して処理するためにLLMを使用しながら、これらのリスクを最小限に抑えるために保護手段を実装する必要がありました。