trendr_bot

について
Google検索で何がトレンドであるかについての自然言語の質問に答えてください。このプロジェクトは、大量の構造化されたデータをLLMと統合することにより、オープンエンドの自然言語の質問に答えるための基本的なAIエージェントを構築する方法を示しています。
これが論理的な見解です:

説明:
- ステップ1:ユーザー入力に基づいて、LLMを使用して関連するデータソースを確認します
- ステップ2:一致したデータソースをクエリします。関連するデータソースが存在しない場合は、ユーザーに伝えて保釈してください。
- ステップ3:データ出力の結果を取得し、LLMに質問に答えるように依頼するコンテキストのためにそれを提供します
- ステップ4:結果をユーザーに返します
アプリケーションが展開されると、こちらがブラウザUIです。

デモ
tinyurl.com/trendr-botでGCPクラウドランでホストされているライブデモをお試しください。
設定
必要なパッケージをインストールします:
pip install -r requirements.txt
好みに応じて、Googleクラウドの環境変数を設定します。
export GCP_PROJECT=
export GCP_REGION=
またはconfig.iniを更新します:
[Cloud Configs]
GCP_PROJECT = ADD_HERE
このアプリケーションは、流線のWebインターフェイスとして展開されます。次のようにローカルに展開します。
streamlit run app.py
--browser.serverAddress=localhost
--server.enableCORS=false
--server.enableXsrfProtection=false
--server.port 8080
GCPクラウド実行に展開するには、スクリプトGCP_CLOUD_RUN_DEPLOY.SHの変数を更新して実行します。
./gcp_cloud_run_deploy.sh
使用法
アプリケーションがブラウザで実行されたら、次のような基本的な質問をすることができます。
Question: What are the top 10 trends in the US for the latest available data? Simply list them in bullet points.
答え:
- OJシンプソン
- レアルマドリード対マンシティ
- マスター2024
- 総日食2024
- UFC 300
- パデューバスケットボール
- パワーボール
- PSG対バルセロナ
- チャンピオンズリーグ
- 日食は何時ですか
または、より複雑で微妙な質問(制限付き)も尋ねることができます。
Question: Are there noticeable differences in trends between European and Asian countries?
答え:
ヨーロッパとアジアの傾向の違い:
2024年4月7日の週からのGoogle検索トレンドのデータに基づいて、ヨーロッパ諸国とアジア諸国間のトレンドトピックの顕著な違いを観察できます。
ヨーロッパ:
- サッカーの支配:トップトレンドの大部分は、チャンピオンズリーグ(「リーグデスチャンピオン」、「リーガミストルツォー」など)のようなヨーロッパのサッカーリーグや試合に関連し、「マンユナイテッドvsリバプール」などの特定のゲームに関連しています。これは、ヨーロッパ地域内のサッカーに対する強い関心を示しています。
- 日食の関心:2024年4月8日に開催される太陽の日食にいくつかのヨーロッパ諸国が関心を示し、「Eclipsa de Soare 2024 Romania」や「Sonnenfinsternis 2024」などの捜索が行われます。
- 地域のイベント:一部のトレンドは、「ワイボリーサモルツドーダウ2024」(ポーランドの地方選挙)や「אבשלאבשלאבשל政」(イスラエルの性格)などの地域のイベントや人格を強調しています。
アジア:
- さまざまなトピック:ヨーロッパと比較して、アジアのトップトレンドは、幅広い関心を示しています。サッカー(「Man Utd Liverpool」、「Arsenal性vớiBayern」)、Solar Eclipse(「Gerhana Matahari 8月8日」)が存在する間、エンターテイメント、文化的な出来事、性格も混在しています。
- エンターテインメントと文化:「桜花賞」(日本の競馬)、「KKR対CSK」(インドのプレミアリーグのクリケットの試合)、「버거킹」(韓国でのバーガーキングの廃止の理由)のような検索が多様なエンターテイメントと文化的関心を向けています。
- 宗教的な遵守:いくつかのアジア諸国における「イドゥル・フィトリ2024」と「ニアト・ショラット・イドゥル・フィトリ」のような関連検索の存在は、この地域におけるこの宗教的な祝日の重要性を示しています。
結論:
特に太陽の日食や人気のあるスポーツなどの主要なイベントでは、トレンドのトピックにはいくつかの重複がありますが、ヨーロッパのトレンドはサッカーに対してより大きく傾いていますが、アジアのトレンドは、エンターテイメント、文化、宗教を含む幅広い関心を示しています。
制限
すべての質問に完全な結果を期待しないでください。いくつかの制限には以下が含まれます。
- Google Trends Public Datasetは散発的に更新されています
- Gemini 1.5 Proが提供する完全な1Mコンテキストウィンドウでさえ、Google Trendsパブリックデータセット全体を封じ込めるほど大きくないため、通常、分析のために送信するときにクエリの結果は切り捨てられます
- 提供されているように限られたデータポイントを使用すると、LLMはしばしば傾向の分類またはコンテキストについて推測します
- 固有のアーキテクチャに基づいて、正確な計算を実行するLLMの能力は限られています
- 実行には最大1分かかる場合があります。簡単な最適化は、BigQueryの結果をキャッシュすることですが、2番目のGemini 1.5 Proリクエスト(2番目のGemini 1.5 Proリクエスト)には、時間がかかります。
技術
- LLM :Gemini 1.5 Pro(他のLLMSを試すことができますが、非常に大きなコンテキストウィンドウが必要です)
- データウェアハウス:BigQuery
- データソース:BigQuery Google Trends Public Dataset
- Webフレームワーク:Riremlit
- Webホスティング(オプション) :GCPクラウド実行