trendr_bot

Tentang
Jawab pertanyaan bahasa alami tentang apa yang sedang tren di pencarian google. Proyek ini menunjukkan cara membangun agen AI dasar untuk menjawab pertanyaan bahasa alami yang terbuka dengan mengintegrasikan sejumlah besar data terstruktur dengan LLM.
Berikut ini adalah tampilan logis:

Penjelasan:
- Langkah 1: Berdasarkan input pengguna, gunakan LLM untuk memeriksa sumber data yang relevan
- Langkah 2: Permintaan sumber data yang cocok. Jika sumber data yang relevan tidak ada, beri tahu pengguna dan menyelamatkan.
- Langkah 3: Ambil hasil output data dan berikan konteks untuk meminta LLM untuk menjawab pertanyaan
- Langkah 4: Kembalikan hasilnya kepada pengguna
Berikut adalah browser UI setelah aplikasi digunakan:

Demo
Coba demo langsung yang di-host di GCP Cloud Run di tinyurl.com/trendr-bot.
Pengaturan
Instal Paket yang Diperlukan:
pip install -r requirements.txt
Bergantung pada preferensi Anda, atur variabel lingkungan Anda untuk Google Cloud:
export GCP_PROJECT=
export GCP_REGION=
Atau perbarui config.ini :
[Cloud Configs]
GCP_PROJECT = ADD_HERE
Aplikasi ini digunakan sebagai antarmuka web yang streamlit. Menyebarkan secara lokal sebagai berikut:
streamlit run app.py
--browser.serverAddress=localhost
--server.enableCORS=false
--server.enableXsrfProtection=false
--server.port 8080
Untuk menggunakan Cloud Run GCP, perbarui variabel dalam skrip GCP_CLOUD_RUN_DEPLOY.SH dan mengeksekusi:
./gcp_cloud_run_deploy.sh
Penggunaan
Setelah aplikasi berjalan di browser, Anda dapat mengajukan pertanyaan dasar seperti:
Question: What are the top 10 trends in the US for the latest available data? Simply list them in bullet points.
Menjawab:
- OJ Simpson
- Kota Real Madrid vs Man
- Master 2024
- Total Eclipse 2024
- UFC 300
- Bola basket Purdue
- Powerball
- PSG vs Barcelona
- Liga Champions
- Jam berapa gerhana
Atau Anda dapat mengajukan pertanyaan yang lebih kompleks dan bernuansa (dengan keterbatasan) juga:
Question: Are there noticeable differences in trends between European and Asian countries?
Menjawab:
Perbedaan tren antara Eropa dan Asia:
Berdasarkan data tren pencarian Google yang disediakan dari minggu 7 April 2024, kita dapat mengamati beberapa perbedaan nyata dalam topik tren antara negara -negara Eropa dan Asia:
Eropa:
- Dominasi Sepak Bola : Sebagian besar tren teratas berkaitan dengan liga dan pertandingan sepak bola Eropa, seperti Liga Champions ("Ligue des Champions", "Liga Mistrzów", dll.), Dan permainan spesifik seperti "Man United vs Liverpool". Ini menunjukkan minat yang kuat pada sepak bola di wilayah Eropa.
- Bunga gerhana matahari : Beberapa negara Eropa menunjukkan minat pada gerhana matahari yang akan datang pada 8 April 2024, dengan pencarian seperti "Eclipsa de Soare 2024 Romania" dan "Sonnenfinsternis 2024".
- Acara Regional : Beberapa tren menyoroti acara atau kepribadian regional, seperti "Wybory Samorządowe 2024" (pemilihan lokal Polandia) dan "אבשלום פלד" (kepribadian Israel).
Asia:
- Variasi topik : Dibandingkan dengan Eropa, tren teratas di Asia menunjukkan variasi yang lebih luas. Sementara sepak bola ("Man Utd Liverpool", "Arsenal ấu với Bayern") dan gerhana matahari ("Gerhana Matahari 8 April 2024") hadir, ada juga campuran hiburan, acara budaya, dan kepribadian.
- Entertainment and Culture : Searches like "桜花賞" (a Japanese horse race), "KKR vs CSK" (an Indian Premier League cricket match), and "버거킹 와퍼 판매 종료 이유" (reasons for Burger King Whopper discontinuation in Korea) point towards diverse entertainment and cultural interests.
- Perayaan Agama : Kehadiran "Idul Fitri 2024" dan pencarian terkait seperti "Niat Sholat Idul Fitri" di beberapa negara Asia menunjukkan pentingnya hari libur keagamaan ini di wilayah tersebut.
Kesimpulan:
Meskipun ada beberapa tumpang tindih dalam topik yang sedang tren, terutama dengan acara -acara besar seperti gerhana matahari dan olahraga populer, tren Eropa lebih condong ke sepak bola, sementara tren Asia menunjukkan berbagai minat yang lebih luas yang mencakup hiburan, budaya, dan agama.
Batasan
Jangan mengharapkan hasil yang sempurna untuk semua dan semua pertanyaan. Beberapa batasan meliputi:
- Dataset publik tren Google secara sporadis diperbarui
- Bahkan jendela konteks 1m penuh yang disediakan oleh Gemini 1.5 Pro tidak cukup besar untuk mengandung keseluruhan dataset publik tren Google, sehingga hasil permintaan biasanya terpotong saat mengirimkan untuk analisis
- Dengan titik data terbatas sebagaimana ditentukan, LLM akan sering berspekulasi tentang kategorisasi atau konteks tren
- Hanya berdasarkan arsitektur yang melekat, kemampuan LLM untuk melakukan perhitungan yang tepat terbatas
- Eksekusi bisa memakan waktu hingga 1 menit. Optimalisasi sederhana adalah untuk menyimpan hasil BigQuery, tetapi dua permintaan Gemini 1.5 Pro, yang kedua memiliki konteks yang besar, akan memakan waktu.
Tech
- LLM : Gemini 1.5 Pro (Anda dapat mencoba LLM lain, tetapi mereka membutuhkan jendela konteks yang sangat besar)
- Gudang Data : BigQuery
- Sumber Data : BigQuery Google Trends Dataset Publik
- Kerangka kerja web : streamlit
- Web Hosting (Opsional) : GCP Cloud Run