Trendr_bot

عن
أجب على أسئلة اللغة الطبيعية حول ما يتجه إلى بحث Google. يوضح هذا المشروع كيفية إنشاء وكيل منظمة العفو الدولية الأساسية للإجابة على أسئلة اللغة الطبيعية المفتوحة من خلال دمج كمية كبيرة من البيانات المنظمة مع LLM.
هنا وجهة نظر منطقية:

توضيح:
- الخطوة 1: بناءً على إدخال المستخدم ، استخدم LLM للتحقق من وجود مصدر بيانات ذي صلة
- الخطوة 2: الاستعلام عن مصدر البيانات المتطابق. إذا لم يكن مصدر البيانات ذي الصلة موجودًا ، فأخبر المستخدم وإنقاذ.
- الخطوة 3: خذ نتائج إخراج البيانات وقدمها للسياق لطرح LLM للإجابة على السؤال
- الخطوة 4: إرجاع النتائج إلى المستخدم
فيما يلي واجهة مستخدم المتصفح بمجرد نشر التطبيق:

العرض التوضيحي
جرب العرض التوضيحي المباشر الذي تم استضافته على GCP Cloud Run على tinyurl.com/trendr-bot.
يثبت
تثبيت الحزم المطلوبة:
pip install -r requirements.txt
اعتمادًا على تفضيلاتك ، إما تعيين متغيرات البيئة الخاصة بك لـ Google Cloud:
export GCP_PROJECT=
export GCP_REGION=
أو تحديث config.ini :
[Cloud Configs]
GCP_PROJECT = ADD_HERE
يتم نشر هذا التطبيق كواجهة ويب تنسيق. نشر محليًا على النحو التالي:
streamlit run app.py
--browser.serverAddress=localhost
--server.enableCORS=false
--server.enableXsrfProtection=false
--server.port 8080
للنشر على GCP Cloud Run ، قم بتحديث المتغيرات في البرنامج النصي gcp_cloud_run_deploy.sh وتنفيذ:
./gcp_cloud_run_deploy.sh
الاستخدام
بمجرد تشغيل التطبيق في المتصفح ، يمكنك طرح الأسئلة الأساسية مثل:
Question: What are the top 10 trends in the US for the latest available data? Simply list them in bullet points.
إجابة:
- OJ Simpson
- ريال مدريد ضد مان سيتي
- الماجستير 2024
- إجمالي Eclipse 2024
- UFC 300
- كرة السلة بوردو
- Powerball
- PSG مقابل برشلونة
- دوري أبطال
- ما هو الوقت الكسوف
أو يمكنك طرح أسئلة أكثر تعقيدًا ودقة (مع قيود) أيضًا:
Question: Are there noticeable differences in trends between European and Asian countries?
إجابة:
الاختلافات في الاتجاه بين أوروبا وآسيا:
استنادًا إلى بيانات اتجاهات البحث في Google المقدمة من أسبوع 7 أبريل 2024 ، يمكننا ملاحظة بعض الاختلافات الملحوظة في الموضوعات التي تتجه بين الدول الأوروبية والآسيوية:
أوروبا:
- هيمنة كرة القدم : يتعلق جزء كبير من الاتجاهات العليا بطولات كرة القدم الأوروبية ومبارياتها ، مثل دوري أبطال أوروبا ("Ligue des Champions" ، "Liga Mistrzów" ، وما إلى ذلك) ، وألعاب محددة مثل "Man United vs Liverpool". هذا يشير إلى اهتمام قوي بكرة القدم داخل المنطقة الأوروبية.
- اهتمام Solar Eclipse : تُظهر العديد من الدول الأوروبية اهتمامًا بالكرس الشمسي القادم في 8 أبريل 2024 ، مع عمليات تفتيش مثل "Eclipsa de Soare 2024 Romania" و "Sonnenfinsternis 2024".
- Regional Events : Some trends highlight regional events or personalities, such as "Wybory samorządowe 2024" (Polish local elections) and "אבשלום פלד" (an Israeli personality).
آسيا:
- مجموعة متنوعة من الموضوعات : بالمقارنة مع أوروبا ، تظهر الاتجاهات الأعلى في آسيا مجموعة واسعة من المصالح. في حين أن كرة القدم ("Man Utd Liverpool" ، "Arsenal ấu Với Bayern") والكسوف الشمسي ("Gerhana Matahari 8 April 2024") ، هناك أيضًا مزيج من الترفيه والأحداث الثقافية والشخصيات.
- الترفيه والثقافة : عمليات تفتيش مثل "桜花賞" (سباق الخيول الياباني) ، "KKR vs CSK" (مباراة في الدوري الهندي الممتاز للكريكيت) ، و "버거킹 와퍼 판매 종료 이유 이유" (أسباب التوقف عن التوقف في كوريا في كوريا) نحو المتنوعة من المصالح الترفيهية والثقافية.
- الاحتفالات الدينية : يشير وجود "Idul Fitri 2024" وعمليات البحث ذات الصلة مثل "Niat Sholat Idul Fitri" في العديد من الدول الآسيوية إلى أهمية هذه العطلة الدينية في المنطقة.
خاتمة:
في حين أن هناك بعض التداخل في المواضيع الجريئة ، خاصة مع الأحداث الكبرى مثل الكسوف الشمسي والرياضة الشعبية ، فإن الاتجاهات الأوروبية تميل بشكل كبير نحو كرة القدم ، في حين أن الاتجاهات الآسيوية تعرض مجموعة واسعة من المصالح التي تشمل الترفيه والثقافة والدين.
القيود
لا تتوقع نتائج مثالية لأي وجميع الأسئلة. تشمل بعض القيود:
- يتم تحديث مجموعة بيانات Google Trends العامة بشكل متقطع
- حتى نافذة سياق 1M الكاملة التي توفرها Gemini 1.5 Pro ليست كبيرة بما يكفي لاحتواء مجمل مجموعة بيانات Google Trends العامة ، لذلك عادة ما يتم اقتطاع نتائج الاستعلام عند الخضوع للتحليل
- مع نقاط بيانات محدودة كما هو منصوص عليه ، ستتكهن LLM غالبًا بتصنيف أو سياق الاتجاهات
- بناءً على البنية المتأصلة فقط ، تكون قدرة LLM على إجراء حسابات دقيقة محدودة
- يمكن أن يستغرق الإعدام ما يصل إلى دقيقة واحدة. سيكون التحسين البسيط هو تخزين نتائج BigQuery ، لكن طلبتي Gemini 1.5 Pro ، والثاني له سياق كبير ، سيستغرق بعض الوقت بغض النظر.
التكنولوجيا
- LLM : Gemini 1.5 Pro (يمكنك تجربة LLMs الأخرى ، لكنها تحتاج إلى نافذة سياق كبيرة جدًا)
- مستودع البيانات : BigQuery
- مصدر البيانات : مجموعة البيانات العامة لشركة BigQuery Google Trends
- إطار الويب : STREMLIT
- استضافة الويب (اختياري) : GCP Cloud Run