Trendr_bot

เกี่ยวกับ
ตอบคำถามภาษาธรรมชาติเกี่ยวกับสิ่งที่มีแนวโน้มในการค้นหาของ Google โครงการนี้แสดงให้เห็นถึงวิธีการสร้างตัวแทน AI พื้นฐานเพื่อตอบคำถามภาษาธรรมชาติที่เปิดสิ้นสุดโดยการรวมข้อมูลที่มีโครงสร้างจำนวนมากเข้ากับ LLM
นี่คือมุมมองเชิงตรรกะ:

คำอธิบาย:
- ขั้นตอนที่ 1: ขึ้นอยู่กับการป้อนข้อมูลของผู้ใช้ให้ใช้ LLM เพื่อตรวจสอบแหล่งข้อมูลที่เกี่ยวข้อง
- ขั้นตอนที่ 2: สอบถามแหล่งข้อมูลที่ตรงกัน หากไม่มีแหล่งข้อมูลที่เกี่ยวข้องบอกผู้ใช้และประกันตัว
- ขั้นตอนที่ 3: ใช้ผลลัพธ์ผลลัพธ์และให้บริบทเพื่อขอให้ LLM ตอบคำถาม
- ขั้นตอนที่ 4: ส่งคืนผลลัพธ์ไปยังผู้ใช้
นี่คือเบราว์เซอร์ UI เมื่อแอปพลิเคชันถูกปรับใช้:

การสาธิต
ลองใช้การสาธิตสดที่โฮสต์บน GCP Cloud Run ที่ TinyUrl.com/trendr-bot
การตั้งค่า
ติดตั้งแพ็คเกจที่ต้องการ:
pip install -r requirements.txt
ขึ้นอยู่กับการตั้งค่าของคุณไม่ว่าจะตั้งค่าตัวแปรสภาพแวดล้อมของคุณสำหรับ Google Cloud:
export GCP_PROJECT=
export GCP_REGION=
หรืออัปเดต config.ini :
[Cloud Configs]
GCP_PROJECT = ADD_HERE
แอปพลิเคชันนี้ถูกปรับใช้เป็นเว็บอินเตอร์เฟส StreamLit ปรับใช้ในพื้นที่ดังนี้:
streamlit run app.py
--browser.serverAddress=localhost
--server.enableCORS=false
--server.enableXsrfProtection=false
--server.port 8080
ในการปรับใช้ในการรันคลาวด์ GCP ให้อัปเดตตัวแปรในสคริปต์ GCP_CLOUD_RUN_DEPOLL.SH และดำเนินการ:
./gcp_cloud_run_deploy.sh
การใช้งาน
เมื่อแอปพลิเคชันทำงานในเบราว์เซอร์คุณสามารถถามคำถามพื้นฐานเช่น:
Question: What are the top 10 trends in the US for the latest available data? Simply list them in bullet points.
คำตอบ:
- OJ Simpson
- เรอัลมาดริดกับเมืองแมน
- อาจารย์ 2024
- รวม Eclipse 2024
- UFC 300
- บาสเกตบอลเพอร์ดู
- บอล
- PSG กับบาร์เซโลนา
- แชมเปี้ยนส์ลีก
- คราสกี่โมง
หรือคุณสามารถถามคำถามที่ซับซ้อนและเหมาะสมยิ่งขึ้น (พร้อมข้อ จำกัด ) เช่นกัน:
Question: Are there noticeable differences in trends between European and Asian countries?
คำตอบ:
ความแตกต่างของแนวโน้มระหว่างยุโรปและเอเชีย:
จากข้อมูลแนวโน้มการค้นหาของ Google ที่ให้มาจากสัปดาห์ที่ 7 เมษายน 2024 เราสามารถสังเกตความแตกต่างที่เห็นได้ชัดเจนในหัวข้อแนวโน้มระหว่างประเทศในยุโรปและเอเชีย:
ยุโรป:
- การปกครองของฟุตบอล : ส่วนใหญ่ของแนวโน้มสูงสุดเกี่ยวข้องกับลีกฟุตบอลและการแข่งขันในยุโรปเช่นแชมเปี้ยนส์ลีก ("Ligue des Champions", "Liga Mistrzów" ฯลฯ ) และเกมเฉพาะเช่น "Man United vs Liverpool" สิ่งนี้บ่งบอกถึงความสนใจอย่างมากในฟุตบอลในภูมิภาคยุโรป
- ความสนใจของสุริยุปราคา : หลายประเทศในยุโรปแสดงความสนใจในสุริยุปราคาที่กำลังจะเกิดขึ้นเมื่อวันที่ 8 เมษายน 2567 โดยมีการค้นหาเช่น "Eclipsa de Soare 2024 โรมาเนีย" และ "Sonnenfinsternis 2024"
- เหตุการณ์ระดับภูมิภาค : แนวโน้มบางอย่างเน้นเหตุการณ์หรือบุคลิกภาพระดับภูมิภาคเช่น "Wybory Samorządowe 2024" (การเลือกตั้งท้องถิ่นของโปแลนด์) และ "אבשל" (บุคลิกภาพอิสราเอล)
เอเชีย:
- ความหลากหลายของหัวข้อ : เมื่อเทียบกับยุโรปแนวโน้มอันดับต้น ๆ ในเอเชียแสดงความสนใจที่หลากหลาย ในขณะที่ฟุตบอล ("Man Utd Liverpool", "Arsenal ấuvới Bayern") และสุริยุปราคา ("Gerhana Matahari 8 เมษายน 2024") มีอยู่นอกจากนี้ยังมีความบันเทิงกิจกรรมทางวัฒนธรรมและบุคลิกภาพ
- ความบันเทิงและวัฒนธรรม : ค้นหาเช่น "桜花賞" (การแข่งขันม้าญี่ปุ่น), "KKR vs CSK" (การแข่งขันคริกเก็ตพรีเมียร์ลีกอินเดีย) และ "버거킹와퍼종료종료이유이유이유종료이유
- การสังเกตทางศาสนา : การปรากฏตัวของ "Idul Fitri 2024" และการค้นหาที่เกี่ยวข้องเช่น "Niat Sholat Idul Fitri" ในหลายประเทศในเอเชียแสดงถึงความสำคัญของวันหยุดทางศาสนานี้ในภูมิภาค
บทสรุป:
ในขณะที่มีบางส่วนที่ทับซ้อนกันในหัวข้อที่ได้รับความนิยมโดยเฉพาะอย่างยิ่งกับเหตุการณ์สำคัญเช่นสุริยุปราคาและกีฬายอดนิยมเทรนด์ของยุโรปนั้นพึ่งพาฟุตบอลได้มากขึ้นในขณะที่เทรนด์เอเชียแสดงความสนใจที่หลากหลายครอบคลุมความบันเทิงวัฒนธรรมและศาสนา
ข้อ จำกัด
อย่าคาดหวังผลลัพธ์ที่สมบูรณ์แบบสำหรับทุกคำถาม ข้อ จำกัด บางประการรวมถึง:
- ชุดข้อมูลสาธารณะของ Google Trends ได้รับการปรับปรุงเป็นระยะ ๆ
- แม้แต่หน้าต่างบริบท 1M เต็มรูปแบบที่จัดทำโดย Gemini 1.5 Pro ก็ยังไม่ใหญ่พอที่จะมีชุดข้อมูลสาธารณะของ Google Trends ทั้งหมดดังนั้นผลลัพธ์การสืบค้นมักถูกตัดทอนเมื่อส่งการวิเคราะห์
- ด้วยจุดข้อมูลที่ จำกัด ตามที่ระบุ LLM มักจะคาดเดาเกี่ยวกับการจัดหมวดหมู่หรือบริบทของแนวโน้ม
- ขึ้นอยู่กับสถาปัตยกรรมโดยธรรมชาติความสามารถของ LLM ในการคำนวณที่แม่นยำนั้นมี จำกัด
- การดำเนินการอาจใช้เวลาสูงสุด 1 นาที การปรับให้เหมาะสมอย่างง่ายคือการแคชผลลัพธ์ BigQuery แต่คำขอ Gemini 1.5 Pro สองรายการซึ่งครั้งที่สองมีบริบทขนาดใหญ่จะใช้เวลาสักครู่โดยไม่คำนึงถึง
เทค
- LLM : Gemini 1.5 Pro (คุณสามารถลอง LLM อื่น ๆ ได้ แต่พวกเขาต้องการหน้าต่างบริบทที่มีขนาดใหญ่มาก)
- คลังข้อมูล : BigQuery
- แหล่งข้อมูล : BigQuery Google Trends ชุดข้อมูลสาธารณะ
- Web Framework : Streamlit
- เว็บโฮสติ้ง (ไม่บังคับ) : GCP Cloud Run