- Finguru: เครื่องมือวิจัยข่าว
Finguru เป็นเครื่องมือวิจัยข่าวที่ประมวลผลและวิเคราะห์บทความข่าวจาก URL และ PDF ที่กำหนด มันใช้ประโยชน์จาก Langchain, Google Embeddings และ Streamlit เพื่อให้ข้อมูลเชิงลึกและคำตอบตามเนื้อหาของบทความ
คุณสมบัติ
- Fetch and Parse News บทความจาก URL หรือการแยกวิเคราะห์ข้อมูลจาก PDF ที่กำหนด
- แยกบทความเป็นชิ้นที่จัดการได้
- สร้าง embeddings สำหรับข้อความโดยใช้โมเดล Google Mebedding
- จัดเก็บ Embeddings ในดัชนี FAISS เพื่อการดึงที่มีประสิทธิภาพ
- สอบถามข้อมูลที่ประมวลผลเพื่อรับคำตอบและแหล่งข้อมูล
มันถูกสร้างขึ้นอย่างไร
- Python 3.7+
- มีแสงสว่าง
- คนขี้เกียจ
- คีย์ Google API
- google_cse_id
ใช้ LLM
google gemini-pro
สถาปัตยกรรม AWS

การวิเคราะห์การวิจัยหุ้น


สถาปัตยกรรมเทคโนโลยี
- Issue 1 : Copy pasting article in ChatGPt is tedious
- Issue 2 : We need an aggregate knowledge base


รายได้ของ Apple

แคลอรี่ในแอปเปิ้ล

Semantic search
ฐานข้อมูลเวกเตอร์

ตัวแทน

ตัวแทนใช้
Wikipedia Google Search Google Finance duckduckGo search
เริ่มต้น
การติดตั้ง
1. โคลนที่เก็บ:
git clone https://github.com/mihirh19/news_research_tool_Equity-Research-Analysis-.git
cd news_research_tool_Equity-Research-Analysis-
2. สร้างและเปิดใช้งานสภาพแวดล้อมเสมือนจริง:
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`
3. ติดตั้งแพ็คเกจที่ต้องการ:
pip install -r requirements.txt
การตั้งค่า
ก่อนอื่นคุณต้องตั้งค่าปุ่ม API และตัวแปรสภาพแวดล้อมที่เหมาะสม ในการตั้งค่าให้สร้าง google_api_key ในคอนโซลข้อมูลรับรองของ Google Cloud (https://console.cloud.google.com/apis/credentials) และ google_cse_id โดยใช้เครื่องมือค้นหาที่ตั้งโปรแกรมได้ (https://programmablesearchen ถัดไปเป็นการดีที่จะทำตามคำแนะนำที่พบที่นี่
สร้างคีย์ API บน https://serpapi.com/
3. สร้างไฟล์ชื่อ secrets.toml ในไดเรกทอรี .streamlit ด้วยเนื้อหาต่อไปนี้:
GOOGLE_API_KEY = " your-google-api-key "
GOOGLE_CSE_ID = " your-cse-id "
SERP_API_KEY = " your- "
การรันแอปพลิเคชัน
การใช้งาน
- เปิดแอปพลิเคชัน Streamlit ในเบราว์เซอร์ของคุณ
- เลือกตัวเลือกจากเมนูดรอปดาวน์ในแถบด้านข้าง
- สำหรับ URL:
- ป้อนจำนวน URL ที่คุณต้องการประมวลผลในแถบด้านข้าง
- ให้ URL สำหรับบทความข่าว
- คลิกที่ "กระบวนการ URL" เพื่อดึงและวิเคราะห์บทความ
- สำหรับ PDF
- อัปโหลด PDF
- คลิกที่ "Process PDF" เพื่อวิเคราะห์ PDF
- ป้อนแบบสอบถามในกล่องป้อนข้อความและคลิก "ส่ง" เพื่อรับคำตอบตามข้อมูลที่ประมวลผล
นอกจากนี้คุณยังสามารถใช้คำถามทางการเงินของ Google Advance Search สำหรับคำถามทางการเงิน
ตัวอย่างที่ 1 URL:
- ป้อน 3 เป็นจำนวน URL
- ให้ URL ต่อไปนี้:
- https://www.moneycontrol.com/news/business/tata-motors-to-use-new-billion-plant-to-make-jaguar-land-rover-cars-report-12666941.html
- https://www.moneycontrol.com/news/business/stocks/tata-motors-stock-jumps-x-after-robust-jlr-sales-brokerages-bullish-12603201.html
- https://www.moneycontrol.com/news/business/stocks/buy-tata-motors-target-of-rs-1188-sharekhan-12411611.html
- คลิก "กระบวนการ URL" เพื่อเริ่มการประมวลผล
- ป้อนแบบสอบถามเช่น
what is the target price of tata motors ? และคลิก Submit เพื่อรับคำตอบ
ตัวอย่าง 2 PDF:
ประจำปี REPORT20223.PDF อัปโหลด PDF ที่กำหนด
คลิก "กระบวนการ PDF" เพื่อเริ่มการประมวลผล
ป้อนแบบสอบถามเช่น what is the yoy change of revenue of tata motors ? และคลิก Submit เพื่อรับคำตอบ
ผู้เขียน
- Mihir Hadavani
- Twitter: @mihirh21
- GitHub: @mihirh19
- LinkedIn: @mihir-hadavani-996263232
แสดงการสนับสนุนของคุณ
ให้️ถ้าโครงการนี้ช่วยคุณได้!