Newspulse AI:Databricks Generative AI Hackathon [金融服務中的第一名]
它做什麼
該應用程序專門設計用於監視和分析有關重大商業事件的最新新聞文章的觀點,例如裁員,合併和收購,重組和爭議。這些事件可能會深刻影響股票績效,這對於投資者保持知情至關重要。
關鍵功能
- 情感分析:按日常和主題分析情緒,結果匯總。
- 股票價格與情感:一個時間序列分析,用於研究新聞情緒對股票績效的影響。
- 聊天機器人:使用矢量搜索索引和來源信息提供問答功能。
數據採集過程
- 新聞文章:使用DuckDuckgo API獲取有關選定公司的最新新聞文章。
- 內容刮擦:利用Scrapegraphai和GPT 3.5-Turbo從URL中提取內容。
- 情感提取:應用DBRX指示和Langchain來確定文章的情感。
- 抹布系統:將文章分解,使用dbrx嵌入,並加載到數據鏈球矢量存儲中。
- 庫存數據:使用Yahooquery從Yahoofine收集歷史股票價格數據。
自動數據助理作業應該每天或多次運行,以連續更新數據庫和矢量商店,並使用新文章更新。
技術堆棧
- Databricks-數據處理,存儲,矢量數據庫
- 簡化 - 前端
- Openai -LLM
- DBRX -LLM
- Langchain -LLM包裝紙
- DuckDuckgo-新聞API
- Scrapegraphai-網絡刮擦
- Yahooquery- Yahoo Finance API
- 嵌入鏈-RAG(用於演示作為Databricks端點的替代品)