Newspulse AI:Databricks Generative AI Hackathon [金融服务中的第一名]
它做什么
该应用程序专门设计用于监视和分析有关重大商业事件的最新新闻文章的观点,例如裁员,合并和收购,重组和争议。这些事件可能会深刻影响股票绩效,这对于投资者保持知情至关重要。
关键功能
- 情感分析:按日常和主题分析情绪,结果汇总。
- 股票价格与情感:一个时间序列分析,用于研究新闻情绪对股票绩效的影响。
- 聊天机器人:使用矢量搜索索引和来源信息提供问答功能。
数据采集过程
- 新闻文章:使用DuckDuckgo API获取有关选定公司的最新新闻文章。
- 内容刮擦:利用Scrapegraphai和GPT 3.5-Turbo从URL中提取内容。
- 情感提取:应用DBRX指示和Langchain来确定文章的情感。
- 抹布系统:将文章分解,使用dbrx嵌入,并加载到数据链球矢量存储中。
- 库存数据:使用Yahooquery从Yahoofine收集历史股票价格数据。
自动数据助理作业应该每天或多次运行,以连续更新数据库和矢量商店,并使用新文章更新。
技术堆栈
- Databricks-数据处理,存储,矢量数据库
- 简化 - 前端
- Openai -LLM
- DBRX -LLM
- Langchain -LLM包装纸
- DuckDuckgo-新闻API
- Scrapegraphai-网络刮擦
- Yahooquery- Yahoo Finance API
- 嵌入链-RAG(用于演示作为Databricks端点的替代品)