? Фингару: инструмент для исследований новостей
Finguru - это инструмент для исследования новостей, который обрабатывает и анализирует новостные статьи из заданных URL и PDF. Он использует Langchain, Google Entgddings и Streamlit, чтобы предоставить информацию и ответы на основе содержания статей.
Функции
- Новостные статьи по получению и Parse из URL -адресов или данных PANS
- Разделить статьи на управляемые куски
- Создать встраивание для текста с использованием модели GoogleMbedding
- Хранить встроения в индексе FAISS для эффективного поиска
- Запросите обработанные данные, чтобы получить ответы и источники
Как это построено
- Python 3.7+
- Поток
- Лангхейн
- Google API -ключ
- Google_CSE_ID
Использовал LLM
google gemini-pro
Архитектура AWS

Анализ исследований акций


Техническая архитектура
- Issue 1 : Copy pasting article in ChatGPt is tedious
- Issue 2 : We need an aggregate knowledge base


Доход от Apple

Калории в яблоке

Semantic search
Векторная база данных

Агенты

Использованные агенты
Wikipedia Google Search Google Finance duckduckGo search
Начиная
Установка
1. Клонировать репозиторий:
git clone https://github.com/mihirh19/news_research_tool_Equity-Research-Analysis-.git
cd news_research_tool_Equity-Research-Analysis-
2. Создайте и активируйте виртуальную среду:
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`
3. Установите необходимые пакеты:
pip install -r requirements.txt
Настраивать
Во -первых, вам нужно настроить соответствующие клавиши API и переменные среды. Чтобы настроить его, создайте Google_API_KEY в консоли учетных данных Google (https://console.cloud.google.com/apis/credentials) и google_cse_id с использованием программируемой поисковой системы (https://programmablesearchengine.google.com/controlpanel/create). Далее хорошо следовать инструкциям, найденным здесь.
Создайте ключ API на https://serpapi.com/
3. Создайте файл с именем secrets.toml в каталоге .streamlit со следующим контентом:
GOOGLE_API_KEY = " your-google-api-key "
GOOGLE_CSE_ID = " your-cse-id "
SERP_API_KEY = " your- "
Запуск приложения
Использование
- Откройте приложение Streamlit в вашем браузере.
- Выберите параметры в раскрывающемся меню на боковой панели
- Для URL:
- Введите количество URL -адресов, которые вы хотите обработать на боковой панели.
- Предоставьте URL -адреса для новостных статей.
- Нажмите «Процесс URL -адреса», чтобы получить и проанализировать статьи.
- Для PDF
- Загрузите PDF.
- Нажмите «Процесс PDF», чтобы проанализировать PDF.
- Введите запрос в поле текста и нажмите «Отправить», чтобы получить ответы на основе обработанных данных.
Вы также можете использовать предварительный поиск в Google для финансовых вопросов.
Пример 1 URL:
- Введите 3 как количество URL
- Предоставьте следующие URL:
- https://www.moneycontrol.com/news/business/tata-motors-to-use-new-1-billion-lant-to-make-jaguar-land-rover-cars-report-12666941.html
- https://www.moneycontrol.com/news/business/stocks/tata-motors-stock-jumps-x-fter-robust-jlr-sales-rokerage-bullish-12603201.html
- https://www.moneycontrol.com/news/business/stocks/buy-tata-motors-target-of-rs-1188-sharekhan-12411611.html
- Нажмите «Обработка URL -адреса», чтобы начать обработку.
- Введите запрос, как
what is the target price of tata motors ? и нажмите Submit , чтобы получить ответ.
Пример 2 PDF:
Ежегодно report2022233.pdf Загрузить данный pdf
Нажмите «Процесс PDF», чтобы начать обработку.
Введите запрос, например what is the yoy change of revenue of tata motors ? и нажмите Submit , чтобы получить ответ.
Автор
? Михир Хадавани
- Twitter: @mihirh21
- GitHub: @mihirh19
- LinkedIn: @Mihir-Hadavani-996263232
Покажите свою поддержку
Дайте ️, если этот проект помог вам!