? Finguru: Ferramenta de pesquisa de notícias
O Finguru é uma ferramenta de pesquisa de notícias que processa e analisa artigos de notícias de URLs e PDF. Ele aproveita o Langchain, o Google incorporados e o simplit para fornecer informações e respostas com base no conteúdo dos artigos.
Características
- Buscar e analisar artigos de notícias dos dados de URLs ou analisar de determinado PDF
- Dividir artigos em pedaços gerenciáveis
- Crie incorporação para o texto usando o modelo do GoogleEmbingding
- Armazenar incorporações em um índice FAISS para recuperação eficiente
- Consulte os dados processados para obter respostas e fontes
Como é construído
- Python 3.7+
- Simplit
- Langchain
- Chave do Google API
- Google_cse_id
LLM usado
google gemini-pro
Arquitetura da AWS

Análise de pesquisa de ações


Arquitetura de tecnologia
- Issue 1 : Copy pasting article in ChatGPt is tedious
- Issue 2 : We need an aggregate knowledge base


Receita da Apple

Calorias na Apple

Semantic search
Banco de dados vetorial

Agentes

Agentes usados
Wikipedia Google Search Google Finance duckduckGo search
Começando
Instalação
1. Clone o repositório:
git clone https://github.com/mihirh19/news_research_tool_Equity-Research-Analysis-.git
cd news_research_tool_Equity-Research-Analysis-
2. Crie e ative um ambiente virtual:
python -m venv venv
source venv/bin/activate # On Windows use `venvScriptsactivate`
3. Instale os pacotes necessários:
pip install -r requirements.txt
Configurar
Primeiro, você precisa configurar as chaves da API e as variáveis de ambiente adequadas. Para configurá -lo, crie o Google_API_KEY no Google Cloud Credencial Console (https://console.cloud.google.com/apis/credentials) e um google_cse_id usando o mecanismo de pesquisa programável (https://programablearchengine.google.com/controlpanel/create). Em seguida, é bom seguir as instruções encontradas aqui.
Crie a chave da API em https://serpapi.com/
3. Crie um arquivo chamado secrets.toml no diretório .streamlit com o seguinte conteúdo:
GOOGLE_API_KEY = " your-google-api-key "
GOOGLE_CSE_ID = " your-cse-id "
SERP_API_KEY = " your- "
Executando o aplicativo
Uso
- Abra o aplicativo StreamLit em seu navegador.
- Selecione Opções no menu suspenso na barra lateral
- Para URL:
- Digite o número de URLs que você deseja processar na barra lateral.
- Forneça os URLs para os artigos de notícias.
- Clique em "Processar URLs" para buscar e analisar os artigos.
- Para pdf
- Carregue um pdf.
- Clique em "Processe PDF" para analisar o PDF.
- Digite uma consulta na caixa de entrada de texto e clique em "Enviar" para obter respostas com base nos dados processados.
Você também pode usar a pesquisa avançada do Google por questões financeiras.
Exemplo 1 URL:
- Digite 3 como número de URLs
- fornecer URLs a seguir:
- https://www.moneycontrol.com/news/business/tata-motors-to-use-new-1-billion-plant to-make-jaguar-land-rover-carars-report-12666941.html
- https://www.moneycontrol.com/news/business/stocks/tata-motors-stock-jumps-x-after-robust-jlr-sales-brokerages-bullish-2603201.html
- https://www.moneycontrol.com/news/business/stocks/buy-tata-motors-target-of-rs-1188-harekhan-12411611.html
- Clique em "Processar URLs" para iniciar o processamento.
- Digite uma consulta como
what is the target price of tata motors ? e clique em Submit para obter a resposta.
Exemplo 2 pdf:
AnualReport202223.pdf Faça o upload do PDF fornecido
Clique em "Processe PDF" para iniciar o processamento.
Digite uma consulta como what is the yoy change of revenue of tata motors ? e clique em Submit para obter a resposta.
Autor
? Mihir Hadavani
- Twitter: @mihirh21
- Github: @mihirh19
- LinkedIn: @mihir-hadavani-996263232
Mostre seu apoio
Dê a um ️ se este projeto o ajudar!