Download airgapped offfline rag - airgapped offfline rag Código do Rag Download

Português

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Página Inicial>Relacionado com a programação>Outro código-fonte

airgapped offfline rag

Outro código-fonte

v1.0.0

Baixar

Logotipo do projeto

Rano offline offline

Este projeto de Vincent Koc implementa um sistema de resposta à imposição de perguntas baseadas em geração de recuperação (RAG) para documentos. Ele usa modelos LLAMA 3, Mistral e Gemini para inferência local com llama C ++, Langchain para orquestração, Chromadb para armazenamento vetorial e simplidades para a interface do usuário.

captura de tela airgapped_offline_rag-screenshot.png

Índice

Rano offline offline
- Índice
- Configurar
- Executando o aplicativo
  - Localmente
  - Usando o docker
- Uso
- Configuração
- Características
  - Recursos suportados
  - Características futuras
- Contribuindo
- Licença
- Agradecimentos

Configurar

Verifique se o Python 3.9 está instalado : você pode usar pyenv :
```
 pyenv install 3.9.16
pyenv local 3.9.16
pyenv rehash
```
Crie um ambiente virtual e instale dependências :
```
 make setup
```
Download Modelos : Faça o download dos modelos LLAMA 3 (8B) e MISTRAL (7B) no formato GGUF e coloque -os nos models/ diretórios. TheBloke On Hugging Face compartilhou os modelos aqui:
- Mistral-7b-Instruct-V0.2-GGUF
- LLAMA-PRO-8B-INSTRUCT-GGUF
Os modelos da unsloth também foram testados e podem ser encontrados aqui:
- Gemma-2-2b-it.q2_k.gguf
- Llama-3.2-3b-Instruct-q2_k.gguf
Modelo de transformador de sentença QDRANT : Isso será baixado automaticamente na primeira execução. Se estiver executando o pano de ar localmente, é melhor executar a base de código com acesso à Internet inicialmente para baixar o modelo.

Executando o aplicativo

Localmente

 make run

Usando o docker

 make docker-build
make docker-run

Uso

Carregue documentos em PDF usando o uploader de arquivo.
Selecione o modelo que você deseja usar (por exemplo, Mistral).
Digite sua pergunta na entrada de texto.
Clique em "Gerear resposta" para obter uma resposta com base no conteúdo do documento.

Configuração

Ajuste as configurações no config.yaml para modificar os caminhos do modelo, tamanhos de bloco e outros parâmetros.

Características

Recursos suportados

Características futuras

Contribuindo

As contribuições são bem -vindas! Por favor, pegue o repositório e envie uma solicitação de tração. Para grandes mudanças, abra um problema primeiro para discutir o que você gostaria de mudar.

Licença

Este projeto está licenciado sob a licença pública geral da GNU v3.0 (GPLV3). Consulte o arquivo de licença para obter detalhes.

Isso significa:

Você pode usar, modificar e distribuir livremente este software.
Se você modificar ou estender este software, deverá liberar suas alterações no GPL.
Você deve incluir o aviso original de direitos autorais e o texto completo da licença GPL.
Não há garantia para este software livre.

Para mais informações, visite GNU GPL V3.

Agradecimentos

Graças ao TheBloke e Unsloth por compartilhar os modelos quantizados.
Este projeto usa várias bibliotecas de código aberto. Consulte requisitos.txt para obter detalhes.

Expandir

Informações adicionais

Versão v1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-05-25
tamanho 365.66KB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos