llm ollama llamaindex bootstrap Download - llm ollama llamaindex bootstrap Code Download

llm ollama llamaindex bootstrap

Outro código-fonte

1.0.0

Baixar

Aplicação de Bootstrap de Geração Gerada (RAG) de recuperação (RAG)

Projetado para uso offline, este modelo de aplicativo RAG é baseado nos tutoriais de Andrej Baranovskij. Oferece um ponto de partida para criar seu próprio pipeline RAG local, independente das APIs on-line e serviços LLM baseados em nuvem como o OpenAI. Isso capacita os desenvolvedores a experimentar e implantar aplicativos de pano em ambientes controlados.

Um aplicativo de interface do usuário do FullStack gerado usando Create-llama e personalizado para este projeto pode ser encontrado em https://github.com/tyrell/llm-ollama-llandex-bootstrap-ui

Minha postagem no blog fornece mais contexto, motivação e pensamento por trás desses projetos.

A pilha

Este aplicativo RAG é executado totalmente offline, utilizando sua CPU local para gerar/recuperar/classificar respostas sem precisar de acesso à Internet. Essa implantação de pano depende apenas da sua CPU local para computação. Observe que o processamento de conjuntos de dados grandes ou o uso de modelos intensivos em recursos pode diminuir o desempenho.

Modelo de idioma grande - usamos Ollama (https://ollama.ai/) para executar nosso LLM localmente. Qualquer modelo suportado pelo Ollama pode ser configurado para ser usado usando o arquivo config.yml encontrado neste aplicativo.
Vector Store - Utilizamos o WEAVIATE (https://waviate.io) como o Vector Store. Nós executamos tevadores como um contêiner do docker. O URL da instância do WEAVIATE pode ser configurado usando o arquivo config.yml.
ÍNDICE - Utilizamos o Llamaindex (https://www.llamaaindex.ai) como o núcleo desse aplicativo RAG atuando como o índice de nossas estruturas de dados privadas. O código de amostra fornecido pelo modelo ingere um arquivo no índice.
INCEDIDOS VECTOR - Usamos Langchain (https://www.langchain.com) e Huggingface (https://huggingface.co) para manter um modelo de incorporação local.

Investir rápido

Execute a loja de vetores locais com o Docker:

 docker compose up -d

Instale os requisitos do Python:

 pip install -r requirements.txt

Instale o Ollama e puxe o modelo LLM preferido especificado em config.yml
Copie os arquivos PDF de texto para a pasta data
Execute o script, para converter texto em incorporações de vetor e salvar no tecelagem:

 python ingest.py

Run Main.py para processar dados com LLM RAG Pipeline definido no pipeline.py e retorne a resposta:

 python main.py "Who are you?"

Responder:

 Answer:
I am an AI language model, designed to assist and provide information based on the context provided. In this case, the context is related to an invoice from Chapman, Kim and Green to Rodriguez-Stevens for various items such as wine glasses, stemware storage, corkscrew parts, and stemless wine glasses.

Here are some key details from the invoice:
- Invoice number: 61356291
- Date of issue: 09/06/2012
- Seller: Chapman, Kim and Green
- Buyer: Rodriguez-Stevens
- VAT rate: 10%

The invoice includes several items with their respective quantities, unit measures (UM), net prices, net worth, gross worth, and taxes. The summary section provides the total net worth, VAT amount, and gross worth of the invoice.
==================================================
Time to retrieve answer: 37.36918904201593

Você pode encontrar mais prompts em prompts.txt para testar o aplicativo de modelo. Depois de ler a base de código, expanda o pano para suas necessidades específicas.

Licença

Apache 2.0

~ Tyrell Perera

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-08
tamanho 358.12KB
Vindo de Github

Aplicativos Relacionados

ollama dl

2024-11-10
TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Jogo Bootstrap Ilha

2024-03-29
asp.net EF + MVC + Bootstrap C# código-fonte CMS para construir site OA escritório sistema back-end CRM

2022-12-14
Interface de back-end HTML5 6 conjuntos de modelos de back-end de bootstrap empacotados versão oficial

2022-11-02

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos