minigpt4.cpp Download - minigpt4.cpp download de código fonte

minigpt4.cpp

C/C++

v1.0.0

Baixar

minigpt4.cpp

Inferência de Minigpt4 em C/C ++ puro.

Descrição

O principal objetivo do minigpt4.cpp é executar o Minigpt4 usando quantização de 4 bits com o uso da biblioteca GGML.

Demonstração

Minigpt1

Uso

1. Repo clone

Requisitos : Git

git clone --recursive https://github.com/Maknee/minigpt4.cpp
cd minigpt4.cpp

2. Obter a biblioteca

Opção 1: Baixe o binário pré -compilado

Windows / Linux / MacOS

Vá para lançamentos e extrair arquivo da biblioteca minigpt4 no diretório do repositório.

Opção 2: Construa a biblioteca manualmente

Windows

Requisitos : Cmake, Visual Studio e Git

 cmake .
cmake --build . --config Release

binReleaseminigpt4.dll deve ser gerado

Linux

Requisitos : CMake (Ubuntu: sudo apt install cmake )

cmake .
cmake --build . --config Release

minigpt4.so deve ser gerado

Macos

Requisitos : CMake (MacOS: brew install cmake )

cmake .
cmake --build . --config Release

minigpt4.dylib deve ser gerado

NOTA: Se você construir com o OpenCV (permitindo recursos como carregamento e pré ON na própria biblioteca), defina MINIGPT4_BUILD_WITH_OPENCV em CMakeLists.txt ou construir com -DMINIGPT4_BUILD_WITH_OPENCV=ON como um parâmetro para o Cmake.

3. Obter o modelo

Opção 1: Faça o download do modelo de minigpt4 pré-quantizado

Modelos pré-quantizados estão disponíveis para abraçar o rosto ~ 7b ou 13b.

Recomendado para resultados confiáveis, mas lenta velocidade de inferência: minigpt4-13b-f16.bin

Opção 2: converter e quantize o modelo Pytorch

Requisitos : Python 3.x e Pytorch.

Clone o repositório Minigpt-4 e execute a configuração

 cd minigpt4
git clone https://github.com/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

Faça o download do ponto de verificação pré-treinado no repositório Minigpt-4 em Checkpoint Aligned with Vicuna 7B ou Checkpoint Aligned with Vicuna 13B ou faça o download do link HuggingFace para 7b ou 13b

Converta os pesos do modelo em formato GGML

Windows

Modelo 7b

 cd minigpt4
python convert.py C:pretrained_minigpt4_7b.pth --ftype=f16

Modelo 13b

 cd minigpt4
python convert.py C:pretrained_minigpt4.pth --ftype=f16

Linux / MacOS

Modelo 7b

python convert.py ~ /Downloads/pretrained_minigpt4_7b.pth --outtype f16

Modelo 13b

python convert.py ~ /Downloads/pretrained_minigpt4.pth --outtype f16

minigpt4-7B-f16.bin ou minigpt4-13B-f16.bin devem ser gerados

4. Obtendo o modelo Vicuna

Opção 1: Faça o download do modelo Vicuna-V0 pré-quantizado

Modelos pré-Quantizados estão disponíveis para abraçar o rosto

Recomendado para resultados confiáveis e velocidade de inferência decente: ggml-vicuna-13b-v0-q5_k.bin

Opção 2: converter e quantize o modelo Vicuna-V0

Requisitos : Python 3.x e Pytorch.

Siga o guia do minigpt4 para obter o modelo Vicuna-V0.

Então, clone llama.cpp

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
cmake .
cmake --build . --config Release

Converta o modelo em GGML

python convert.py < path-to-model >

Quantize o modelo

python quanitize < path-to-model > < output-model > Q4_1

5. correndo

Teste se o Minigpt4 funciona ligando para o seguinte, substituindo minigpt4-13B-f16.bin e ggml-vicuna-13B-v0-q5_k.bin com seus respectivos modelos

 cd minigpt4
python minigpt4_library.py minigpt4-13B-f16.bin ggml-vicuna-13B-v0-q5_k.bin

Webui

Instale os requisitos para o webui

pip install -r requirements.txt

Em seguida, execute o webui, substituindo minigpt4-13B-f16.bin e ggml-vicuna-13B-v0-q5_k.bin com seus respectivos modelos

python webui.py minigpt4-13B-f16.bin ggml-vicuna-13B-v0-q5_k.bin

A saída deve conter algo como o seguinte:

Running on local URL:  http://127.0.0.1:7860

To create a public link, set ` share=True ` in `launch () ` .

Vá para http://127.0.0.1:7860 no seu navegador e você poderá interagir com o webui.

Expandir

Informações adicionais

Versão v1.0.0
Tipo C/C++
Data da Última Atualização 2025-03-15
tamanho 2.16MB
Vindo de Github

Aplicativos Relacionados

abseil cpp

2024-11-13
cpp httplib

2024-11-09
zenoh cpp

2024-11-02
CPP sem aplicativo de fã de diferença

2023-08-21
Ferramenta de verificação de CPP

2023-05-24
Versão mais recente do aplicativo CPP Comic Exhibition

2023-04-08

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
DragonBonesCPP

C/C++

1.0.0
Beeftext

C/C++

v16.0
networkit

C/C++

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos