Descargar bark.cpp - descarga de código fuente de bark.cpp

bark.cpp

Código Fuente de IA

v1.0.0

Descargar

corteza

Roadmap / encodec.cpp / ggml

Inferencia del modelo de corteza de Sunoai en C/C ++ puro.

Descripción

Con bark.cpp , nuestro objetivo es llevar a la comunidad de texto multilingüe realista realista realista en tiempo real .

Implementación simple de C/C ++ sin dependencias
AVX, AVX2 y AVX512 para arquitecturas x86
Backends compatibles con CPU y GPU
Precisión mixta F16 / F32
Cuantización entera de 4 bits, 5 bits y 8 bits
Backends de metal y cuda

Modelos compatibles

Corteza pequeña
Ladrar grande

¡Modelos que queremos implementar! Por favor abra un PR :)

Audiocraft (#62)
Audioldm2 (#82)
Piper (#135)

Demostración en Google Colab (#95)

Aquí hay una ejecución típica usando bark.cpp :

./ main - p "This is an audio generated by bark.cpp"

   __               __
   / / _  ____ ______ / / __        _________  ____
  / __ / __ `/ ___ / //_/       / ___/ __ / __ 
 / / _ / / / _ / / /  / ,<    _    / / __ / / _ / / / _ / /
/ _ . ___ /__,_/ _ /  / _ /| _ |  ( _ )    ___ / . ___ / . ___ /
                                  / _ /   / _ /

bark_tokenize_input : prompt : 'This is an audio generated by bark.cpp'
bark_tokenize_input : number of tokens in prompt = 513 , first 8 tokens : 20795 20172 20199 33733 58966 20203 28169 20222

Generating semantic tokens : 17 %

bark_print_statistics :   sample time =    10.98 ms / 138 tokens
bark_print_statistics :  predict time =   614.96 ms / 4.46 ms per token
bark_print_statistics :    total time =   633.54 ms

Generating coarse tokens : 100 %

bark_print_statistics :   sample time =     3.75 ms / 410 tokens
bark_print_statistics :  predict time =  3263.17 ms / 7.96 ms per token
bark_print_statistics :    total time =  3274.00 ms

Generating fine tokens : 100 %

bark_print_statistics :   sample time =    38.82 ms / 6144 tokens
bark_print_statistics :  predict time =  4729.86 ms / 0.77 ms per token
bark_print_statistics :    total time =  4772.92 ms

write_wav_on_disk : Number of frames written = 65600.

main :     load time =   324.14 ms
main :     eval time =  8806.57 ms
main :    total time =  9131.68 ms

Aquí hay un video de ladridos en el iPhone:

OUPUT.MP4

Uso

Aquí están los pasos para usar bark.cpp

Obtener el código

git clone --recursive https://github.com/PABannier/bark.cpp.git
cd bark.cpp
git submodule update --init --recursive

Construir

Para construir bark.cpp debe usar CMake :

mkdir build
cd build
# To enable nvidia gpu, use the following option
# cmake -DGGML_CUBLAS=ON ..
cmake ..
cmake --build . --config Release

Preparar datos y ejecutar

 # Install Python dependencies
python3 -m pip install -r requirements.txt

# Download the Bark checkpoints and vocabulary
python3 download_weights.py --out-dir ./models --models bark-small bark

# Convert the model to ggml format
python3 convert.py --dir-model ./models/bark-small --use-f16

# run the inference
./build/examples/main/main -m ./models/bark-small/ggml_weights.bin -p " this is an audio generated by bark.cpp " -t 4

(Opcional) Cuantizar pesas

Los pesos se pueden cuantificar utilizando la siguiente estrategia: q4_0 , q4_1 , q5_0 , q5_1 , q8_0 .

Tenga en cuenta que para preservar la calidad de audio, no cuantificamos el modelo de códec. La mayor parte del cálculo está en el pase hacia adelante de los modelos GPT.

./build/examples/quantize/quantize ./ggml_weights.bin ./ggml_weights_q4.bin q4_0

Papeles seminales

Ladrar
- Texto provocado de audio generativo
Encodeco
- Compresión de audio neuronal de alta fidelidad
GPT-3
- Los modelos de idiomas son alumnos de pocos disparos

Que contribuye

bark.cpp es un esfuerzo continuo que se basa en los esfuerzos de la comunidad para durar y evolucionar. Su contribución es bienvenida y muy valiosa. Puede ser

Informe de error: puede encontrar un error mientras usa bark.cpp . No dude en informarlo sobre la sección del tema.
Solicitud de función: desea agregar un nuevo modelo o admitir una nueva plataforma. Puede usar la sección de problemas para hacer sugerencias.
Solicitud de extracción: es posible que haya solucionado un error, haya agregado una característica o incluso arreglado un pequeño error tipográfico en la documentación, ... puede enviar una solicitud de extracción y un revisor se comunicará con usted.

Pautas de codificación

Evite agregar dependencias de terceros, archivos adicionales, encabezados adicionales, etc.
Considere siempre la compatibilidad cruzada con otros sistemas operativos y arquitecturas

Expandir

Información adicional

Versión v1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-14
tamaño 7.63MB
Proviene de Github

Aplicaciones relacionadas

abseil cpp

2024-11-13
cpp httplib

2024-11-09
BARK

2024-11-05
zenoh cpp

2024-11-02
Herramienta de escaneo CPP

2023-05-24
Última versión de la aplicación CPP Comic Exhibition

2023-04-08

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo