bark.cpp Download - bark.cpp Téléchargement du code source

bark.cpp

Code Source AI

v1.0.0

Télécharger

bark.cpp

Feuille de route / encode.cpp / ggml

Inférence du modèle d'écorce de Sunoai en pur C / C ++.

Description

Avec bark.cpp , notre objectif est d'amener la génération de texte vocale multilingue réaliste en temps réel à la communauté.

Implémentation simple C / C ++ sans dépendances
AVX, AVX2 et AVX512 pour les architectures x86
Backends compatibles CPU et GPU
Précision mixte F16 / F32
Quantification entière 4 bits, 5 bits et 8 bits
Backends en métal et en cuda

Modèles pris en charge

Écorce petit
Aboyer grand

Modèles que nous voulons mettre en œuvre! Veuillez ouvrir un PR :)

Audiocraft (# 62)
Audioldm2 (# 82)
Piper (# 135)

Demo sur Google Colab (# 95)

Voici une exécution typique à l'aide de bark.cpp :

./ main - p "This is an audio generated by bark.cpp"

   __               __
   / / _  ____ ______ / / __        _________  ____
  / __ / __ `/ ___ / //_/       / ___/ __ / __ 
 / / _ / / / _ / / /  / ,<    _    / / __ / / _ / / / _ / /
/ _ . ___ /__,_/ _ /  / _ /| _ |  ( _ )    ___ / . ___ / . ___ /
                                  / _ /   / _ /

bark_tokenize_input : prompt : 'This is an audio generated by bark.cpp'
bark_tokenize_input : number of tokens in prompt = 513 , first 8 tokens : 20795 20172 20199 33733 58966 20203 28169 20222

Generating semantic tokens : 17 %

bark_print_statistics :   sample time =    10.98 ms / 138 tokens
bark_print_statistics :  predict time =   614.96 ms / 4.46 ms per token
bark_print_statistics :    total time =   633.54 ms

Generating coarse tokens : 100 %

bark_print_statistics :   sample time =     3.75 ms / 410 tokens
bark_print_statistics :  predict time =  3263.17 ms / 7.96 ms per token
bark_print_statistics :    total time =  3274.00 ms

Generating fine tokens : 100 %

bark_print_statistics :   sample time =    38.82 ms / 6144 tokens
bark_print_statistics :  predict time =  4729.86 ms / 0.77 ms per token
bark_print_statistics :    total time =  4772.92 ms

write_wav_on_disk : Number of frames written = 65600.

main :     load time =   324.14 ms
main :     eval time =  8806.57 ms
main :    total time =  9131.68 ms

Voici une vidéo d'écorce fonctionnant sur l'iPhone:

ouput.mp4

Usage

Voici les étapes pour utiliser Bark.cpp

Obtenez le code

git clone --recursive https://github.com/PABannier/bark.cpp.git
cd bark.cpp
git submodule update --init --recursive

Construire

Afin de construire Bark.cpp, vous devez utiliser CMake :

mkdir build
cd build
# To enable nvidia gpu, use the following option
# cmake -DGGML_CUBLAS=ON ..
cmake ..
cmake --build . --config Release

Préparer les données et exécuter

 # Install Python dependencies
python3 -m pip install -r requirements.txt

# Download the Bark checkpoints and vocabulary
python3 download_weights.py --out-dir ./models --models bark-small bark

# Convert the model to ggml format
python3 convert.py --dir-model ./models/bark-small --use-f16

# run the inference
./build/examples/main/main -m ./models/bark-small/ggml_weights.bin -p " this is an audio generated by bark.cpp " -t 4

(Facultatif) Quantifier les poids

Les poids peuvent être quantifiés à l'aide de la stratégie suivante: q4_0 , q4_1 , q5_0 , q5_1 , q8_0 .

Notez que pour préserver la qualité de l'audio, nous ne quantifions pas le modèle de codec. La majeure partie du calcul se trouve dans le passage vers l'avant des modèles GPT.

./build/examples/quantize/quantize ./ggml_weights.bin ./ggml_weights_q4.bin q4_0

Papiers fondateurs

Aboyer
- Texte invité audio génératif
Encoder
- Compression audio neuronale haute fidélité
GPT-3
- Les modèles de langue sont des apprenants à quelques tirs

Contributif

bark.cpp est une entreprise continue qui s'appuie sur les efforts de la communauté pour durer et évoluer. Votre contribution est la bienvenue et très précieuse. Ça peut être

Rapport de bogue: vous pouvez rencontrer un bogue lors de l'utilisation bark.cpp . N'hésitez pas à le signaler sur la section des problèmes.
Demande de fonctionnalité: vous souhaitez ajouter un nouveau modèle ou prendre en charge une nouvelle plate-forme. Vous pouvez utiliser la section des problèmes pour faire des suggestions.
Demande de traction: vous pouvez avoir corrigé un bogue, ajouter une fonctionnalité ou même corriger une petite faute de frappe dans la documentation, ... vous pouvez soumettre une demande de traction et un réviseur vous contactera.

CODING LIGNTIONS

Évitez d'ajouter des dépendances tierces, des fichiers supplémentaires, des en-têtes supplémentaires, etc.
Envisagez toujours de compatibilité avec d'autres systèmes et architectures d'exploitation

Développer

Informations supplémentaires

Version v1.0.0
Type Code Source AI
Date de mise à jour 2025-09-14
taille 7.63MB
Provenant de Github

Applications connexes

abseil cpp

2024-11-13
cpp httplib

2024-11-09
BARK

2024-11-05
zenoh cpp

2024-11-02
Outil d'analyse du RPC

2023-05-24
Dernière version de l'application CPP Comic Exhibition

2023-04-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout