bark.cpp ดาวน์โหลด - bark.cpp ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

bark.cpp

โค้ดแหล่งที่มา AI

v1.0.0

ดาวน์โหลด

bark.cpp

Roadmap / encodec.cpp / ggml

การอนุมานของแบบจำลองเปลือกไม้ของ Sunoai ใน C/C ++ บริสุทธิ์

คำอธิบาย

ด้วย bark.cpp เป้าหมายของเราคือนำการสร้างข้อความ หลายภาษาแบบเรียล ไทม์มาสู่ชุมชน

การใช้งาน C/C ++ ธรรมดาโดยไม่ต้องพึ่งพา
AVX, AVX2 และ AVX512 สำหรับสถาปัตยกรรม x86
แบ็กเอนด์ที่เข้ากันได้ของ CPU และ GPU
ความแม่นยำแบบผสม F16 / F32
ปริมาณจำนวนเต็ม 4 บิต, 5 บิตและ 8 บิต
แบ็กเอนด์โลหะและ cuda

รุ่นรองรับ

เปลือกเล็ก
เปลือกใหญ่

แบบจำลองที่เราต้องการใช้! กรุณาเปิดประชาสัมพันธ์ :)

Audiocraft (#62)
AudioldM2 (#82)
ไพเพอร์ (#135)

สาธิตใน Google Colab (#95)

นี่คือการวิ่งทั่วไปโดยใช้ bark.cpp :

./ main - p "This is an audio generated by bark.cpp"

   __               __
   / / _  ____ ______ / / __        _________  ____
  / __ / __ `/ ___ / //_/       / ___/ __ / __ 
 / / _ / / / _ / / /  / ,<    _    / / __ / / _ / / / _ / /
/ _ . ___ /__,_/ _ /  / _ /| _ |  ( _ )    ___ / . ___ / . ___ /
                                  / _ /   / _ /

bark_tokenize_input : prompt : 'This is an audio generated by bark.cpp'
bark_tokenize_input : number of tokens in prompt = 513 , first 8 tokens : 20795 20172 20199 33733 58966 20203 28169 20222

Generating semantic tokens : 17 %

bark_print_statistics :   sample time =    10.98 ms / 138 tokens
bark_print_statistics :  predict time =   614.96 ms / 4.46 ms per token
bark_print_statistics :    total time =   633.54 ms

Generating coarse tokens : 100 %

bark_print_statistics :   sample time =     3.75 ms / 410 tokens
bark_print_statistics :  predict time =  3263.17 ms / 7.96 ms per token
bark_print_statistics :    total time =  3274.00 ms

Generating fine tokens : 100 %

bark_print_statistics :   sample time =    38.82 ms / 6144 tokens
bark_print_statistics :  predict time =  4729.86 ms / 0.77 ms per token
bark_print_statistics :    total time =  4772.92 ms

write_wav_on_disk : Number of frames written = 65600.

main :     load time =   324.14 ms
main :     eval time =  8806.57 ms
main :    total time =  9131.68 ms

นี่คือวิดีโอของเปลือกไม้ที่ทำงานบน iPhone:

ouput.mp4

การใช้งาน

นี่คือขั้นตอนในการใช้ bark.cpp

รับรหัส

git clone --recursive https://github.com/PABannier/bark.cpp.git
cd bark.cpp
git submodule update --init --recursive

สร้าง

ในการสร้าง bark.cpp คุณต้องใช้ CMake :

mkdir build
cd build
# To enable nvidia gpu, use the following option
# cmake -DGGML_CUBLAS=ON ..
cmake ..
cmake --build . --config Release

เตรียมข้อมูลและเรียกใช้

 # Install Python dependencies
python3 -m pip install -r requirements.txt

# Download the Bark checkpoints and vocabulary
python3 download_weights.py --out-dir ./models --models bark-small bark

# Convert the model to ggml format
python3 convert.py --dir-model ./models/bark-small --use-f16

# run the inference
./build/examples/main/main -m ./models/bark-small/ggml_weights.bin -p " this is an audio generated by bark.cpp " -t 4

(ไม่บังคับ) น้ำหนักควอนตัม

น้ำหนักสามารถวัดปริมาณได้โดยใช้กลยุทธ์ต่อไปนี้: q4_0 , q4_1 , q5_0 , q5_1 , q8_0

โปรดทราบว่าเพื่อรักษาคุณภาพเสียงเราจะไม่หาปริมาณโมเดลตัวแปลงสัญญาณ จำนวนมากของการคำนวณอยู่ในผ่านไปข้างหน้าของรุ่น GPT

./build/examples/quantize/quantize ./ggml_weights.bin ./ggml_weights_q4.bin q4_0

เอกสารน้ำเชื้อ

เห่า
- ข้อความแจ้งเตือนเสียงทั่วไป
encodec
- การบีบอัดเสียงของระบบประสาทที่มีความเที่ยงตรงสูง
GPT-3
- แบบจำลองภาษาเป็นผู้เรียนไม่กี่คน

การบริจาค

bark.cpp เป็นความพยายามอย่างต่อเนื่องที่ต้องอาศัยความพยายามของชุมชนในการพัฒนาและพัฒนา การบริจาคของคุณยินดีต้อนรับและมีค่าสูง มันสามารถ

รายงานข้อผิดพลาด: คุณอาจพบข้อผิดพลาดในขณะที่ใช้ bark.cpp อย่าลังเลที่จะรายงานในส่วนปัญหา
คำขอคุณสมบัติ: คุณต้องการเพิ่มรุ่นใหม่หรือรองรับแพลตฟอร์มใหม่ คุณสามารถใช้ส่วนปัญหาเพื่อให้คำแนะนำ
คำขอดึง: คุณอาจแก้ไขข้อผิดพลาดเพิ่มคุณสมบัติหรือแม้แต่แก้ไขการพิมพ์ผิดเล็ก ๆ ในเอกสารประกอบ ... คุณสามารถส่งคำขอดึงและผู้ตรวจสอบจะติดต่อคุณ