audiotoken
v0.3.1
Tokenize Audio เพื่อรับโทเค็นอะคูสติกและความหมาย
pip install audiotokenคุณสามารถใช้เครื่องเข้ารหัสอะคูสติกหรือความหมายเพื่อเข้ารหัสเสียงและรับโทเค็น
from pathlib import Path
from audiotoken import AudioToken , Tokenizers
encoder = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = encoder . encode ( Path ( 'path/to/audio.wav' ))มี 1 อะคูสติกและ 2 tokenizers semantic:
Tokenizers.acousticTokenizers.semantic_s (เล็ก)Tokenizers.semantic_m (ปานกลาง)คุณสามารถถอดรหัสโทเค็นอะคูสติกเช่นนี้:
from pathlib import Path
from audiotoken import AudioToken , Tokenizers
tokenizer = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = tokenizer . decode ( encoded_audio )
# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
'reconstructed.wav' ,
decoded_audio ,
sample_rate = 24000
)คุณสามารถถอดรหัสโทเค็นความหมายเช่นนี้:
from pathlib import Path
from audiotoken import AudioToken , Tokenizers
semantic_tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_s , device = 'cuda:0' )
semantic_toks = semantic_tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = semantic_tokenizer . decode ( semantic_toks )
# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
'reconstructed.wav' ,
decoded_audio ,
sample_rate = 24000
)ดูตัวอย่าง/usage.ipynb สำหรับตัวอย่างการใช้งานเพิ่มเติม
ชั้นเรียนหลัก
from audiotoken import AudioToken , Tokenizers
tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_m , device = 'cuda:0' )ดู Audiotoken/core.py สำหรับเอกสารที่สมบูรณ์ของ API
มี 3 API ให้:
tokenizer.encode : เข้ารหัสไฟล์เสียง/อาร์เรย์เดียวในแต่ละครั้งtokenizer.encode_batch_files : เข้ารหัสไฟล์เสียงหลายไฟล์ในแบทช์และบันทึกลงในดิสก์โดยตรงencode_batch_files ไม่ปลอดภัยในการรันหลายครั้งในรายการไฟล์เดียวกันเนื่องจากอาจส่งผลให้ข้อมูลไม่ถูกต้อง สิ่งนี้จะได้รับการแก้ไขในการเปิดตัวในอนาคตtokenizer.decode : ถอดรหัสโทเค็นอะคูสติก/ความหมาย