Download do Código Fonte audiotoken audiotoken

audiotoken

Código-Fonte de IA

v0.3.1

Baixar

Foutioken

Tokenize áudio para obter tokens acústicos e semânticos.

Instalação

pip install audiotoken

Uso

Codificação

Você pode usar um codificador acústico ou semântico para codificar áudio e obter tokens.

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers
encoder = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = encoder . encode ( Path ( 'path/to/audio.wav' ))

Existem 1 tokenizadores acústicos e 2 semânticos disponíveis:

Tokenizers.acoustic
Tokenizers.semantic_s (pequeno)
Tokenizers.semantic_m (médio)

Decodificação

Você pode decodificar tokens acústicos como este:

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers

tokenizer = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = tokenizer . decode ( encoded_audio )

# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
    'reconstructed.wav' ,
    decoded_audio ,
    sample_rate = 24000
)

Você pode decodificar tokens semânticos como este:

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers

semantic_tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_s , device = 'cuda:0' )
semantic_toks = semantic_tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = semantic_tokenizer . decode ( semantic_toks )

# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
    'reconstructed.wav' ,
    decoded_audio ,
    sample_rate = 24000
)

Consulte Exemplos/Usage.ipynb para obter mais exemplos de uso.

APIs

Classe central

 from audiotoken import AudioToken , Tokenizers
tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_m , device = 'cuda:0' )

Consulte o foulioken/core.py para obter uma documentação completa das APIs.

Existem 3 APIs fornecidas:

tokenizer.encode : codifique arquivos/matrizes de áudio únicos por vez
tokenizer.encode_batch_files : codifique vários arquivos de áudio em lotes e salve -os diretamente no disco
1. Nota : encode_batch_files não é seguro para executar várias vezes na mesma lista de arquivos, pois pode resultar em dados incorretos. Isso será corrigido em uma versão futura.
tokenizer.decode : Decode tokens acústicos/semânticos

Expandir

Informações adicionais

Versão v0.3.1
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-21
tamanho 74.32KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos