Téléchargement audiotoken - Téléchargement du code source audiotoken

audiotoken

Code Source AI

v0.3.1

Télécharger

Audiotoken

Tokenize audio pour obtenir des jetons acoustiques et sémantiques.

Installation

pip install audiotoken

Usage

Codage

Vous pouvez utiliser un encodeur acoustique ou sémantique pour coder l'audio et obtenir des jetons.

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers
encoder = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = encoder . encode ( Path ( 'path/to/audio.wav' ))

Il y a 1 tokenisers acoustique et 2 sémantiques disponibles:

Tokenizers.acoustic
Tokenizers.semantic_s (petit)
Tokenizers.semantic_m (médium)

Décodage

Vous pouvez décoder des jetons acoustiques comme ceci:

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers

tokenizer = AudioToken ( tokenizer = Tokenizers . acoustic , device = 'cuda:0' )
encoded_audio = tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = tokenizer . decode ( encoded_audio )

# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
    'reconstructed.wav' ,
    decoded_audio ,
    sample_rate = 24000
)

Vous pouvez décoder des jetons sémantiques comme ceci:

 from pathlib import Path
from audiotoken import AudioToken , Tokenizers

semantic_tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_s , device = 'cuda:0' )
semantic_toks = semantic_tokenizer . encode ( Path ( 'path/to/audio.wav' ))
decoded_audio = semantic_tokenizer . decode ( semantic_toks )

# Save the decoded audio and compare it with the original audio
import torch
import torchaudio
torchaudio . save (
    'reconstructed.wav' ,
    decoded_audio ,
    sample_rate = 24000
)

Voir des exemples / usage.ipynb pour plus d'exemples d'utilisation.

Apis

Classe de base

 from audiotoken import AudioToken , Tokenizers
tokenizer = AudioToken ( tokenizer = Tokenizers . semantic_m , device = 'cuda:0' )

Voir AudioKenk / Core.py pour une documentation complète des API.

Il y a 3 API fournies:

tokenizer.encode : codez des fichiers audio simples / tableaux à la fois
tokenizer.encode_batch_files : codez plusieurs fichiers audio en lots et enregistrez-les directement sur disque
1. Remarque : encode_batch_files n'est pas sûr d'exécuter plusieurs fois sur la même liste de fichiers car il peut entraîner des données incorrectes. Cela sera fixé dans une version future.
tokenizer.decode : décode les jetons acoustiques / sémantiques

Développer

Informations supplémentaires

Version v0.3.1
Type Code Source AI
Date de mise à jour 2025-08-21
taille 74.32KB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout