Download de jbonsai - Download de código -fonte jbonsai

jbonsai

Código-Fonte de IA

v0.1.1

Baixar

JBONSAI

日本語

Biblioteca de síntese de voz para aplicativos de texto em fala.

"Jbonsai" converte sequência de etiquetas de contexto completo em forma de onda de áudio.

Atualmente, este projeto é uma reescrita do mecanismo HTS na linguagem de ferrugem (isso pode mudar a qualquer momento e não há garantia de que o JBONSAI produz o mesmo resultado que o HTS Engine).

Objetivos

Melhore a legibilidade o máximo possível.
Sem comprometer a legibilidade,
- Melhorar a velocidade.
- Mantenha o consumo de memória baixo.
Pode ser compilado para o WebAssembly.

Uso

Coloque o seguinte em Cargo.toml .

[ dependencies ]
jbonsai = " 0.1.0 "

Exemplo

Este exemplo produz dados de PCM mono, 48.000 Hz (normalmente) dizendo 「盆栽」 (ぼんさい; bombomíneos) na variável speech .

# fn main ( ) -> Result < ( ) , Box < dyn std :: error :: Error > > {
// 盆栽,名詞,一般,*,*,*,*,盆栽,ボンサイ,ボンサイ,0/4,C2
let lines = [
    "xx^xx-sil+b=o/A:xx+xx+xx/B:xx-xx_xx/C:xx_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:xx_xx#xx_xx@xx_xx|xx_xx/G:4_4%0_xx_xx/H:xx_xx/I:xx-xx@xx+xx&xx-xx|xx+xx/J:1_4/K:1+1-4" ,
    "xx^sil-b+o=N/A:-3+1+4/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "sil^b-o+N=s/A:-3+1+4/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "b^o-N+s=a/A:-2+2+3/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "o^N-s+a=i/A:-1+3+2/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "N^s-a+i=sil/A:-1+3+2/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "s^a-i+sil=xx/A:0+4+1/B:xx-xx_xx/C:02_xx+xx/D:xx+xx_xx/E:xx_xx!xx_xx-xx/F:4_4#0_xx@1_1|1_4/G:xx_xx%xx_xx_xx/H:xx_xx/I:1-4@1+1&1-1|1+4/J:xx_xx/K:1+1-4" ,
    "a^i-sil+xx=xx/A:xx+xx+xx/B:xx-xx_xx/C:xx_xx+xx/D:xx+xx_xx/E:4_4!0_xx-xx/F:xx_xx#xx_xx@xx_xx|xx_xx/G:xx_xx%xx_xx_xx/H:1_4/I:xx-xx@xx+xx&xx-xx|xx+xx/J:xx_xx/K:1+1-4" ,
] ;
let engine = jbonsai :: Engine :: load ( & [
    // The path to the `.htsvoice` model file.
    // Currently only Japanese models are supported (due to the limitation of jlabel).
    "models/hts_voice_nitech_jp_atr503_m001-1.05/nitech_jp_atr503_m001.htsvoice" ,
] ) ? ;
let speech = engine . synthesize ( & lines ) ? ;
println ! (
    "The synthesized voice has {} samples in total." ,
    speech . len ( )
) ;
# Ok ( ( ) )
# }

Direitos autorais

Este software inclui código -fonte de:

HTS_ENGINE API.
- Copyright (C) 2001-2014 Instituto de Tecnologia de Nagoya Departamento de Ciência da Computação
- Copyright (c) 2001-2008 Instituto de Teckon de Tecnologia Escola de Pós-Graduação Interdisciplinar de Ciência e Engenharia