Download PaddleSpeech - Download Kode Sumber PaddleSpeech

PaddleSpeech

Kode Sumber AI

PaddleSpeech r1.4.2

Unduh

(Cina Sederhana | Bahasa Inggris)

Mulai Cepat | Dokumen | Daftar Model | Kursus Aistudio | NAACL2022 Paper Penghargaan Demo Terbaik | Gitee

Paddlespeech adalah alat open-source pada platform Paddlepaddle untuk berbagai tugas penting dalam pidato dan audio, dengan model yang canggih dan berpengaruh.

Paddlespeech memenangkan Penghargaan Demo Terbaik NAACL2022, silakan lihat makalah kami tentang Arxiv.

Pengakuan ucapan

Audio Input	Hasil pengakuan
	Saya mengetuk pintu di sisi kuno bangunan.
	Saya pikir hal terpenting tentang berlari adalah memberi saya kesehatan yang baik.

Terjemahan ucapan (bahasa Inggris ke Cina)

Audio Input	Hasil terjemahan
	Saya mengetuk pintu kuno bangunan ini.

Teks-ke-speech

Teks input	Audio sintetis
Hidup itu seperti sekotak cokelat, Anda tidak pernah tahu apa yang akan Anda dapatkan.
Selamat pagi, hari ini adalah 2020/10/29, dengan suhu minimum -3 ° C.
Ji Ji Ji, ayam pengumpul, dan ayam adalah ayam berduri. The Thorn Chicken lapar, ji ji dan ji ji membantu ayam. Ketika ayam dicampur, mereka bergabung dengan Ji Ji. Ji Ji sangat cepat menabrak ayam, ayamnya mendesak, dan bajingan itu mendesak, ji ji cemas, dan kemudian dia memukul ayam. Ji Ji dengan cepat menabrak ayam. Ketika ayam itu mati, ji ji bersemangat, dan dia menulis "Ji Ji mengetuk ayam".
Halo semuanya, saya adalah guru virtual burung beo. Mari Baca Puisi. Saya dan angin musim semi lewat. Anda mengambil air musim gugur untuk mengambil galaksi.
IKEA tidak perlu untuk Anda bicarakan, tetapi apa yang Anda katakan akan menjadi presentasi dan pengakuan.
Setiap negara memiliki lagu kebangsaannya sendiri

Untuk audio yang disintesis lebih lanjut, silakan merujuk ke sampel Text-to-Speech Paddlespeech.

Restorasi tanda baca

Teks input	Teks keluaran
Cuacanya sangat bagus hari ini. Apakah Anda punya waktu di sore hari? Saya ingin meminta Anda untuk makan malam bersama	Cuaca hari ini sangat bagus! Apakah Anda bebas di sore hari? Saya ingin meminta Anda makan bersama.

Fitur

Melalui implementasi yang mudah digunakan, efisien, fleksibel, dan dapat diskalakan, visi kami adalah untuk memberdayakan aplikasi industri dan penelitian akademik, termasuk pelatihan, modul inferensi & pengujian, dan proses penyebaran. Untuk lebih spesifik, fitur toolkit ini di:

? Kemudahan Penggunaan : Hambatan rendah untuk menginstal, CLI, server, dan server streaming tersedia untuk memulai perjalanan Anda dengan cepat.
? Sejajarkan dengan canggih : Kami menyediakan model berkecepatan tinggi dan sangat ringan, dan juga teknologi mutakhir.
? Streaming Sistem ASR dan TTS : Kami menyediakan produksi streaming ASR dan sistem streaming TTS.
? Frontend China Berbasis Aturan : Frontend kami berisi normalisasi teks dan grafe-ke-phoneme (G2P, termasuk polife dan nada sandhi). Selain itu, kami menggunakan aturan linguistik yang ditentukan sendiri untuk mengadaptasi konteks Cina.
? Varietas fungsi yang menghidupkan baik industri dan akademisi :
- ? ️ Implementasi tugas audio kritis : Toolkit ini berisi fungsi audio seperti pengenalan ucapan otomatis, sintesis teks-ke-pidato, verfication speaker, bercak kata kunci, klasifikasi audio, dan terjemahan pidato, dll.
- ? Integrasi Model dan Dataset Mainstream : Toolkit mengimplementasikan modul yang berpartisipasi dalam seluruh pipa tugas pidato, dan menggunakan dataset utama seperti Librispeech, LJSpeech, Aishell, CSMSC, dll. Lihat juga daftar model untuk lebih rinci.
- ? Aplikasi Model Cascade : Sebagai perpanjangan dari tugas audio tradisional yang khas, kami menggabungkan alur kerja dari tugas -tugas yang teralienasi dengan bidang lain seperti pemrosesan bahasa alami (NLP) dan visi komputer (CV).

Pembaruan Terbaru

? 2023.05.31: Tambahkan WAVLM ASR-EN, fine-tuning WAVLM untuk ASR di Librispeech.
? 2023.05.18: Tambahkan squeezeformer, pelatihan squeezeformer untuk ASR di Aishell.
? 2023.05.04: Tambahkan Hubert Asr-en, fine-tuning Hubert untuk ASR di Librispeech.
⚡ 2023.04.28: Memperbaiki tensor 0-D, dengan peningkatan paddlepaddle == 2.5, masalah memodifikasi tensor 0-D telah dipecahkan.
? 2023.04.25: Tambahkan amp untuk konformer U2.
2023.04.06: Tambahkan contoh file subtitle (.srt format).
2023.03.14: Tambahkan SVS (Syning Voice Sintesis) Contoh dengan dataset Opencpop, termasuk Diffsinger, Pwgan dan Hifigan, efeknya terus dioptimalkan.
? 2023.03.09: Tambahkan wav2vec2asr-en.
? 2023.03.07: Tambahkan demo TTS ARM Linux C ++ (dengan C ++ Chinese Text Frontend).
2023.03.03 Tambahkan konversi suara Starganv2-VC mensintesis pipa.
? 2023.02.16: Tambahkan TTS Kanton.
2023.01.10: Tambahkan kode-switch ASR CLI dan demo.
? 2023.01.06: Tambahkan resep Kode-SWITCH ASR TAL_CS.
? 2022.12.02: Tambahkan pipa prediksi prosodi ujung ke ujung (termasuk menggunakan label prosodi dalam model akustik).
? 2022.11.30: Tambahkan Demo Android TTS.
? 2022.11.28: PP-TTS dan demo PP-ASR tersedia di Aistudio dan situs web resmi Paddlepaddle.
? 2022.11.18: Tambahkan CLI dan demo Whisper, mendukung pengenalan dan terjemahan multi bahasa.
2022.11.18: Tambahkan WAV2VEC2 CLI dan demo, dukungan ASR dan ekstraksi fitur.
? 2022.11.17: Tambahkan suara pria untuk TTS.
2022.11.07: Tambahkan u2/u2 ++ c ++ streaming kinerja tinggi ASR penyebaran.
? 2022.11.01: Tambahkan kerugian permusuhan untuk TTS campuran bahasa Inggris Cina.
2022.10.26: Tambahkan prediksi prosodi untuk TTS.
? 2022.10.21: Tambahkan SSML untuk TTS Chinese Text Frontend.
? 2022.10.11: Tambahkan fine-tuning WAV2VEC2ASR-EN, WAV2VEC2.0 untuk ASR di Librispeech.
2022.09.26: Tambahkan kloning suara, TTS Finetune, dan Ernie-Sat di Demo Web Paddlespeech.
⚡ 2022.09.09: Tambahkan contoh kloning suara Aishell-3 dengan encoder speaker ecapa-tdnn.
⚡ 2022.08.25: Lepaskan contoh Finetune TTS.
2022.08.22: Tambahkan model Ernie-Sat: Ernie-Sat-VCTK, Ernie-Sat-Aishell3, Ernie-Sat-Zh_en.
2022.08.15: Tambahkan G2PW ke TTS China Text Frontend.
2022.08.09: Rilis Chinese English Mixed Tts.
⚡ 2022.08.03: Tambahkan onnxruntime infer untuk TTS CLI.
? 2022.07.18: Rilis Vits: Vits-CSMSC, Vits-Aishell3, Vits-VC.
? 2022.06.22: Semua model TTS mendukung format ONNX.
? 2022.06.17: Tambahkan Demo Web Paddlespeech.
? 2022.05.13: Rilis PP-ASR, PP-TTS, PP-VPR.
?? 2022.05.06: PaddleSpeech Streaming Server tersedia untuk Streaming ASR dengan Punctuation Restoration dan Token Timestamp dan Text-to-Speech .
?? 2022.05.06: PaddleSpeech Server tersedia untuk Audio Classification , Automatic Speech Recognition dan Text-to-Speech , Speaker Verification dan Punctuation Restoration .
?? 2022.03.28: PaddleSpeech CLI tersedia untuk Speaker Verification .
?? 2021.12.10: PaddleSpeech CLI tersedia untuk Audio Classification , Automatic Speech Recognition , Speech Translation (English to Chinese) dan Text-to-Speech .

Masyarakat

Pindai kode QR di bawah ini dengan weChat Anda, Anda dapat mengakses grup pertukaran teknis resmi dan mendapatkan bonus (lebih dari 20GB materi pembelajaran, seperti makalah, kode dan video) dan tautan langsung dari pelajaran tersebut. Nantikan partisipasi Anda.

Instalasi

Kami sangat menyarankan pengguna kami untuk menginstal Paddlespeech di Linux dengan Python> = 3.8 dan Paddlepaddle <= 2.5.1 . Beberapa versi baru dayung tidak memiliki dukungan untuk adaptasi di dayung, jadi saat ini hanya versi 2.5.1 dan sebelumnya yang dapat didukung.

Pendahuluan Ketergantungan

GCC> = 4.8.5
Paddlepaddle <= 2.5.1
Python> = 3.8
Dukungan OS: Linux (Rekomendasi), Windows, Mac OSX

Paddlespeech tergantung pada daddlepaddle. Untuk instalasi, silakan merujuk ke situs web resmi Paddlepaddle dan memilih sesuai dengan mesin Anda sendiri. Berikut adalah contoh versi CPU.

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

Anda juga dapat menentukan versi Paddlepaddle atau menginstal versi Kembangkan.

 # install 2.4.1 version. Note, 2.4.1 is just an example, please follow the minimum dependency of paddlepaddle for your selection
pip install paddlepaddle==2.4.1 -i https://mirror.baidu.com/pypi/simple
# install develop version
pip install paddlepaddle==0.0.0 -f https://www.paddlepaddle.org.cn/whl/linux/cpu-mkl/develop.html

Ada dua metode instalasi cepat untuk paddlespeech, satu adalah instalasi PIP, dan yang lainnya adalah kompilasi kode sumber (disarankan).

Pip Instal

pip install pytest-runner
pip install paddlespeech

Kompilasi Kode Sumber

git clone https://github.com/PaddlePaddle/PaddleSpeech.git
cd PaddleSpeech
pip install pytest-runner
pip install .

Untuk masalah instalasi lebih lanjut, seperti lingkungan Conda, librosa, masalah GCC, instalasi Kaldi, dll., Anda dapat merujuk ke dokumen instalasi ini. Jika Anda mengalami masalah selama instalasi, Anda dapat meninggalkan pesan di #2150 dan menemukan masalah terkait

Awal yang cepat

Pengembang dapat mencoba model kami dengan baris perintah Paddlespeech atau Python. Ubah --input untuk menguji audio/teks Anda sendiri dan mendukung audio format WAV 16K.

Anda juga dapat dengan cepat mengalaminya di AI Studio? Demo API Paddlespeech

Uji unduhan sampel audio uji

wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav

Pengenalan ucapan otomatis

（Klik untuk memperluas） Pengenalan Pidato Sumber Terbuka

Pengalaman baris perintah

paddlespeech asr --lang zh --input zh.wav

Pengalaman API Python

 > >> from paddlespeech . cli . asr . infer import ASRExecutor
> >> asr = ASRExecutor ()
> >> result = asr ( audio_file = "zh.wav" )
> >> print ( result )
我认为跑步最重要的就是给我带来了身体健康

Teks-ke-speech

Sintesis ucapan open source

Output 24K laju sampel wav format audio

Pengalaman baris perintah

paddlespeech tts --input "你好，欢迎使用百度飞桨深度学习框架！ " --output output.wav

Pengalaman API Python

 > >> from paddlespeech . cli . tts . infer import TTSExecutor
> >> tts = TTSExecutor ()
> >> tts ( text = "今天天气十分不错。" , output = "output.wav" )

Anda dapat mengalami di ruang pelukan di Demo TTS

Klasifikasi Audio

Alat klasifikasi suara domain terbuka

Model klasifikasi suara berdasarkan 527 kategori dataset audioset

Pengalaman baris perintah

paddlespeech cls --input zh.wav

Pengalaman API Python

 > >> from paddlespeech . cli . cls . infer import CLSExecutor
> >> cls = CLSExecutor ()
> >> result = cls ( audio_file = "zh.wav" )
> >> print ( result )
Speech 0.9027186632156372

Ekstraksi suarakan

Alat ekstraksi voiceprint tingkat industri

Pengalaman baris perintah

paddlespeech vector --task spk --input zh.wav

Pengalaman API Python

 > >> from paddlespeech . cli . vector import VectorExecutor
> >> vec = VectorExecutor ()
> >> result = vec ( audio_file = "zh.wav" )
> >> print ( result ) # 187维向量
[ - 0.19083306   9.474295   - 14.122263    - 2.0916545    0.04848729
   4.9295826    1.4780062    0.3733844   10.695862     3.2697146
  - 4.48199     - 0.6617882   - 9.170393   - 11.1568775   - 1.2358263 ...]

Restorasi tanda baca

Pemulihan cepat tanda baca teks, bekerja dengan model ASR

Pengalaman baris perintah

paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭

Pengalaman API Python

 > >> from paddlespeech . cli . text . infer import TextExecutor
> >> text_punc = TextExecutor ()
> >> result = text_punc ( text = "今天的天气真不错啊你下午有空吗我想约你一起去吃饭" )
今天的天气真不错啊！你下午有空吗？我想约你一起去吃饭。

Terjemahan ucapan

Alat terjemahan ucapan bahasa Inggris ke ending-ke-end

Gunakan alat terkait Kaldi yang telah dikompilasi sebelumnya, hanya pengalaman mendukung dalam sistem Ubuntu

Pengalaman baris perintah

paddlespeech st --input en.wav

Pengalaman API Python

 > >> from paddlespeech . cli . st . infer import STExecutor
> >> st = STExecutor ()
> >> result = st ( audio_file = "en.wav" )
[ '我 在 这栋 建筑 的 古老 门上 敲门 。' ]

Server Mulai Cepat

Pengembang dapat mencoba server bicara kami dengan baris perintah server Paddlespeech.

Anda dapat mencobanya dengan cepat di AI Studio (Rekomendasikan): Pidato

Mulai server

paddlespeech_server start --config_file ./demos/speech_server/conf/application.yaml

Akses Layanan Pengenalan Pidato

paddlespeech_client asr --server_ip 127.0.0.1 --port 8090 --input input_16k.wav

Akses teks ke layanan ucapan

paddlespeech_client tts --server_ip 127.0.0.1 --port 8090 --input "您好，欢迎使用百度飞桨语音合成服务。 " --output output.wav

Akses Layanan Klasifikasi Audio

paddlespeech_client cls --server_ip 127.0.0.1 --port 8090 --input input.wav

Untuk informasi lebih lanjut tentang baris perintah server, silakan lihat: demo server wicara

Server Streaming Mulai Cepat

Pengembang dapat mencoba streaming ASR dan streaming server TTS.

Mulai Streaming Server Pengenalan Pidato

 paddlespeech_server start --config_file ./demos/streaming_asr_server/conf/application.yaml

Akses Layanan Pengenalan Pidato Streaming

 paddlespeech_client asr_online --server_ip 127.0.0.1 --port 8090 --input input_16k.wav

Mulailah Streaming Teks ke Server Pidato

 paddlespeech_server start --config_file ./demos/streaming_tts_server/conf/tts_online_application.yaml

Akses Teks Streaming ke Layanan Pidato

 paddlespeech_client tts_online --server_ip 127.0.0.1 --port 8092 --protocol http --input "您好，欢迎使用百度飞桨语音合成服务。" --output output.wav

Untuk informasi lebih lanjut silakan lihat: Streaming ASR dan streaming TTS

Daftar Model

Paddlespeech mendukung serangkaian model paling populer. Mereka dirangkum dalam model yang dirilis dan dilampirkan dengan model pretrained yang tersedia.

Pidato-ke-teks berisi model akustik , model bahasa , dan terjemahan ucapan , dengan detail berikut:

Jenis modul ucapan-ke-teks	Dataset	Tipe model	Contoh
Pidato Pidato	Aishell	Deepspeech2 RNN + Conv Based Model	Deepppeech2-Aishell
	Aishell	Model Perhatian Berbasis Transformer	u2.transformer.conformer-aishell
	Librispeech	Model Perhatian Berbasis Transformer	deepppeech2-librispirech/transformer.conformer.u2-librispirech/transformer.conformer.u2-kaldi-librispirech
	Timit	Streaming terpadu & dua-pass non-streaming	U2-timit
Penyelarasan	Thchs30	MFA	MFA-thchs30
Model Bahasa	Model Bahasa Ngram		Kenlm
Terjemahan ucapan (bahasa Inggris ke Cina)	Ted en-zh	Transformer + ASR MTL	Transformer-ted
Terjemahan ucapan (bahasa Inggris ke Cina)	Ted en-zh	Fat + Transformer + ASR MTL	Fat-st-ted

Teks-ke-pidato di paddlespeech terutama berisi tiga modul: Text Frontend , Model Akustik dan Vocoder . Model akustik dan model vokoder terdaftar sebagai berikut:

Jenis modul teks-ke-ucapan	Tipe model	Dataset	Contoh
Frontend teks			TN/G2P
Model akustik	Tacotron2	LJSPEECH/CSMSC	TACOTRON2-LJSPEECH/TACOTRON2-CSMSC
	Transformer TTS	Ljspeech	Transformer-ljspeech
	Speedyspeech	CSMSC	speedyspeech-csmsc
	Fastspeech2	Ljspeech / vctk / csmsc / aishell-3 / zh_en / format	fastspeech2-ljspeech/fastspeech2-vctk/fastspeech2-csmsc/fastspeech2-aishell3/fastspeech2-zh_en/fastspeech2-finenetune
	Ernie-Sat	Vctk / aishell-3 / zh_en	Ernie-Sat-VCTK / Ernie-Sat-Aishell3 / Ernie-Sat-Zh_en
	Diffsinger	Opencpop	Diffsinger-opencpop
Vocoder	Gelombang gelombang	Ljspeech	WAVEFLOW-LJSPEECH
	Paralel Wavegan	Ljspeech / vctk / csmsc / aishell-3 / opencpop	Pwgan-ljspeech / pwgan-vctk / pwgan-csmsc / pwgan-aishell3 / pwgan-opencpop
	Multi Band Melgan	CSMSC	Multi band Melgan-csmsc
	Gaya Melgan	CSMSC	Gaya Melgan-CSMSC
	Hifigan	Ljspeech / vctk / csmsc / aishell-3 / opencpop	Hifigan-LjSpeech / Hifigan-VCTK / HiFigan-CSMSC / HiFigan-Aishell3 / Hifigan-Opencpop
	Wavernn	CSMSC	WAVERNN-CSMSC
Kloning Suara	Ge2e	Librispeech, dll.	Ge2e
	SV2TTS (GE2E + TACOTRON2)	Aishell-3	VC0
	SV2TTS (GE2E + FASTSPEECH2)	Aishell-3	VC1
	SV2TTS (ECAPA-TDNN + FASTSPEECH2)	Aishell-3	VC2
	Ge2e + vit	Aishell-3	VITS-VC
Ujung ke ujung	Vit	CSMSC / AISHELL-3	VITS-CSMSC/VITS-AISHELL3

Klasifikasi Audio

Tugas	Dataset	Tipe model	Contoh
Klasifikasi Audio	ESC-50	Pann	Pann-ESC50

Tempat Kata Kunci

Tugas	Dataset	Tipe model	Contoh
Tempat Kata Kunci	hey-snip	Mdtc	mdtc-hey-snips

Verifikasi Pembicara

Tugas	Dataset	Tipe model	Contoh
Verifikasi Pembicara	Voxceleb1/2	Ecapa-tdnn	ecapa-tdnn-voxceleb12

Diarisasi pembicara

Tugas	Dataset	Tipe model	Contoh
Diarisasi pembicara	Ami	Ecapa-tdnn + ahc / sc	ecapa-tdnn-ami

Restorasi tanda baca

Tugas	Dataset	Tipe model	Contoh
Restorasi tanda baca	IWLST2012_ZH	Ernie Linear	IWSLT2012-Punch0

Dokumen

Biasanya, pidato sota, audio sota dan musik sota memberi Anda gambaran tentang topik akademik panas di bidang terkait. Untuk fokus pada tugas -tugas di Paddlespeech, Anda akan menemukan pedoman berikut sangat membantu untuk menumbuhkan ide -ide inti.

Instalasi
Awal yang cepat
Beberapa demo
Tutorial
- Pengenalan ucapan otomatis
  - Perkenalan
  - Persiapan data
  - Ngram LM
- Teks-ke-speech
  - Perkenalan
  - Penggunaan lanjutan
  - Frontend teks berbasis aturan Cina
  - Uji sampel audio
- Verifikasi Pembicara
  - Pencarian audio
  - Verifikasi Pembicara
- Klasifikasi Audio
- Terjemahan ucapan
- Server ucapan
Model yang Dirilis
- Pidato-ke-teks
- Teks-ke-speech
- Klasifikasi Audio
- Verifikasi Pembicara
- Diarisasi pembicara
- Restorasi tanda baca
Masyarakat
Selamat datang untuk berkontribusi
Lisensi

Modul Text-to-Speech awalnya disebut parkit, dan sekarang digabungkan dengan repositori ini. Jika Anda tertarik dengan penelitian akademik tentang tugas ini, silakan lihat Tinjauan Penelitian TTS. Juga, dokumen ini adalah pedoman yang baik untuk komponen pipa.

Contoh

Paddlebobo: Gunakan TT Paddlespeech untuk menghasilkan suara manusia virtual.

Video demo Paddlespeech
VTubertalk: Gunakan TTS Paddlespeech dan ASR untuk mengkloning suara dari video.

Kutipan

Untuk mengutip Paddlespeech untuk penelitian, silakan gunakan format berikut.

 @inproceedings{zhang2022paddlespeech,
    title = {PaddleSpeech: An Easy-to-Use All-in-One Speech Toolkit},
    author = {Hui Zhang, Tian Yuan, Junkun Chen, Xintong Li, Renjie Zheng, Yuxin Huang, Xiaojie Chen, Enlei Gong, Zeyu Chen, Xiaoguang Hu, dianhai yu, Yanjun Ma, Liang Huang},
    booktitle = {Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Demonstrations},
    year = {2022},
    publisher = {Association for Computational Linguistics},
}

@InProceedings{pmlr-v162-bai22d,
  title = {{A}$^3${T}: Alignment-Aware Acoustic and Text Pretraining for Speech Synthesis and Editing},
  author = {Bai, He and Zheng, Renjie and Chen, Junkun and Ma, Mingbo and Li, Xintong and Huang, Liang},
  booktitle = {Proceedings of the 39th International Conference on Machine Learning},
  pages = {1399--1411},
  year = {2022},
  volume = {162},
  series = {Proceedings of Machine Learning Research},
  month = {17--23 Jul},
  publisher = {PMLR},
  pdf = {https://proceedings.mlr.press/v162/bai22d/bai22d.pdf},
  url = {https://proceedings.mlr.press/v162/bai22d.html},
}

@inproceedings{zheng2021fused,
  title={Fused acoustic and text encoding for multimodal bilingual pretraining and speech translation},
  author={Zheng, Renjie and Chen, Junkun and Ma, Mingbo and Huang, Liang},
  booktitle={International Conference on Machine Learning},
  pages={12736--12746},
  year={2021},
  organization={PMLR}
}

Berkontribusi pada dayung

Anda dipersilakan untuk mengirimkan pertanyaan dalam diskusi dan laporan bug dalam masalah! Juga, kami sangat menghargai jika Anda bersedia berkontribusi pada proyek ini!

Kontributor

Pengakuan

Terima kasih banyak kepada Highcwu karena telah menambahkan contoh Vits-Aishell3 dan Vits-VC.
Terima kasih banyak kepada David-95 untuk memperbaiki bug multi-pinjaman, berkontribusi pada beberapa program dan data, dan menambahkan SSML untuk TTS China Text Frontend.
Terima kasih banyak kepada Barrykcl karena telah meningkatkan TTS Chises Frontend berdasarkan G2PW.
Terima kasih banyak kepada yeyupiaoling/ppasr/paddlepaddle-deepspeech/voiceprintrecognition-paddlepaddle/audioclasificy-paddlepaddle selama bertahun-tahun perhatian, saran konstruktif, dan bantuan besar.
Terima kasih banyak kepada MyMagicPower untuk implementasi Java ASR setelah file audio pendek dan panjang.
Terima kasih banyak kepada Jiehangxie/Paddlebobo karena telah mengembangkan virtual unggah (VUP)/virtual youtuber (vTuber) dengan fungsi TTS Paddlespeech.
Terima kasih banyak kepada 745165806/PaddlespeechTask untuk berkontribusi model restorasi baca.
Terima kasih banyak kepada KSLZ untuk dokumen Cina tambahan.
Terima kasih banyak kepada AWMMMM karena berkontribusi FastSpeech2 Aishell3 Conformer Pretrained Model.
Terima kasih banyak kepada Phecda-XU/Paddledubbing karena telah mengembangkan alat dubbing dengan GUI berdasarkan model TTS Paddlespeech.
Terima kasih banyak kepada Jerryuho/VTubertalk yang telah mengembangkan alat GUI berdasarkan TTS dan kode Paddlespeech untuk membuat set data dari video berdasarkan Paddlespeech ASR.
Banyak terima kasih kepada VPEGASUS/XUESEBOT karena telah mengembangkan rasa chatbot, yang dapat berbicara dan mendengarkan berkat paddlespeech.
Terima kasih banyak kepada Chenkui164/FastAsr untuk implementasi inferensi C ++ dari Paddlespeech ASR.
Terima kasih banyak kepada heyudage/voicetyping untuk implementasi alat pengetik suara real-time dari layanan streaming ASR Paddlespeech.
Terima kasih banyak kepada Escaticzheng/PS3.9wheel-instal untuk roda prebuilt Python3.9 untuk pemasangan dayung di windows tanpa studio viusal. Selain itu, Paddlespeech tergantung pada banyak repositori open source. Lihat referensi untuk informasi lebih lanjut.
Terima kasih banyak kepada Chinobing/Fastapi-Paddlespeech-audio-to-Text untuk mengonversi audio ke teks berdasarkan FastAPI dan Paddlespeech.
Terima kasih banyak kepada Misteo/Pallas-Bot untuk Qq Bot berdasarkan paddlespeech TTS.