Suara untuk berbicara
Voice to Speech adalah layanan sisi klien di dalam browser yang mengubah suara pengguna menjadi pidato yang disintesis secara langsung melalui pengenalan suara, dengan ratusan suara, teks ke bicara (TT), translasi otomatis bahasa, dan dukungan soket.
Browser yang Diketahui: Chrome, Edge, Safari
Kunjungi https://shadowforests.github.io/voicetospeech/ untuk menggunakan suara untuk berbicara.
Fitur
- Pengenalan pidato langsung melalui Web Speech API (hanya di Chrome).
- Voice-to-speech latensi rendah dengan menggunakan hasil pengenalan ucapan sementara.
- Input Teks-ke-Pidato Alternatif untuk kontrol output yang halus.
- Terjemahan Otomatis dari Bahasa Suara Input ke Bahasa Output Bicara.
- Banyak pilihan bahasa dan dialek untuk pengenalan ucapan dan suara.
- Termasuk dukungan untuk suara di komputer Anda dan dibangun ke browser Anda.
- Kustomisasi input audio dan perangkat output.
- Kustomisasi volume output, serta pitch dan rate untuk suara tertentu.
- Transkrip Output Live Speech dengan dukungan pemutaran untuk semua entri transkrip.
- Memilih semua teks pada halaman hanya akan memilih teks transkrip, memungkinkan copy-paste yang mudah.
- Diagnostik langsung untuk output pengenalan suara, kepercayaan diri, dan kesalahan.
- Gunakan soket web untuk mengirim teks output ucapan langsung ke PC Anda.
- Gunakan dua contoh untuk memungkinkan terjemahan dua arah antara Anda dan orang lain.
Soket web
Anda dapat mengatur server soket web di PC Anda untuk mengirim teks output ucapan langsung ke PC Anda. Anda dapat menemukan contoh dalam repositori ini yang dapat Anda jalankan menggunakan node. Mulai server dengan menjalankan socket/run_server.bat dan ucapan akan dikirim ke socket/vts_speech.txt setiap kali Anda menggunakan situs suara ke ucapan.
Terjemahan dua arah
Ini adalah walkthrough untuk mengatur sistem kustom memungkinkan terjemahan dua arah antara Anda dan orang lain.
- Anda akan memerlukan dua browser chrome terpasang secara terpisah. Saya merekomendasikan Chrome dan Chrome Beta. Ini karena browser chrome tunggal hanya dapat menangani satu input suara sekaligus.
- Anda juga membutuhkan setidaknya dua router audio dari VB-Cable. Anda harus mendapatkan driver VB-Cable default serta VB-Cable tambahan A (DonationWare). Ini agar kita dapat merutekan audio melalui saluran terpisah untuk menghindari tabrakan dalam hasil pengenalan suara. Setelah diatur, Anda dapat membuka opsi suara komputer Anda dan mengaktifkan mendengarkan kabel dari speaker utama Anda. Ini membantu mendengar apa yang terjadi selama percakapan.
- Buka situs suara ke ucapan di kedua browser. Buka menu Opsi dan aktifkan terjemahan di kedua browser.
- Di Chrome, atur input ke mikrofon pribadi Anda, dan output ke output kabel . Kemudian, atur bahasa Anda sebagai input, dan bahasa yang dikatakan orang lain sebagai output.
- Dalam program komunikasi Anda, atur mikrofon input Anda ke output kabel . Sekarang, ketika Anda berbicara, sintesis ucapan akan menghasilkan program komunikasi Anda alih -alih suara Anda.
- Dalam beta chrome, atur input ke output Cable-A , dan output ke speaker default Anda. Kemudian, atur bahasa yang dikatakan orang lain sebagai input, dan bahasa Anda sebagai output.
- Jika program komunikasi Anda mendukung pengalihan output audio, atur output ke output kabel-A . Jika tidak, jika Anda menggunakan Windows, Anda dapat pergi ke opsi pemutaran suara di aplikasi Pengaturan, klik volume aplikasi dan properti perangkat , dan mengubah perangkat output untuk program komunikasi Anda. Ini mungkin mengharuskan Anda untuk memulai kembali program Anda. Sekarang, ketika orang lain berbicara, suara mereka akan dialihkan melalui suara ke pidato dan output sebagai pidato yang diterjemahkan melalui pembicara Anda.
- Sekarang suara orang lain akan diterjemahkan secara otomatis dan diucapkan ke pembicara Anda, dan suara Anda akan diterjemahkan dan diucapkan secara otomatis melalui program komunikasi Anda!
Lisensi
Proyek ini dilisensikan di bawah lisensi MIT - lihat file lisensi.md untuk detailnya