TTS-STT adalah Python & Flask PowerD, sistem yang mudah digunakan yang membuat Anda mengonversi teks menjadi ucapan atau ucapan menjadi teks menggunakan aplikasi web kecil.
Fitur TTS (Teks ke Pidato) gratis berkat terjemahan Reverso, tetapi fitur pidato ke teks memerlukan akun cloud Google API aktif dengan akun penagihan yang diaktifkan (tabel penetapan harga dapat ditemukan di sini).
Seperti yang saya sebutkan, untuk menggunakan pengenalan ucapan Google, kita perlu membuat aplikasi Google dan mengaktifkan API. Berikut adalah langkah-langkah yang perlu Anda ikuti untuk mengintegrasikan program Anda dengan API Google Speech-to-Text.
Hal pertama yang Anda butuhkan untuk mengakses Google API adalah akun Google dan membuat aplikasi Google. Anda dapat membuat aplikasi Google menggunakan Google Console: Pergi ke Google Console.
Setelah Anda membuka konsol Google, klik dropdown di bagian atas. Dropdown ini menampilkan aplikasi Google Anda yang ada. Setelah mengklik, pop up akan muncul, lalu klik "Proyek Baru."


Kemudian masukkan nama aplikasi Anda dan klik Buat.
Setelah Anda membuat aplikasi Google, Anda perlu memberikan akses aplikasi ke API "Google Cloud Speech-to-Text". Untuk melakukannya, buka dasbor aplikasi dan dari sana, buka ikhtisar APIS. Lihat di bawah cara mengakses:

Klik "Aktifkan API dan Layanan," dan kemudian cari dengan "Pidato," maka semua API Google yang berkaitan dengan teks akan terdaftar.


Dan kemudian klik "Aktifkan." Setelah diaktifkan, Anda akan memberikan izin ke aplikasi Anda untuk mengakses "Google Cloud Speech to Text API."
Langkah selanjutnya adalah mengunduh kredensial Google Anda. Kredensial diperlukan sehingga Google dapat mengotentikasi aplikasi Anda, dan oleh karena itu Google tahu bahwa API mereka diakses oleh Anda. Dengan cara ini, mereka dapat mengukur seberapa banyak Anda menggunakan API mereka dan menagih Anda jika konsumsi melewati ambang batas bebas.
Berikut adalah langkah -langkah untuk mengunduh kredensial Google. Pertama, dari dasbor rumah, harus "pergi ke ikhtisar API," seperti sebelumnya, dan di menu sisi kiri, klik kredensial.

Kemudian klik "Buat Kredensial" dan buat "Akun Layanan."

Masukkan nama akun layanan apa pun yang Anda sukai, dan klik Buat. Opsional, Anda dapat memberikan akses akun layanan ke proyek, dan klik selesai.

Sekarang klik akun layanan yang baru saja Anda buat. Klik terakhir akan membawa Anda ke detail akun layanan.

Buka bagian "Keys" dan klik "Tambah Kunci" dan "Buat Kunci Baru," yang akan membuat kunci baru. Kunci ini dikaitkan dengan aplikasi Anda melalui akun layanan.

Di pop-up, pilih JSON dan klik Buat, yang akan mengunduh file JSON yang berisi kunci ke mesin Anda. Harap buat catatan di mana Anda menyimpan file ini karena Anda akan membutuhkannya berikutnya.

version : " 3.7 "
services :
tts-stt :
image : techblog/tts-stt:latest
ports :
- " 8080:8080 "
container_name : tts-stt
labels :
- " com.ouroboros.enable=true "
networks :
- default
volumes :
- ./ttstt/keys/key-file.json:/opt/ttstt/keys/key-file.json
- /etc/localtime:/etc/localtime:ro
restart : unless-stoppedNama "Key-File.json" adalah wajib (Anda tidak dapat mengubahnya), ini adalah file kunci yang telah Anda buat dan diunduh pada langkah 3.
Sekarang, jalankan docker-copmose up -d untuk menarik dan menjalankan wadah Anda. Buka browser Anda dan nevigasi ke alamat IP wadah Anda dengan port 8080, Anda akan melihat layar berikut. 