Openspeech teks untuk berbicara
Aplikasi Web Text to Speech (TTS) menggunakan OpenAI API yang dapat Anda host sendiri.
OpenSpeech adalah aplikasi web berbasis python yang dapat di-host yang menggunakan kemampuan teks-ke-ucapan openai untuk mengubah teks menjadi pidato. Aplikasi ini dibangun dengan Flask, kerangka kerja web yang ringan untuk Python. Gunakan kunci API OpenAi Anda sendiri dan ubah konten teks Anda ke file MP3 yang diucapkan yang luar biasa.
Fitur utama
- Open source
- Kompatibel Docker
- Mendukung tema terang/gelap
- Saring suara dan tingkat kualitas yang berbeda yang didukung oleh openai
- Menampilkan perkiraan biaya untuk mengubah teks menjadi bicara
- Mengatasi batas karakter OpenAI 4096 dengan membagi teks menjadi potongan, menghasilkan file audio terpisah untuk setiap potongan dan menggabungkan output akhir menjadi satu file.
Tangkapan layar

Instalasi dan penggunaan
Buruh pelabuhan
- Cara termudah untuk menjalankan aplikasi adalah menggunakan Docker. Lihat file
docker-compose.yaml . Buat salinan file di sistem Anda.- Perbarui port di sisi kiri jika Anda ingin menjalankan aplikasi di atas port yang berbeda selain yang default: 3210
- Perbarui direktori jalur ke file. Di sinilah teks input dan output mp3 akan disimpan. Jalankan file COMPOSE dengan:
- Aplikasi akan memulai server lokal dan akan dapat diakses di
http://127.0.0.1:3210/ atau http://localhost:3210/- Perbarui IP ke IP server tempat wadah berjalan
- Perbarui port jika Anda mengubah nilai dalam file komposisi Docker.
- Buka URL ini di browser web Anda untuk menggunakan aplikasi.
Klone repo dan jalankan aplikasi Python
- Kloning repo
git clone https://github.com/binuengoor/OpenSpeech.git
- Arahkan ke direktori utama
- Pasang dependensi Python
pip install -r requirements.txt
- Untuk menjalankan aplikasi, jalankan file
app.py :
Aplikasi akan memulai server lokal dan akan dapat diakses di http://127.0.0.1:3210/ atau http://localhost:3210/ buka URL ini di browser web Anda untuk menggunakan aplikasi.
Atribusi
- Skrip python yang saya temui saat menjelajahi reddit
- air.css
- fontawesome
- Github Copilot
- Chatgpt
Berkontribusi
- Kontribusi dipersilakan! Saya bukan programmer terlatih. Saya menyatukan ini dengan bantuan AI. Jadi bantuan apa pun untuk membuat aplikasi lebih baik atau lebih bersih dipersilakan.
Lisensi
Proyek ini dilisensikan berdasarkan ketentuan lisensi MIT.
(c) Binu Pradeep 2024