Groq telah meluncurkan model Whisper Large-V3 terbarunya, yang menyediakan kemampuan transkripsi dan terjemahan ucapan melalui Playground dan API, mendukung transkripsi cepat dan terjemahan berbagai bahasa ke dalam bahasa Inggris. Playground-nya memberikan pengalaman online gratis dan kecepatan transkripsinya sangat cepat. Hanya perlu beberapa detik untuk menyelesaikan transkripsi video berdurasi 4 menit 30 detik. Groq juga menyediakan antarmuka API yang kompatibel dengan OpenAI, sehingga memudahkan pengguna untuk mengintegrasikannya ke dalam aplikasi mereka sendiri. Sangat mudah untuk mengembangkan asisten cerdas atau sistem terjemahan otomatis.
Groq baru-baru ini meluncurkan model Whisper Large-V3. Pengguna dapat menggunakan API di Playground atau proyek lokal untuk mengimplementasikan fungsi transkripsi dan terjemahan ucapan. Model ini mendukung transkripsi dalam berbagai bahasa, kecepatan transkripsi sangat cepat, dan mendukung terjemahan bahasa lain ke dalam bahasa Inggris.

Tautan taman bermain: https://console.groq.com/playground
Saat ini, pengguna dapat merasakan dan menggunakan fitur ini secara gratis di Playground. Hanya membutuhkan waktu sekitar 3 detik untuk menyalin video berdurasi 4 menit 30 detik. Pada saat yang sama, Groq juga menyediakan antarmuka API yang dapat diintegrasikan dan digunakan pengguna dalam proyek lokal.
Desain antarmuka Whisper API mengikuti standar kompatibilitas dengan OpenAI, memberi pengguna akses ke dua fungsi inti: terjemahan ucapan ke teks dan terjemahan ucapan. Pengguna dapat dengan mudah mengintegrasikan fungsi-fungsi ini ke dalam aplikasi mereka sendiri dan menikmati pengalaman pengembangan yang nyaman baik mereka mengembangkan asisten cerdas atau sistem terjemahan otomatis.
Dalam hal kinerja, Whisper API mengadopsi model canggih "whisper-large-v3" untuk memastikan kinerja terbaik dalam tugas ucapan-ke-teks dan terjemahan.
Selain itu, API juga memiliki standar dukungan yang jelas untuk format dan ukuran file audio, termasuk format umum seperti mp3, mp4, wav, dll, namun ukuran file tidak boleh melebihi 25MB. Catatan khusus adalah bahwa untuk file yang berisi beberapa trek audio, Whisper API hanya akan memproses trek audio pertama, yang mengharuskan pengguna melakukan pra-pemrosesan audio yang sesuai sebelum mengunggah.
Untuk meningkatkan kualitas dan efisiensi transkripsi, Whisper API akan menurunkan sampel audio di sisi server menjadi mono 16.000Hz. Groq merekomendasikan pengguna untuk menyelesaikan langkah pra-pemrosesan ini di sisi klien, yang tidak hanya membantu mengurangi ukuran file, tetapi juga memungkinkan file audio yang lebih panjang untuk diunggah dan diproses.
Antarmuka API:
Pidato ke teks: https://api.groq.com/openai/v1/audio/transcriptions
Terjemahan suara: https://api.groq.com/openai/v1/audio/translations
Secara keseluruhan, model Whisper Large-V3 Groq dan API-nya menyediakan solusi transkripsi dan terjemahan ucapan yang efisien dan mudah diintegrasikan. Performanya yang luar biasa dan antarmuka yang nyaman akan memberikan kenyamanan luar biasa bagi pengembang. Selamat mengunjungi Playground untuk merasakan dan mengeksplorasi potensinya dalam berbagai skenario aplikasi.