Groq 推出了最新的Whisper Large-V3 模型,透過Playground 和API 提供語音轉錄和翻譯功能,支援多種語言的快速轉錄和翻譯成英文。其Playground 提供免費的線上體驗,轉錄速度極快,僅需幾秒鐘即可完成4分30秒影片的轉錄。 Groq 還提供了與OpenAI 相容的API 接口,方便用戶將其整合到自己的應用中,無論是開發智慧助理還是自動化翻譯系統都非常便捷。
Groq 最新上線了Whisper Large-V3模型,使用者可以在Playground 或本地專案中使用API,實現語音轉錄和翻譯功能。此模型支援多種語言的轉錄,轉錄速度極快,且支援將其他語言翻譯成英文。

Playground連結:https://console.groq.com/playground
目前,用戶可以在Playground 上體驗並免費使用該功能,轉錄一段4分30秒的影片只需要大約3秒鐘的時間。同時,Groq 還提供了API 接口,用戶可以在本地專案中整合使用。
Whisper API的介面設計遵循了與OpenAI的兼容性標準,為用戶提供了兩個核心功能的存取路徑:語音轉文字和語音翻譯。使用者可以輕鬆地將這些功能整合到自己的應用程式中,無論是開發智慧助理還是自動化翻譯系統,都能享受到便利的開發體驗。
在效能方面,Whisper API採用了先進的"whisper-large-v3"模型,確保了在語音轉文字和翻譯任務中的頂尖效能。
此外,API對音訊檔案的格式和大小也有明確的支援標準,包括mp3、mp4、wav等常見格式,但要求檔案大小不超過25MB。特別值得注意的是,對於包含多個音軌的文件,Whisper API將只處理第一個音軌,這要求使用者在上傳前進行適當的音訊預處理。
為了提高轉錄的品質和效率,Whisper API在服務端會對音訊進行下採樣處理,降至16,000Hz的單聲道。 Groq推薦使用者在用戶端完成這項預處理步驟,這不僅有助於減少檔案體積,還能使得更長的音訊檔案得以上傳處理。
API 介面:
語音轉文字:https://api.groq.com/openai/v1/audio/transcriptions
語音翻譯:https://api.groq.com/openai/v1/audio/translations
總而言之,Groq 的Whisper Large-V3 模型及其API 提供了一種高效且易於整合的語音轉錄和翻譯解決方案,其出色的性能和便捷的介面將為開發者帶來極大的便利。 歡迎造訪Playground 體驗並探索其在不同應用程式場景中的潛力。