Argmax a publié WhisperKit, son premier projet open source, conçu pour améliorer considérablement l'efficacité de la transcription vocale en temps réel sur les appareils Apple. Cette décision fournit aux développeurs des packages Swift et des exemples d’applications pratiques, et a démontré d’excellentes améliorations de performances sur les modèles d’iPhone 12 à 15. Le projet adopte la licence MIT et prévoit d'ajouter à l'avenir des fonctions telles que les rapports de performances et la prévision du traitement par lots asynchrone pour améliorer encore son caractère pratique et son efficacité.
Argmax annonce WhisperKit, son premier projet open source conçu pour améliorer les performances de transcription vocale en temps réel sur les appareils Apple. Le projet utilise une licence MIT pour fournir aux développeurs des packages Swift, des exemples d'applications iOS et macOS, et permet d'obtenir des améliorations significatives des performances sur les iPhones 12 à 15. Il est prévu d'introduire des fonctions telles que le reporting des performances et la prédiction par lots asynchrone.
La version open source de WhisperKit abaisse le seuil d'application de la technologie de transcription vocale, aide davantage de développeurs à intégrer des fonctions de reconnaissance vocale efficaces dans leurs applications et favorise le développement d'applications de technologie vocale dans l'écosystème Apple. Les fonctions de reporting sur les performances et de traitement asynchrone dans les futures versions amélioreront également encore davantage l'aspect pratique et l'efficacité de WhisperKit.