Comentario: Hay una etiqueta de reconocimiento de voz en HTML5. Puede usarlo para implementar la entrada de voz. Siento que es bastante bueno. Hay un ejemplo y una captura de pantalla a continuación. Amigos a los que les gusta puede referirse a él.
<input type = "text" x-webkit-speech x-webkit-grammar = "builtin: traduce" />