Esta guía explica cómo integrar la clase de Whisper y Regordor en aplicaciones de Android para grabación de audio y reconocimiento de voz.
Aquí hay fragmentos de código separados para usar Whisper y Recorder :
Inicialización y configuración:
// Initialize Whisper
Whisper mWhisper = new Whisper ( this ); // Create Whisper instance
// Load model and vocabulary for Whisper
String modelPath = getFilePath ( "whisper-tiny.tflite" ); // Provide model file path
String vocabPath = getFilePath ( "filters_vocab_multilingual.bin" ); // Provide vocabulary file path
mWhisper . loadModel ( modelPath , vocabPath , true ); // Load model and set multilingual mode
// Set a listener for Whisper to handle updates and results
mWhisper . setListener ( new IWhisperListener () {
@ Override
public void onUpdateReceived ( String message ) {
// Handle Whisper status updates
}
@ Override
public void onResultReceived ( String result ) {
// Handle transcribed results
}
});Transcripción:
// Set the audio file path for transcription. Audio format should be in 16K, mono, 16bits
String waveFilePath = getFilePath ( "your_audio_file.wav" ); // Provide audio file path
mWhisper . setFilePath ( waveFilePath ); // Set audio file path
// Start transcription
mWhisper . setAction ( Whisper . ACTION_TRANSCRIBE ); // Set action to transcription
mWhisper . start (); // Start transcription
// Perform other operations
// Add your additional code here
// Stop transcription
mWhisper . stop (); // Stop transcriptionInicialización y configuración:
// Initialize Recorder
Recorder mRecorder = new Recorder ( this ); // Create Recorder instance
// Set a listener for Recorder to handle updates and audio data
mRecorder . setListener ( new IRecorderListener () {
@ Override
public void onUpdateReceived ( String message ) {
// Handle Recorder status updates
}
@ Override
public void onDataReceived ( float [] samples ) {
// Handle audio data received during recording
// You can forward this data to Whisper for live recognition using writeBuffer()
// mWhisper.writeBuffer(samples);
}
});Grabación:
// Check and request recording permissions
checkRecordPermission (); // Check and request recording permissions
// Set the audio file path for recording. It record audio in 16K, mono, 16bits format
String waveFilePath = getFilePath ( "your_audio_file.wav" ); // Provide audio file path
mRecorder . setFilePath ( waveFilePath ); // Set audio file path
// Start recording
mRecorder . start (); // Start recording
// Perform other operations
// Add your additional code here
// Stop recording
mRecorder . stop (); // Stop recordingAdapte estos fragmentos de código a su caso de uso específico, proporcione las rutas de archivo correctas y maneje las excepciones adecuadamente en su aplicación.
Nota : Asegúrese de tener los permisos necesarios, el manejo de errores y la administración de rutas de archivo en su aplicación cuando use la clase Recorder .
Whisper ASR es una herramienta poderosa para transcribir el discurso al texto. Sin embargo, tenga en cuenta que manejar los datos de audio y las transcripciones puede requerir una cuidadosa sincronización y manejo de errores en su aplicación Android para garantizar una experiencia de usuario sin problemas.
¡Disfruta usando la aplicación Whisper Asr Android para mejorar tus capacidades de reconocimiento de voz!