sonus av
v0.1.0
SONUS-AV es una biblioteca de Python diseñada para mejorar los modelos de idiomas grandes (LLM) al agregar soporte para entradas de voz e imágenes. Esta biblioteca simplifica el proceso de convertir el habla en texto y analizar imágenes antes de alimentar la información a LLMS.
AudioProcessor , que admite múltiples idiomas y puede manejar la traducción en tiempo real.ImageProcessor para extraer texto de imágenes o generar descripciones de imágenes utilizando modelos avanzados de aprendizaje automático. Instale la biblioteca con PIP:
pip install sonus-av Así es como puede usar el AudioProcessor para convertir el discurso en texto:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text ) Así es como puede usar el ImageProcessor para obtener una descripción de una imagen:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )¡Las contribuciones son bienvenidas! Haga la bifurcación del repositorio y abra una solicitud de extracción con sus mejoras.
Este proyecto tiene licencia bajo la licencia MIT: consulte el archivo License.md para más detalles.