Sonus-AV est une bibliothèque Python conçue pour améliorer les modèles de grandes langues (LLM) en ajoutant la prise en charge des entrées vocales et d'image. Cette bibliothèque simplifie le processus de conversion de la parole en texte et d'analyse des images avant de nourrir les informations en LLMS.
AudioProcessor , qui prend en charge plusieurs langues et peut gérer la traduction en temps réel.ImageProcessor pour extraire du texte des images ou générer des descriptions d'images à l'aide de modèles d'apprentissage automatique avancées. Installez la bibliothèque à l'aide de PIP:
pip install sonus-av Voici comment vous pouvez utiliser l' AudioProcessor pour convertir la parole en texte:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text ) Voici comment vous pouvez utiliser l' ImageProcessor pour obtenir une description d'une image:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )Les contributions sont les bienvenues! Veuillez débarquer le référentiel et ouvrir une demande de traction avec vos améliorations.
Ce projet est autorisé en vertu de la licence MIT - voir le fichier Licence.md pour plus de détails.