sonus av
v0.1.0
O SONUS-AV é uma biblioteca Python projetada para aprimorar os grandes modelos de linguagem (LLMS), adicionando suporte para entradas de voz e imagem. Esta biblioteca simplifica o processo de conversão de fala em texto e análise de imagens antes de alimentar as informações ao LLMS.
AudioProcessor , que suporta vários idiomas e pode lidar com a tradução em tempo real.ImageProcessor para extrair texto de imagens ou gerar descrições de imagens usando modelos avançados de aprendizado de máquina. Instale a biblioteca usando PIP:
pip install sonus-av Aqui está como você pode usar o AudioProcessor para converter fala em texto:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text ) Aqui está como você pode usar o ImageProcessor para obter uma descrição de uma imagem:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )As contribuições são bem -vindas! Por favor, lance o repositório e abra uma solicitação de tração com suas melhorias.
Este projeto está licenciado sob a licença do MIT - consulte o arquivo License.md para obter detalhes.