sonus av
v0.1.0
Sonus-AV是一个Python库,旨在通过增加对语音和图像输入的支持来增强大型语言模型(LLM)。该库简化了将语音转换为文本和分析图像的过程,然后将信息馈送到LLMS。
AudioProcessor将音频输入转换为文本,后者支持多种语言并可以处理实时翻译。ImageProcessor从图像中提取文本或使用高级机器学习模型生成图像的描述。 使用PIP安装库:
pip install sonus-av这是您可以使用AudioProcessor将语音转换为文本的方法:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text )这是您可以使用ImageProcessor获取图像的描述:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )欢迎捐款!请分配存储库,并通过您的改进打开拉动请求。
此项目已获得MIT许可证的许可 - 有关详细信息,请参见许可证文件。