sonus av
v0.1.0
Sonus-AV是一個Python庫,旨在通過增加對語音和圖像輸入的支持來增強大型語言模型(LLM)。該庫簡化了將語音轉換為文本和分析圖像的過程,然後將信息饋送到LLMS。
AudioProcessor將音頻輸入轉換為文本,後者支持多種語言並可以處理實時翻譯。ImageProcessor從圖像中提取文本或使用高級機器學習模型生成圖像的描述。 使用PIP安裝庫:
pip install sonus-av這是您可以使用AudioProcessor將語音轉換為文本的方法:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text )這是您可以使用ImageProcessor獲取圖像的描述:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )歡迎捐款!請分配存儲庫,並通過您的改進打開拉動請求。
此項目已獲得MIT許可證的許可 - 有關詳細信息,請參見許可證文件。