sonus av
v0.1.0
Sonus-Avは、音声入力と画像入力をサポートすることにより、大規模な言語モデル(LLMS)を強化するように設計されたPythonライブラリです。このライブラリは、情報をLLMSにフィードする前に、音声をテキストに変換し、画像を分析するプロセスを簡素化します。
AudioProcessorを使用して、オーディオ入力をテキストに変換します。ImageProcessorを使用して、画像からテキストを抽出するか、高度な機械学習モデルを使用して画像の説明を生成します。 PIPを使用してライブラリをインストールします。
pip install sonus-avAudioProcessorを使用してスピーチをテキストに変換する方法は次のとおりです。
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text )ImageProcessorを使用して画像の説明を取得する方法は次のとおりです。
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )貢献は大歓迎です!リポジトリをフォークし、改善とともにプルリクエストを開いてください。
このプロジェクトは、MITライセンスに基づいてライセンスされています - 詳細については、license.mdファイルを参照してください。