sonus av
v0.1.0
Sonus-AV adalah perpustakaan Python yang dirancang untuk meningkatkan model bahasa besar (LLM) dengan menambahkan dukungan untuk input suara dan gambar. Perpustakaan ini menyederhanakan proses mengonversi pidato ke teks dan menganalisis gambar sebelum memberi makan informasi ke LLMS.
AudioProcessor , yang mendukung berbagai bahasa dan dapat menangani terjemahan waktu nyata.ImageProcessor untuk mengekstrak teks dari gambar atau menghasilkan deskripsi gambar menggunakan model pembelajaran mesin canggih. Instal perpustakaan menggunakan PIP:
pip install sonus-av Inilah cara Anda dapat menggunakan AudioProcessor untuk mengonversi pidato menjadi teks:
from sonus_av import AudioProcessor
# Initialize the processor
audio_processor = AudioProcessor ()
# Capture and translate audio to text
recognized_text = audio_processor . capture ( 'path_to_your_audio_file.wav' )
print ( recognized_text ) Inilah cara Anda dapat menggunakan ImageProcessor untuk mendapatkan deskripsi gambar:
from sonus_av import ImageProcessor
# Initialize the processor with your OpenAI API key
image_processor = ImageProcessor ( api_key = 'your-openai-api-key' )
# Get an image description
image_description = image_processor . describe_image ( image_path )
print ( image_description )Kontribusi dipersilakan! Harap bayar repositori dan buka permintaan tarik dengan perbaikan Anda.
Proyek ini dilisensikan di bawah lisensi MIT - lihat file lisensi.md untuk detailnya.