Конвертируйте изображения в увлекательные аудиоисточки, используя комбинацию изображений в текст, языковых моделей и технологий текста в речь.

Этот проект позволяет превратить изображения в аудиоистики. Он использует конверсию изображения в текст, языковые модели и синтез текста в речь, чтобы создать привлекательный опыт. Извлеките текст из загруженных изображений, генерируйте рассказы на основе извлеченного текста и послушайте сгенерированные истории в качестве аудиоклипов.
Клонировать репозиторий :
git clone https://github.com/fshnkarimi/Image2AudioStoryConverter.git
cd Image2AudioStoryConverterУстановить зависимости :
pip install -r requirements.txt Установите переменные среды : создайте файл .env в каталоге проекта и добавьте свой токен API обнимающего лица:
HUGGINGFACEHUB_API_TOKEN=your_token_here
Запустите приложение Streamlit :
streamlit run app.pyЗагрузите изображение :
Испытать историю :
Взносы приветствуются! Если вы хотите внести свой вклад в этот проект, следуйте этим шагам:
Наслаждайтесь превращением ваших изображений в очаровательные звуковые истории! Не стесняйтесь настраивать и улучшать этот проект, как вы считаете нужным. Если у вас есть какие -либо вопросы или идеи для улучшения, пожалуйста, не стесняйтесь связаться.