Convertir des images en histoires audio captivantes en utilisant une combinaison de technologies d'image à texte, de modèles de langage et de technologies de texte-parole.

Ce projet vous permet de transformer des images en histoires audio. Il utilise la conversion d'image-texte, les modèles de langage et la synthèse de texte-parole pour créer une expérience engageante. Extraire du texte des images téléchargées, générer des histoires courtes en fonction du texte extrait et écouter les histoires générées sous forme de clips audio.
Clone le référentiel :
git clone https://github.com/fshnkarimi/Image2AudioStoryConverter.git
cd Image2AudioStoryConverterInstallez les dépendances :
pip install -r requirements.txt Configurer des variables d'environnement : créez un fichier .env dans le répertoire du projet et ajoutez votre jeton API Face Hugging:
HUGGINGFACEHUB_API_TOKEN=your_token_here
Exécutez l'application Streamlit :
streamlit run app.pyTéléchargez une image :
Découvrez l'histoire :
Les contributions sont les bienvenues! Si vous souhaitez contribuer à ce projet, veuillez suivre ces étapes:
Profitez de transformer vos images en histoires audio captivantes! N'hésitez pas à personnaliser et à améliorer ce projet comme bon vous semble. Si vous avez des questions ou des idées d'amélioration, n'hésitez pas à nous contacter.