Konvertieren Sie Bilder mithilfe einer Kombination aus Bild-zu-Text-, Sprachmodellen und Text-zu-Sprache-Technologien in faszinierende Audiogeschichten.

Mit diesem Projekt können Sie Bilder in Audiogeschichten umwandeln. Es verwendet Bild-zu-Text-Konvertierung, Sprachmodelle und Text-to-Speech-Synthese, um ein ansprechendes Erlebnis zu schaffen. Extrahieren Sie Text aus hochgeladenen Bildern, generieren Sie Kurzgeschichten basierend auf dem extrahierten Text und hören Sie sich die generierten Geschichten als Audioclips an.
Klonen Sie das Repository :
git clone https://github.com/fshnkarimi/Image2AudioStoryConverter.git
cd Image2AudioStoryConverterAbhängigkeiten installieren :
pip install -r requirements.txt Richten Sie Umgebungsvariablen ein : Erstellen Sie eine .env -Datei im Projektverzeichnis und fügen Sie Ihr umarmendes Gesicht -API -Token hinzu:
HUGGINGFACEHUB_API_TOKEN=your_token_here
Führen Sie die Streamlit -App aus :
streamlit run app.pyLaden Sie ein Bild hoch :
Erleben Sie die Geschichte :
Beiträge sind willkommen! Wenn Sie zu diesem Projekt beitragen möchten, befolgen Sie bitte die folgenden Schritte:
Genießen Sie es, Ihre Bilder in faszinierende Audiogeschichten zu verwandeln! Fühlen Sie sich frei, dieses Projekt nach Belieben anzupassen und zu verbessern. Wenn Sie Fragen oder Verbesserungsideen haben, zögern Sie bitte nicht, sich in Verbindung zu setzen.