Generativ-ai-Nachrichtenreader
Keezum ai Newsreader vorstellen!
Willkommen im AI NewsReader Repository! Dieses Projekt ist eine Demonstration, wie generative KI -Tools zusammen verwendet werden können, um einen ausgeklügelten und dynamischen Nachrichtenreader -Avatar zu erstellen.
Euen Haftungsausschluss: Nur ein Scherz fühlen Sie sich gerne nach Ihrem Komfort.
Besuchen Sie diesen Link, um das Demo-Video zu sehen, um Macy in Aktion zu sehen, wo sie kurz über zwei häufig vorgeschriebene Medikamente spricht.
Das Ergebnis ist ziemlich beeindruckend und wird angesichts der Geschwindigkeit, mit der sich generative KI verbessert, nur besser. Um diese Demo zu erstellen, brauchte ich 0 Dollar und nur 25 Minuten.
Hier sind die Werkzeuge, die ich verwendet habe:
- Midjourney generieren ein Bild eines weiblichen Apothekers
- OpenAIs Chatgpt , um Skript für Newsheadlines zu generieren
- ElfLabs 's Prime Video KI, um Audio aus dem Chatgpt -Skript zu generieren
- D-IDs kreatives Reality-Studio, um realistische animierte Avatar-Videos mit Audio synchronisiert zu generieren (kostenlose Testversion)
Schritt-für-Schritt-Anleitung
(1) Midjourney - Bildgenerierung
- Wir brauchen ein Gesicht, um unseren Avatar zu repräsentieren, und wir können die Image -Generierungs -Tools wie Midjourney verwenden, um genau das zu tun
- Midjourney ist ein kostenloser KI -Service von OpenAI, der Bilder aus Textbeschreibungen erstellt
- Aufstellen:
- Midjourney arbeitet ausschließlich auf Zwietracht. Stellen Sie also sicher, dass Sie sich für ein Discord -Konto anmelden (das kostenlos ist).
- Besuchen Sie diesen Link MidJourney Site, der Sie automatisch zu einer Discord -Einladung führt.
- Akzeptieren Sie die Einladung der Zwietracht in Midjourney. Wählen Sie weiter, um weiter zu diskordieren.
- Klicken Sie auf die Schaltfläche MidJourney (mit dem Schiffsymbol) und wählen Sie einen der Neuankömmläuträume, z. B.
newbies-24 - Geben Sie in der Chat -Zeile
/imagine eine Eingabeaufforderung an. Zum Beispiel war die Eingabeaufforderung, die ich verwendete, "hochwertiges Oberkörperfoto eines weiblichen Mediennachrichtenreporters in einem roten Mantel mit einem Newsroom-Hintergrund". Drücken Sie die Eingabe nach dem Eingeben und geben Sie Midjourney einige Zeit, um die Bilder zu generieren. - Sobald Sie fertig sind, sehen Sie eine Ausgabe von vier Bildern. Unter dem Bildsatz sehen Sie einen Satz von Tasten U1-U4 und V1-V4.
- Die vier Bilder sind vom Uhrzeigersinn von der oberen linken Seite nummeriert. Um eine neue Variation für einen zu erhalten, die Sie mögen, wählen Sie "v1" (oder v2, v3 oder v4) und um eine hochauflösende Kopie zu erhalten, wählen Sie "U1" (oder U2, U3 oder U4).
- Sobald Sie Ihre ausgewählte hochauflösende Variante erhalten haben, indem Sie eine der U-Schaltflächen auswählen, klicken Sie auf das Bild und wählen Sie "im Browser öffnen". Sie können dann das hochauflösende Bild auf Ihrer lokalen Maschine speichern
(2) Playground Chatgpt - Textgenerierung
- Da alle, die ChatGPT verwenden, also etwas langsam wurde und nicht alle, die daran interessiert sind, Geld zu bezahlen, können wir ChatgptPlayground verwenden, um unsere Aufgabe sehr schnell auszuführen. Wir brauchen ein Nachrichten -Schlagzeilen, das Nachrichten bereitstellen kann. Dazu können wir ChatgptPlayground verwenden.
- Chatgpt ist ein von OpenAI entwickelter Chatbot, der im November 2022 auf den Markt gebracht wurde. Es basiert auf OpenAs GPT-3-Familie mit großer Sprachmodellen.
- Aufstellen:
- Besuchen Sie diesen Link, um auf ChatGPT zuzugreifen (Sie müssen sich entsprechend anmelden).
- Geben Sie im Abschnitt Eingabeaufforderung die entsprechende Beschreibung für das Beratungsskript ein. Die Eingabeaufforderung, die ich verwendet habe, lautet wie folgt: "Erstellen Sie ein Skript, das sich zuerst als Nachrichtenreader namens Keezum vorstellt, und spricht dann über die Schlagzeilen von Nachrichten mit Punkten und geben Sie einige Nachrichteninformationen mit der Grenze von zwei bis drei Zeilen max."
- Kopieren und speichern Sie den generierten Text in einer Textdatei auf Ihrem lokalen Computer aus der Ausgabe auf dem Bildschirm Chatgpt.
(3) Elevenlabs-Text-to-Speech-Erzeugung
- Als nächstes möchten wir den ChatGPT -Skripttext in einen natürlichen Sound -Audioclip umwandeln. Wir können dies mit kostenlosen Werkzeugen wie Prime Voice AI (von elf Labs) tun
- Prime Voice AI ist eine realistische und vielseitige KI -Sprachsoftware, die den Schöpfer und Verlage, die die ultimativen Werkzeuge für das Geschichtenerzählen suchen, die überzeugendsten, reichhaltigsten und lebensechten Stimmen verleiht.
- Aufstellen:
- Besuchen Sie die Seite elfLabs und erstellen Sie kostenlos ein Konto.
- Wählen Sie auf der Seite der Sprachsynthese eine bestimmte Stimme in den Einstellungen aus, fügen Sie das Textskript in den Textabschnitt ein und klicken Sie auf Generieren. Die Stimme, die ich ausgewählt habe, war
premade/Domi , da ich feststellte, dass es die lebhafteste und natürlichste. Die Einstellungen können auch entsprechend für Dinge wie Stabilität und Klarheit angepasst werden. - Ich habe das Drehbuch leicht verkürzt, indem ich den Abschnitt über das Arzneimittelamlodipin entfernt habe, weil ich nicht wollte, dass die Demo zu lang ist.
- Es gibt ein Kreditlimit für das kostenlose Konto. Stellen Sie daher sicher, dass Sie sie mit Bedacht für das Audio verwenden, das Sie generieren möchten.
- Laden Sie die Datei .mp3 (mit dem Titel "Synthesized_audio.mp3") auf Ihrem lokalen Computer herunter und speichern Sie sie.
(4) D -ID - Photorealistische sprechende Avatar- (und Audio -Synchronisierungsgenerierung)
- Zuletzt ist es Zeit, das Apothekerbild zu packen und Audio in ein fotorealistisches Video zu beraten. Dazu können wir Tools wie D-ID verwenden.
- Die kreative KI-Technologie von D-ID macht Bilder von Gesichtern und verwandelt sie in hochwertige, fotorealistische Videos. Beim Klicken einer Schaltfläche kann es Bilder mit Audio oder Text kombinieren, um ihnen Ausdruck und Sprache zu verleihen.
- Aufstellen:
- Besuchen Sie die D-ID-Website und erstellen Sie ein kostenloses Testkonto
- Wählen Sie die Schaltfläche Video erstellen, um ein neues Video zu erstellen
- Fügen Sie Ihr Bild mit MidJourney Pharmacist als Moderator -Bild hinzu
- Laden Sie unser Audio mit ChatGPT -Skripten in den Abschnitt
Upload your own voice rechts hoch. - Klicken Sie oben rechts auf die Schaltfläche
Generate Video und warten Sie, bis Ihr Meisterwerk zum Download bereit ist!
Abhängigkeiten
Dieses Projekt erfordert die folgenden Abhängigkeiten:
Python 3.6 or higher
Midjourney
OpenAI's GPT-3 API
ElevenLabs' Prime Video AI
D-ID's Creative Reality Studio
Zukünftige Arbeit
Wir planen, dieses Projekt weiter zu verfeinern und zu verbessern, indem wir mehr generative KI -Tools integrieren und die Funktionalität des Newsreader -Avatars erweitern. Wir begrüßen auch Beiträge oder Vorschläge der Gemeinschaft. Anerkennung
Wir möchten den Entwicklern und Forschern von Midjourney, Openai, Elevenlabs und D-ID für ihre hervorragenden generativen KI-Tools danken, die dieses Projekt ermöglicht haben.
Lizenz
Dieses Projekt ist unter der MIT -Lizenz lizenziert - Einzelheiten finden Sie in der Lizenzdatei.