UTAUTAI Download - UTAUTAI Quellcode Download

UTAUTAI

AI-Quellcode

1.0.0

Herunterladen

UTAUTAI: Uneingeschränkte Melodie Automatisierte Technologie Künstliche Interigenz

Readme

Schneller Index

Modellarchitektur
Was ist Utautai?
?Verfahren
? TODO
Anerkennung
️Show Ihre Unterstützung
? Willkommen Beiträge

Modellarchitektur

Utautai Hauptarchitektur Entschuldigung für die Handschaltung

Was ist Utautai?

Ein Open-Source-Repository, das mit der Erzeugung passender Gesangs- und Instrumental-Tracks aus Texten zielte, ähnlich wie bei Suno Ais Chirp und Riffusion.

?Verfahren

Die Methode von Utautai ist hauptsächlich von Speer -TTs inspiriert

Während des Trainings besteht die Eingabe aus semantischen Token, die aus 'Lyrics2semantic AR' erhalten wurden, die semantische Token aus Texten sowie akustische Token extrahiert. Zusätzlich werden MERT-Darstellungen, die aus der Musik abgeleitet sind, einer Quantisierung von K-mittels K-Mittel unterzogen, um weitere semantische Token zu erhalten.

Während der Inferenz ist es jedoch nicht möglich, MERT -Darstellungen aus der Musik zu erhalten. Daher schulen wir ein Stilmodul, das der Methodik von forculiertem TTS2 nach der Eingabeaufforderung während der Inferenz aus der Eingabeaufforderung erfasst. Das Stilmodul besteht aus einem Transformator-basierten Diffusionsmodell.

Ich denke, dass wir mit diesem Ansatz die Zielaufgaben erfolgreich erledigen können. Was denken Sie?

? TODO

Wie können wir Texte erhalten, die zum geschnittenen Audio passen? Oder sollten wir das Audio überhaupt erstholen? Code
Untersuchen Sie den Umgang mit Phonemisierung und speziellen Token und nehmen Sie die erforderlichen Codeänderungen vor. Code
Korrigieren Sie den Kollator im Datensatz. Code
Vervollständigen Sie den Stylemodul -Inferenzcode. Code
Andere kleinere Code -Korrekturen wie Maskierungsstrategien.
Beseitigen Sie das Diffusionsmodell und passen Sie das Konsistenzmodell an.

Anerkennung

Speer -TTS -Papier
Vall-e Papier
Jukebox -Papier
Soundstorming -Papier
Musiclm Paper
Audiolm Papier
Musikpapier
PromptTTS2 Papier
Lucidrains 'Soundstorm Repo
Soundstorming Redesokenizer
Livesitengs Vall-e
Plachtaas Vall-ex
bellen

️Show Ihre Unterstützung

Wenn Sie Utautai interessant und nützlich finden, geben Sie uns einen Stern auf Github! ️ es ermutigt uns, das Modell weiter zu verbessern und aufregende Funktionen hinzuzufügen.