Englisch | 한국어 | Français | 简体中文 | 日本語 | Português Brasileiro
Es gibt viele automatische Manga -Übersetzer. Sehr wenige unterstützen Comics anderer Arten in anderen Sprachen. Dieses Projekt wurde erstellt, um die Fähigkeit des hochmodernen Kunst (SOTA) Großsprachenmodelle (LLMs) wie GPT-4 zu nutzen und Comics aus der ganzen Welt zu übersetzen. Derzeit unterstützt es die Übersetzung von und von Englisch, Koreanisch, Japanisch, Französisch, vereinfachtem Chinesisch, traditionellem Chinesisch, Russisch, Deutsch, Niederländisch, Spanisch und Italienisch. Es kann zu (aber nicht aus) türkisch, polnisch, portugiesisch und brasilianisch -portugiesisch führen.
Der Zustand der maschinellen Übersetzung
Vorschau
Erste Schritte
Wie es funktioniert
Anerkennung
Für ein paar Dutzend Sprachen ist der beste maschinelle Übersetzer nicht Google Translate, Papago oder sogar tief, sondern ein Sota LLM wie GPT-4O und bei weitem. Dies ist sehr offensichtlich für entfernte Sprachpaare (koreanischer <--> Englisch, japanisches <--> Englisch usw.), bei denen sich andere Übersetzer immer noch oft in Kauderwelsch verwandeln. Auszug aus "The Walking Practice" (보행 연습 연습 연습) von Dolki min (돌기민)
GPT-4 als Übersetzer. Hinweis: Einige davon haben auch offizielle englische Übersetzungen
Das Elend der hohen See
Reise nach Westen
Die WORMWORLD -SAGA
Frier: Beyond Journey's Ende
Sandtage
Spieler (Oh Hyeon-Jun)
Kohlenstoff & Silizium
Installieren Sie Python (> = 3.10). Ticken Sie während des Setups "Python.exe zum Pfad hinzufügen".
https://www.python.org/downloads/Klonen Sie das Repo (oder laden Sie den Ordner herunter), navigieren Sie zum Ordner
git clone https://github.com/ogkalu2/comic-translate
cd comic-translateund installieren Sie die Anforderungen
pip install -r requirements.txtWenn Sie auf Probleme stoßen, können Sie versuchen, es in einer virtuellen Umgebung auszuführen. Öffnen Sie das Terminal/CMD in welchem Verzeichnis, das die virtuelle Umgebung installiert hat (oder CD 'Pfad/zu/virtueller Umgebung/Ordner'). Erstellen Sie Ihre virtuelle Umgebung mit:
python -m venv comic-translate-venvAktivieren Sie nun die virtuelle Umgebung. Unter Windows:
comic-translate-venv S cripts a ctivateAuf Mac und Linux:
source comic-translate-venv/bin/activateJetzt können Sie die Installationsbefehle erneut ausführen. Wenn Sie mit der App fertig sind, können Sie die VirtuL -Umgebung mit:
deactivateVerwenden Sie zur Wiedereinaktivierung dieselben Befehle mit dem Terminal im Ordner, in dem sich Ihr virtueller Umgebungsordner befindet.
Wenn Sie eine Nvidia -GPU haben, wird empfohlen, zu laufen
pip uninstall torch torchvision
pip install torch==2.1.0+cu121 -f https://download.pytorch.org/whl/torch_stable.html
pip install torchvision==0.16.0+cu121 -f https://download.pytorch.org/whl/torch_stable.htmlHinweis: Der 121 in +Cu121 repräsentiert die CUDA -Version - 12.1. Ersetzen Sie 121 durch Ihre CUDA -Version. ZB 118 Wenn Sie CUDA 11.8 ausführen
Im Comic-Translate-Verzeichnis führen
python comic.pyDies wird die GUI starten
raise RarCannotExec( " Cannot find working tool " )In diesem Fall Anweisungen für Windows, Linux, Mac
Für die folgenden Auswahl müssen Zugang zu geschlossenen Ressourcen erfordern und anschließend API -Schlüssel:
Sprach-Bubble-Detektor, Text-Segmentierer. Zwei Yolov8m -Modelle, die auf 8K- und 3K -Bildern von Comics (Manga, Webtoons, Western) trainiert wurden.
Standardmäßig:
Optional:
Diese können für eine der unterstützten Sprachen verwendet werden. Ein API -Schlüssel ist erforderlich.
Ein Manga/Anime -Finetuned Lama -Checkpoint zum Entfernen von Text, der vom Segmentierer erkannt wurde. Umsetzungsgericht von Lama-Cleaner
Derzeit unterstützt dies die Verwendung von GPT-4O, GPT-4O Mini, Deepl, Claude-3-Opus, Claude-3,5-SONNET, Claude-3-Haiku, Gemini-1.5-Flash, Gemini-1.5-Pro, Yandex, Google Translate und Microsoft Translator.
Alle LLMs erhalten den gesamten Seitentext, um Übersetzungen zu unterstützen. Es besteht auch die Möglichkeit, das Bild selbst für einen weiteren Kontext bereitzustellen.
PIL für die Renderung des verpackten Textes in Begrenzungsboxen, die aus Blasen und Text erhalten wurden.