Linux -Desktop und Sailfish OS -App zum Noten, Lesen und Übersetzen mit Offline -Sprache zu Text, Text zu Sprache und maschineller Übersetzung
Mit Sprachnote können Sie Notizen in mehreren Sprachen nehmen, lesen und übersetzen. Es verwendet Sprache zu Text, Text zu Sprache und maschinelle Übersetzung dazu. Die Text- und Sprachverarbeitung erfolgt vollständig offline, lokal auf Ihrem Computer, ohne eine Netzwerkverbindung zu verwenden. Ihre Privatsphäre wird immer respektiert. Es werden keine Daten an das Internet gesendet.
Sprachnote verwendet viele verschiedene Verarbeitungsmotoren, um seine Arbeit zu erledigen. Derzeit werden diese verwendet:
Die folgenden Sprachen werden unterstützt:
| Lang id | Name | Deepspeech (STT) | Flüstert (stt) | Vosk (STT) | April-ASR (STT) | Piper (TTS) | Rhvoice (TTS) | Espeak (TTS) | Mbrola (TTS) | Coqui (TTS) | Mimic3 (TTS) | WhisperSpeech (TTS) | Bergamotte (MT) |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| af | Afrikaans | ● | ● | ● | |||||||||
| Bin | Amharisch | ● (e) | ● | ● | ● | ||||||||
| ar | Arabisch | ● | ● | ● | ● | ● | ● | ● | |||||
| BG | bulgarisch | ● | ● | ● | |||||||||
| bn | Bengali | ● | ● | ● | ● | ||||||||
| BS | bosnisch | ● | ● | ● | |||||||||
| ca. | katalanisch | ● | ● | ● | ● | ● | ● | ● | |||||
| CS | tschechisch | ● | ● | ● | ● | ● | ● | ● | ● | ● | |||
| cy | Walisisch | ● | |||||||||||
| da | dänisch | ● | ● | ● | ● | ● | |||||||
| de | Deutsch | ● | ● | ● | ● | ● | ● | ● | ● | ||||
| El | griechisch | ● (e) | ● | ● | ● | ● | ● | ● | |||||
| en | Englisch | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | |
| eo | Esperanto | ● | ● | ● | |||||||||
| es | Spanisch | ● | ● | ● | ● | ● | ● | ● | ● | ||||
| ET | estnisch | ● (e) | ● | ● | ● | ● | ● | ||||||
| EU | baskisch | ● (e) | ● | ● | ● | ||||||||
| Fa | persisch | ● | ● | ● | ● | ● | ● | ● | ● | ● | |||
| fi | finnisch | ● | ● | ● | ● | ● | ● | ● | |||||
| fr | Französisch | ● | ● | ● | ● | ● | ● | ● | ● | ● | |||
| Ga | irisch | ● | ● | ||||||||||
| Gu | Gujarati | ● | ● | ● | |||||||||
| Ha | Hausa | ● | ● | ||||||||||
| Er | hebräisch | ● | ● | ||||||||||
| Hi | Hindi | ● | ● | ● | |||||||||
| HR | kroatisch | ● | ● | ● | ● | ● | |||||||
| Hu | ungarisch | ● (e) | ● | ● | ● | ● | ● | ● | ● | ||||
| Ausweis | Indonesisch | ● (e) | ● | ● | ● | ● | |||||||
| Ist | isländisch | ● | ● | ● | ● | ● | |||||||
| Es | Italienisch | ● | ● | ● | ● | ● | ● | ● | ● | ||||
| Ja | japanisch | ● | ● | ● | ● | ||||||||
| JV | Javaner | ● | ● | ||||||||||
| Ka | georgisch | ● | ● | ● | ● | ||||||||
| KK | Kasachisch | ● | ● | ● | ● | ● | |||||||
| ko | Koreanisch | ● | ● | ● | ● | ||||||||
| Ky | Kirgisische | ● | ● | ||||||||||
| la | lateinisch | ● | ● | ||||||||||
| lb | Luxemburgisch | ● | |||||||||||
| lt | litauisch | ● | ● | ● | ● | ● | |||||||
| lv | lettisch | ● | ● | ● | ● | ● | |||||||
| mk | mazedonisch | ● | ● | ● | |||||||||
| mn | mongolisch | ● (e) | ● | ● | |||||||||
| Herr | Marathi | ● | ● | ||||||||||
| MS | malaiisch | ● | ● | ● | ● | ||||||||
| mt | maltesisch | ● | ● | ● | |||||||||
| ne | Nepali | ● | ● | ● | ● | ||||||||
| nl | Niederländisch | ● (e) | ● | ● | ● | ● | ● | ● | ● | ||||
| NEIN | norwegisch | ● | ● | ● | ● | ||||||||
| Pl | Polieren | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● |
| pt | Portugiesisch | ● (e) | ● | ● | ● | ● | ● | ● | ● | ||||
| ro | rumänisch | ● (e) | ● | ● | ● | ● | ● | ||||||
| Ru | Russisch | ● | ● | ● | ● | ● | ● | ● | ● | ||||
| SK | slowakisch | ● | ● | ● | ● | ● | |||||||
| sl | Slowenisch | ● (e) | ● | ● | ● | ● | ● | ||||||
| sq | albanisch | ● | ● | ● | ● | ||||||||
| sr | serbisch | ● | ● | ● | ● | ● | |||||||
| SV | Schwedisch | ● | ● | ● | ● | ● | ● | ● | |||||
| SW | Swahili | ● | ● | ● | ● | ● | |||||||
| te | Telugu | ● | ● | ● | |||||||||
| th | Thai | ● (e) | ● | ● | ● | ||||||||
| tl | Tagalog | ● | ● | ● | |||||||||
| tn | Tswana | ● | ● | ● | |||||||||
| tr | Türkisch | ● (e) | ● | ● | ● | ● | ● | ● | ● | ||||
| tt | Tatar | ● | ● | ● | ● | ||||||||
| Vereinigtes Königreich | ukrainisch | ● | ● | ● | ● | ● | ● | ● | ● | ● | |||
| Uz | Usbekisch | ● | ● | ● | ● | ||||||||
| vi | Vietnamesisch | ● | ● | ● | ● | ● | ● | ||||||
| yo | Yoruba | ● (e) | ● | ● | ● | ||||||||
| Zh | chinesisch | ● | ● | ● | ● | ● | ● |
(e) experimentell, funktioniert höchstwahrscheinlich nicht gut
Schnellere Flüster-, Coqui-TTS- und MIMIC3-Modelle sind nur auf X86-64 erhältlich.
Sprachmodelle können direkt aus der App heruntergeladen werden.
Details zu Modellen, die derzeit zum Download konfiguriert sind, sind in models.json (github) oder models.json (gitlab) beschrieben.
Ab V4.4.0 besteht die App über Flatpak (veröffentlicht auf Flathub) aus den folgenden Paketen:
Das Basispaket enthält alle Abhängigkeiten, die für die Ausführung jeder Funktion der Anwendung erforderlich sind. Add-Ons fügen die Fähigkeit der GPU-Beschleunigung hinzu, die einige Vorgänge in der Anwendung beschleunigt.
Basispaket und Add-Ons enthalten viele "schwere" Bibliotheken wie CUDA, ROCM, Torch und Python-Bibliotheken. Aus diesem Grund sind die Größe der Pakete und der nach der Installation erforderliche Speicherplatz erheblich. Wenn Sie nicht alle Funktionen benötigen, können Sie ein viel kleineres "winziges" Paket (verfügbar auf der Seite der Veröffentlichungen) verwenden, die nur die grundlegenden Funktionen liefert. Wenn Sie benötigen, können Sie auch "winzige" Pakete zusammen mit GPU-Beschleunigungs-Add-On verwenden.
Vergleich zwischen Basis-, Tiny- und Add-On-Flatpak-Paketen:
| Größen | Base | Winzig | AMD-Add-On | Nvidia Add-On |
|---|---|---|---|---|
| Download -Größe | 0,9 Gib | 70 MIB | +2.1 Gib | +3.8 Gib |
| Ausgepackte Größe | 2.9 Gib | 170 MIB | +11.5 Gib | +6.9 Gib |
| Merkmale | Base | Winzig | AMD-Add-On | Nvidia Add-On |
|---|---|---|---|---|
| Coqui/Deepspeech Stt | + | + | ||
| Vosk stt | + | + | ||
| Flüstert (flüster.cpp) stt | + | + | ||
| Flüstert (flüster.cpp) stt amd gpu | - - | - - | + | |
| Flüstert (flüster.cpp) stt nvidia gpu | - - | - - | + | |
| Schneller flüstere stt | + | - - | ||
| Schneller flüstere nvidia gpu | - - | - - | + | |
| April-ASR STT | + | + | ||
| espeak tts | + | + | ||
| Mbrola tts | + | + | ||
| Piper TTS | + | + | ||
| Rhvoice TTS | + | + | ||
| Coqui tts | + | - - | ||
| Coqui TTS AMD GPU | - - | - - | + | |
| Coqui TTS Nvidia GPU | - - | - - | + | |
| Mimic3 tts | + | - - | ||
| Wisperspeech tts | + | - - | ||
| Wispersperspeech tts AMD GPU | - - | - - | + | |
| Wisperspeech tts nvidia gpu | - - | - - | + | |
| Interpunktion restauriert | + | - - | ||
| Übersetzer | + | + |
Zusätzlich zur stabilen Version im Flathub -Repository können Sie versuchen, die "Beta" -Version der bevorstehenden Version zu testen. Diese Version ist nutzbar, kann aber mehr Fehler enthalten.
Die Beta-Version ist im Repository "Flathub-Beta" erhältlich. Befolgen Sie diese Anweisungen, um Flathub-Beta auf Ihrem Computer zu ermöglichen.
Es ist auch möglich, die neueste Entwicklung (GIT) oder die neueste stabile (Release) -Version aus dem Repository unter Verwendung der bereitgestellten PKGBuild -Datei zu erstellen und zu installieren (bitte beachten Sie, dass dieselben Bemerkungen zum Erstellen auf Linux gelten):
git clone <git repository url>
cd dsnote/arch/git # build latest git version
# or
cd dsnote/arch/release # build latest release version
makepkg -si
git clone <git repository url>
cd dsnote/flatpak
flatpak-builder --user --install-deps-from=flathub --repo="/path/to/local/flatpak/repo" "/path/to/output/dir" net.mkiol.SpeechNote.yaml
git clone <git repository url>
cd dsnote
mkdir build
cd build
sfdk config --session specfile=../sfos/harbour-dsnote.spec
sfdk config --session target=SailfishOS-4.4.0.58-aarch64
sfdk cmake ../ -DCMAKE_BUILD_TYPE=Release -DWITH_SFOS=ON -DWITH_PY=OFF
sfdk package
Sprachnote hat viele Abhängigkeiten für die Zeit und Laufzeit. Dies umfasst gemeinsame und statische Bibliotheken, ausführbare Drittanbieter, Python- und Perl-Skripte. Aufgrund dieser Komplexität besteht die empfohlene Möglichkeit zum Erstellen darin, die Flatpak-Toolkette (Flatpak Manifest-Datei und Flatpak-Builder) zu verwenden. Wenn Sie einen direkten Build (dh ohne Flatpak) vornehmen möchten, ist dies auch möglich, aber komplizierter.
git clone <git repository url>
cd dsnote
mkdir build
cd build
cmake ../ -DCMAKE_BUILD_TYPE=Release -DWITH_DESKTOP=ON
make
Um Python -Komponenten ohne Unterstützung zu erstellen, fügen Sie in CMake -Schritt -DWITH_PY=OFF .
Um andere Build -Optionen zu sehen, suchen Sie in der Datei CMakeList.txt nach option(BUILD_XXX) .
Alle zum Download verfügbaren Modelle sind in der Konfigurationsdatei (config/models.json) angegeben. Um ein benutzerdefiniertes Modell zu aktivieren, das mit derzeit unterstützten Motoren kompatibel ist, bearbeiten Sie diese Datei einfach und starten Sie die Anwendung neu.
Wenn Sie die Anwendung zum ersten Mal ausführen, wird die Models -Konfigurationsdatei erstellt in:
~/.local/share/net.mkiol/dsnote/models.json , oder~/.var/app/net.mkiol.SpeechNote/data/net.mkiol/dsnote/models.json (flatpak) oder~/.local/share/org.mkiol/dsnote/models.json (Sailfish OS)Sie können aktuell aktivierte Modelle frei bearbeiten oder neue hinzufügen.
Die Modelldefinition sieht so aus:
{
"name": "<model name>",
"model_id": "<model unique id>",
"engine": "<engine type>",
"lang_id": "<lang id>",
"checksum": "<md5 checksum>",
"checksum_quick": "<partial md5 checksum>",
"comp": "<compression type",
"urls": [
<model URLs>
],
"size": "<download size of all files>"
}
Erlaubte Motortypen: stt_ds , stt_vosk , stt_april , stt_whisper , stt_fasterwhisper , TTS_PIPER, tts_piper , tts_rhvoice , tts_espeak , tts_coqui , tts_mimic3 , mnt_bergamot ,
Erlaubte Kompressionstypen: none dirgz gz , xz , tarxz , targz , zip , zipall , dir
Zulässige URL -Typen: http , https , file
Überprüfungen werden für alle Dateien nach dem Auspacken berechnet. Wenn Sie ein neues Modell hinzufügen, können Sie die Befehlszeilenoption --gen-checksums verwenden, um die richtigen Überprüfungen zu finden. Geben Sie dazu leere Zeichenfolgen sowohl in checksum als auch in checksum_quick ein, speichern Sie die Datei und führen Sie die Sprachbrief mit der genannten Option aus.
Zum Beispiel:
{
"name": "New Piper Voice",
"model_id": "en_piper_new",
"engine": "tts_piper",
"lang_id": "en",
"checksum": "",
"checksum_quick": "",
"size": ""
"comp": "dir",
"urls": [
"file:///home/me/models/new-model-medium.onnx",
"file:///home/me/models/new-model-medium.onnx.json"
]
}
flatpak run net.mkiol.SpeechNote --verbose --gen-checksums
Jeder Beitrag ist sehr willkommen!
Das Projekt wird sowohl auf Github als auch auf Gitlab gehostet. Fühlen Sie sich frei, einen PR/MR zu erstellen, ein Problem zu melden oder für neue Funktionen auf der Plattform, die Sie am meisten bevorzugen.
Übersetzungsdateien im QT -Format befinden sich im translations .
Die bevorzugte Möglichkeit, die Übersetzung beizutragen, erfolgt über den Transsifex -Service. Wenn Sie jedoch eine direkte PR/MR erstellen möchten, tun Sie dies bitte.
Wenn Sie Sprachnote nützlich finden und dieses Projekt unterstützen möchten, sollten Sie ein oder zwei der folgenden Informationen erstellen:
Sprachnote beruht auf den folgenden Open -Source -Projekten:
Sprachnote ist ein Open -Source -Projekt. Der Quellcode wird unter der Mozilla Public Lizenz Version 2.0 veröffentlicht.
Bibliotheken der 3. Partei:
Die Dateien im Verzeichnis nonbreaking_prefixes wurden aus dem MosesdeDecoder -Projekt kopiert und unter der GNU Lesser allgemeine öffentliche Lizenz v2.1 verteilt.