Es analysiert japanische Sätze und generiert vollständige Kontextbezeichnungen.
Dies ist ein Umschreiben des Vorverarbeitungsteils von OpenJtalk (außer HTS -Motor) mit Rost.
Es ist die Hauptschnittstelle. Es ist ein Wrapper für Lindera, JProprocess-NJD, JProprocess-Jpcommon und mehr. Die Wörter im Analyseergebnis werden in der von JProprocess-Core definierten Datenstruktur aufbewahrt.
Beispiel:
use jpreprocess :: * ;
let config = JPreprocessConfig {
dictionary : SystemDictionaryConfig :: File ( path ) ,
user_dictionary : None ,
} ;
let jpreprocess = JPreprocess :: from_config ( config ) ? ;
let jpcommon_label = jpreprocess
. extract_fullcontext ( "日本語文を解析し、音声合成エンジンに渡せる形式に変換します." ) ? ;
assert_eq ! (
jpcommon_label [ 2 ] . to_string ( ) ,
concat! (
"sil^n-i+h=o" ,
"/A:-3+1+7" ,
"/B:xx-xx_xx" ,
"/C:02_xx+xx" ,
"/D:02+xx_xx" ,
"/E:xx_xx!xx_xx-xx" ,
"/F:7_4#0_xx@1_3|1_12" ,
"/G:4_4%0_xx_1" ,
"/H:xx_xx" ,
"/I:3-12@1+2&1-8|1+41" ,
"/J:5_29" ,
"/K:2+8-41"
)
) ; Es enthält Datenstrukturen wie Aussprache, Wörter, Teile der Sprache, JPCommon und andere verwandte Funktionen und Strukturen, die Fehler darstellen. pos ist ein Akronym für einen Teil der Sprache und repräsentiert "Teil der Sprache".
Lädt das von JProprocess-Dictionary-Builder generierte Wort Dictionary in das Gedächtnis, sodass Wörter durchsucht werden können.
Zu diesem Zeitpunkt wird das Wörterbuchformat automatisch ermittelt.
Das ursprüngliche Wörterbuch befindet sich im selben CSV -Format wie Mecab, aber Sie müssen im Voraus ein dediziertes Wörterbuch erzeugen, damit es mit Lindera mit hoher Geschwindigkeit analysiert werden kann.
Es basiert auf Linkera-Ipadic-Builder von Lindera, aber JProprocess-Dictionary-Builder analysiert auch Strings im Voraus und kann ein Wörterbuch (JProprocess Dictionary) generieren, das direkt mit JProprocess verarbeitet werden kann.
Generieren Sie ein Wörterbuch für JProprocess unter Verwendung des Wörterbuchs, das mit OpenJtalk versendet wurde. Wird für naist-jdic Merkmale von JProprocess Crate verwendet.
Beachten Sie, dass der Bau einige Minuten dauert, wenn Sie naist-jdic -Funktion aktivieren und diese Kiste einschließen.
Es definiert die Struktur von NJDNode und NJD in OpenJtalk und führt die Konversionsverarbeitung für NJD durch.
Insbesondere wandelt es das Lesen von Zahlen (z. B. "10,120" in "Ichiman Hyakuniju") um und schätzt die Akzentposition.
Es definiert die Struktur von JPCommonLabel in OpenJtalk und wandelt sie von NJD in JPCommon und dann in JPCommon in vollständige Kontextbezeichnungen um.
Implementieren Sie ein veränderliches Fenster, das im Conversionsprozess von JProprocess-NJD verwendet wird.
Diese Software enthält Quellcode von:
Obwohl dieses Repository die Codewesendatei enthält, bedeutet dies nicht unbedingt, dass die in der Codekerndatei aufgeführten Entwickler über das Urheberrecht für alle Dateien in diesem Repository verfügen. Urheberrechte sind in Bekanntmachung oder Lizenzdateien aufgeführt, und die Code -Incorers -Datei dient nur zur Überprüfung des Codes.
BSD-3-Klausel