Он анализирует японские предложения и генерирует полные контекстные этикетки.
Это переписывание предварительной обработки части OpenJtalk (кроме двигателя HTS) с использованием ржавчины.
Это основной интерфейс. Это обертка для Lindera, Jpreprocess-NJD, JPreProcess-JpCommon и многое другое. Слова в результате анализа хранятся в структуре данных, определенной JPREProcess-Core.
пример:
use jpreprocess :: * ;
let config = JPreprocessConfig {
dictionary : SystemDictionaryConfig :: File ( path ) ,
user_dictionary : None ,
} ;
let jpreprocess = JPreprocess :: from_config ( config ) ? ;
let jpcommon_label = jpreprocess
. extract_fullcontext ( "日本語文を解析し、音声合成エンジンに渡せる形式に変換します." ) ? ;
assert_eq ! (
jpcommon_label [ 2 ] . to_string ( ) ,
concat! (
"sil^n-i+h=o" ,
"/A:-3+1+7" ,
"/B:xx-xx_xx" ,
"/C:02_xx+xx" ,
"/D:02+xx_xx" ,
"/E:xx_xx!xx_xx-xx" ,
"/F:7_4#0_xx@1_3|1_12" ,
"/G:4_4%0_xx_1" ,
"/H:xx_xx" ,
"/I:3-12@1+2&1-8|1+41" ,
"/J:5_29" ,
"/K:2+8-41"
)
) ; Он включает в себя структуры данных, такие как произношение, слова, части речи, JPCommon и другие связанные функции и структуры, которые представляют ошибки. pos является аббревиатурой для части речи и представляет «часть речи».
Загружает словарь слова, сгенерированного JPREPROCESS-Dictionary-Builder, в память, позволяя искать слова.
В настоящее время формат словаря будет автоматически определен.
Первоначальный словарь находится в том же формате CSV, что и Mecab, но вам необходимо заранее генерировать выделенный словарь, чтобы его можно было проанализировать на высокой скорости с Lindera.
Он создан на основе Lindera-Ipadic-Builder, но JPREPROCESS-Dictionary-Builder также планирует строки заранее и может генерировать словарь (словарь JPREPROCESS), который может обрабатывать непосредственно с JPREPOCESS.
Создайте словарь для jpreprocess, используя словарь, который был отправлен с OpenJtalk. Используется для naist-jdic функции JPREPROCESS CRATE.
Обратите внимание, что если вы включите функцию naist-jdic и включите этот ящик, на его строительство потребуется несколько минут.
Он определяет структуру NJDNode и NJD в OpenJTalk и выполняет обработку преобразования для NJD.
В частности, он преобразует чтение чисел (например, «10,120» в «Ичиман Хьякуниджу») и оценивает позицию акцента.
Он определяет структуру jpcommonlabel в OpenJtalk и преобразует ее из NJD в JPCommon, а затем JPCommon в полные контекстные этикетки.
Реализуйте изменчивое окно, используемое в процессе преобразования JPREPOCESS-NJD.
Это программное обеспечение включает исходный код из:
Хотя этот репозиторий имеет файл кодов, он не обязательно означает, что разработчики, перечисленные в файле CodeOwners, имеют авторское право на все файлы в этом хранилище. Авторские права перечислены в файлах уведомления или лицензии, а файл CodeOwners предназначен только для просмотра кода.
BSD-3-CLAUSE