markov_text - Текстовый генератор на основе цепочек марковских средств высшего порядка cmake -B buildcmake --build build Написать ./build/markov_text -h для помощи.
Пример использования приведен ниже, где сначала выполняется строительная команда:
./build/markov_text -c corpus -O 3 -o out который будет построить цепочку Markov Order- 3 на основе большого текстового corpus и сохранить его в виде четырех файлов, начиная с out . Обратите внимание, что -O 3 (порядка 3 ) и -o out ( out путь из файла) являются по умолчанию и могут быть опущены. Таким образом, вызов ./build/markov_text -c corpus будет эквивалентно команде выше.
Затем, чтобы генерировать текст, запустите:
./build/markov_text -g out -s 100 который будет генерировать не более 100 токенов на основе цепочки, которая хранится в файлах, начиная с out . Обратите внимание, что значение -s 100 (генерировать не более 100 токенов) является значением по умолчанию и может быть опущено. Таким образом, вызов ./build/markov_text -g out эквивалентен команде выше.
N «максимум» является то, что если цепочка Маркова не имеет следующего состояния, то процесс генерации текста заканчивается. Это может произойти, когда текущая последовательность токенов - это уникальная последовательность, которая появляется в конце входного текстового файла. Это можно создать, чтобы создать файл, когда K уникальные токены, а затем генерируют токены N < K . В этом случае будут производиться максимум K токенов. Вклад и обратная связь более чем приветствуются!