markov_text
1.0.0
markov_text高次マルコフチェーンに基づくテキストジェネレーターcmake -B buildを実行しますcmake --build buildを実行します./build/markov_text -h write for help。
以下に使用する例を以下に示します。ここで、最初に建設コマンドが完了します。
./build/markov_text -c corpus -O 3 -o out大きなテキストファイルcorpusに基づいて注文3マルコフチェーンを構築し、4つのファイルとしてoutします。 -O 3 (注文3 )および-o out (出力ファイルパスout )がデフォルトであり、省略できます。したがって、 ./build/markov_text -c corpusを呼び出すことは、上記のコマンドと同等になります。
次に、テキストを生成するには、実行します。
./build/markov_text -g out -s 100これは、 outから始まるファイルに保存されているチェーンに基づいて、最大100トークンを生成します。値-s 100 (最大100トークンで生成)はデフォルト値であり、省略できることに注意してください。したがって、 ./build/markov_text -g out呼び出すことは、上記のコマンドと同等です。
Nトークンの生成の理由は、マルコフ連鎖に次の状態がない場合、テキスト生成プロセスが終了するためです。これは、トークンの現在のシーケンスが、入力テキストファイルの最後に表示される一意のシーケンスである場合に発生する可能性があります。これは、 Kユニークなトークンを作成してからN < Kトークンを生成するときにファイルを作成することで生成できます。この場合、せいぜいKトークンが生産されます。 貢献とフィードバックは大歓迎です!