Pyrougeは、ルージュ要約評価パッケージのPythonラッパーです。ルージュを動作させるには、かなりの時間が必要です。 Pyrougeは、Rougeが理解し、Rouge構成ファイルを自動的に生成する形式に概要を自動的に変換することにより、ルージュスコアを簡単にするように設計されています。
このようなプレーンテキストの要約を評価できます。
Pyrouge Import Rouge155から r = rouge155() r.system_dir = 'path/to/system_summaries' r.model_dir = 'path/to/model_summaries' r.system_filename_pattern = 'some_name。( d+)。txt' r.model_filename_pattern = 'some_name。[az]。#id#.txt' output = r.convert_and_evaluate() 印刷(出力) output_dict = r.output_to_dict(output)
要約を評価するために、ルージュはあなたの要約とゴールドスタンダードの要約がどこにあるか、そしてそれらをどのように一致させるかを知る必要があります。 Rouge Parlanceでは、要約は「システム」の要約であり、ゴールドスタンダードの概要は「モデル」の概要です。概要は、 system_dirとmodel_dir変数でパスが設定されている別々のフォルダーにある必要があります。すべての概要には、1行ごとに1つの文を含める必要があります。
システムの概要を対応するモデルの要約と自動的に一致させるために、Pyrougeは正規表現を使用します。たとえば、システムの要約は、固定名とこのような可変数値IDの組み合わせで名前が付けられていると仮定しましょう。
このようなモデルの要約。特定のドキュメントの複数のモデルの概要を識別する大文字で:
system_filename_patternのグループは、Pyrougeに、ファイル名のどの部分がIDであるか(この場合(d+)に伝えます。グループを示すために丸いブラケットを使用する必要があります。そうしないと、PyrougeはFilenameの残りの部分からIDを区別できません。 PyrougeはそのIDを使用して、すべてのマッチングモデルの概要を見つけます。 Special Placeholder #ID#は、 model_filename_patternのIDがどこに期待されるかをPyrougeに伝えます。 [AZ]パーツは、そのIDの複数のモデルの概要と一致します。
構成が完了すると、 convert_and_evaluate()を呼び出すことで、ルージュスコアを文字列として取得します。スコアをさらに処理する場合は、出力をoutput_to_dict(output)でdictに解析できます。
プレーンテキストの概要をルージュが理解している形式に変換するには、次のことを行います。
Pyrouge Import Rouge155から rouge155.convert_summaries_to_rouge_format(system_input_dir、system_output_dir) rouge155.convert_summaries_to_rouge_format(model_input_dir、model_output_dir)
これにより、 system_input_dirとmodel_input_dirのすべての要約を変換し、それぞれの出力ディレクトリに保存します。
Rougeがシステムとモデルの概要を一致させるために使用する構成ファイルを生成するには、次のことを行います。
Pyrouge Import Rouge155から
rouge155.write_config_static(
System_dir、system_filename_pattern、
model_dir、model_filename_pattern、
config_file_path)
最初の4つの引数を上記で説明します。 config_file_path構成ファイルを保存する場所を指定します。
PythonとPyrougeモジュールよりもコマンドラインを好む場合は、自動的にインストールされ、システムのどこからでも実行可能な次のスクリプトを使用できます。
pyrouge_evaluate_plain_text_files -s systems_plain/ -sfp "some_name。( d+)。txt" -m models_plain/ -mfp some_name。[az]。#id#.txt
sample-test/SL2003データの使用例:pyrouge_evaluate_rouge_format_files -s systems -sfp "sl.p.10.r.11.sl062003-( d+)。html" -m models -mfp sl.p.10.r. [az] .sl062003-#id#.html
システムファイル名パターンは、特殊文字が含まれているため、引用符で囲まれていることに注意してください。
pyrouge_convert_plain_text_to_rouge_format -i models_plain/ -o models_rouge
pyrouge_write_config_file -s Systems -SFP "sl.P.10.R.11.sl062003-( d+)。html" -m Models -MFP SL.P.10.R. [AZ] .SL062003-#ID#.HTML -C SL2003_CONFIG.XML
-hオプションでこれらのいずれかを実行すると、さまざまなコマンドラインオプションを説明する使用法メッセージが表示されます。
ルージュのインストールに関する指示はこちらにあります。
システムによっては、次のコマンドをルートとして実行する必要がある場合があります。
Pyrougeをインストールするには、実行してください。
PIPインストールPyrouge
WindowsにPyrougeをインストールするのに問題がある場合は、Franck Dernoncourtのこのガイドを確認してください。
作業用ルージュ-1.5.5を仮定します。インストール、このコマンドでルージュパスをPyrugeに伝えます。
pyrouge_set_rouge_path/absolute/path/to/rouge-1.5.5/directory
このスクリプトを使用してルージュパスを保存すると、システムで機能しない場合は、実行時にルージュパスを供給することもできます。
r = rouge155( '/absolute/path/to/rouge-1.5.5/directory')
すべてが正しくインストールされているかどうかをテストするには、実行してください。
python -m pyrouge.test
すべてが機能する場合は、次のようなものを見る必要があります。
18.055Sで10回のテストを実行しました わかりました
Pyrougeをアンインストールしたい場合:
ピップアンインストールピロージ