Pyrouge - это обертка Python для пакета оценки суммирования Rouge. Получение работы Rouge может потребовать довольно много времени. Pyrouge предназначен для облегчения получения баллов Rouge путем автоматического преобразования ваших резюме в формат Rouge понимает, и автоматически генерируя файл конфигурации Rouge.
Вы можете оценить свои краткие текстовые резюме, например:
от Pyrouge Import Rouge155 r = rouge155 () r.system_dir = 'path/to/system_summary' r.model_dir = 'path/to/model_summary' r.system_filename_pattern = 'some_name. ( d+). txt' r.model_filename_pattern = 'some_name. [az].#id#.txt' output = r.convert_and_evaluate () Печать (вывод) output_dict = r.output_to_dict (output)
Чтобы оценить резюме, Руж должен знать, где находятся ваши резюме и резюме золотого стандарта, и как их соответствовать. На Rouge Plarclance ваши резюме - это резюме «Систем», а резюме золота - это резюме «модели». Резюме должны быть в отдельных папках, чьи пути установлены с переменными system_dir и model_dir . Все резюме должны содержать одно предложение на строку.
Чтобы автоматически соответствовать резюме системы с соответствующими резюме модели, Pyrouge использует регулярные выражения. Например, давайте предположим, что ваши резюме системы названы с помощью комбинации фиксированного имени и переменного числового идентификатора, как это:
и резюме модели, подобные этой, с прописными буквами, идентифицирующими многочисленные резюме модели для данного документа:
Группа в system_filename_pattern сообщает Pyrouge, какая часть файла является идентификатором - в данном случае (d+) . Вы должны использовать круглые кронштейны, чтобы указать группу, иначе Pyrouge не сможет отличить идентификатор от остальной части имени файла. Затем Pyrouge использует этот идентификатор, чтобы найти все сводные резюме модели. Специальный заполнитель #ID# рассказывает Pyrouge, где он должен ожидать идентификатора в model_filename_pattern . Часть [AZ] соответствует нескольким модельным резюме для этого идентификатора.
С помощью выполненной конфигурации вызов convert_and_evaluate() дает вам оценки Rouge в качестве строки. Если вы хотите еще больше обработать оценки, вы можете проанализировать вывод в DICT с помощью output_to_dict(output) .
Чтобы преобразовать краткие текстовые резюме в формат Rouge понимает, сделайте:
от Pyrouge Import Rouge155 Rouge155.convert_summary_to_rouge_format (system_input_dir, system_output_dir) Rouge155.convert_summary_to_rouge_format (model_input_dir, model_output_dir)
Это преобразует все резюме в system_input_dir и model_input_dir и сохранит их в их соответствующих выходных каталогах.
Чтобы сгенерировать файл конфигурации, который Rouge использует для сопоставления резюме системы и моделей, Do:
от Pyrouge Import Rouge155
Rouge155.write_config_static (
System_dir, system_filename_pattern,
model_dir, model_filename_pattern,
config_file_path)
Первые четыре аргумента объяснены выше. config_file_path указывает, где сохранить файл конфигурации.
Если вы предпочитаете командную строку Python и модуль Pyrouge, вы можете использовать следующие сценарии, которые автоматически устанавливаются и должны выполняться из любой точки вашей системы:
pyrouge_evaluate_plain_text_files -s systems_plain/ -sfp "some_name. ( d+). txt" -m models_plain/ -mfp some_name. [az].#id#.txt
sample-test/SL2003 , которые поставляются с Rouge:pyrouge_evaluate_rouge_format_files -s Systems -sfp "Sl.p.10.r.11.sl062003 -( d+). Html" -m Models -mfp sl.p.10.r. [az] .sl062003-
Обратите внимание, что шаблон имени системы системы заключается в кавычках, потому что он содержит специальные символы.
pyrouge_convert_plain_text_to_rouge_format -i models_plain/ -o models_rouge
pyrouge_write_config_file -s Systems -sfp "sl.p.10.r.11.sl062003 -( d+). Html" -m Модели -mfp sl.p.10.r. [az] .sl062003-#id#.html -c sl2003_config.xml
Запуск любого из них с помощью опции -h отобразит сообщение об использовании, объясняющее различные параметры командной строки.
Инструкции по установке Rouge можно найти здесь.
В зависимости от вашей системы, вам, возможно, придется запустить следующие команды как root.
Чтобы установить Pyrouge, запустите:
PIP установить Pyrouge
Если у вас возникли проблемы с установкой Pyrouge на Windows, пожалуйста, проверьте это руководство Франком Дернонкуртом.
Предполагая рабочую Rouge-1.5.5. Установка, расскажите о пути Rouge с этой командой:
pyrouge_set_rouge_path /bsolute/path/to/rouge-1.5.5/directory
Если сохранение пути Rouge с помощью этого скрипта не работает на вашей системе, вы также можете поставить путь Rouge во время выполнения:
r = rouge155 ('/absolute/path/to/rouge-1.5.5/каталог')
Чтобы проверить, правильно ли установлено, запустите:
Python -m Pyrouge.test
Если все работает, вы должны увидеть что -то вроде:
Пробежал 10 тестов в 18.055 ХОРОШО
Если вы хотите удалить Pyrouge:
PIP удалить Pyrouge