Этот проект содержит базовый код, запутанное код и сценарии автоматизации, используемые для тестирования моделей языка для интерпретации запутанного кода. Это было создано для контура проекта в Language Models and Obfuscated Code расположенном в каталоге Academic_Work . Бумага поможет уточнить, что большинство из этого делает, потому что этот Ридме довольно грубый.
Создайте рабочую книгу, в которой будут храниться ваши результаты.
Запустите сценарий codeLoader.py из основного каталога, используя команду python Automation/codeLoader.py .
root_dir_workbook , где хранится ваша книга.current_workbook на имя рабочей книги, которую вы создали на первом этапе. Теперь у вас должна быть рабочая тетрадь с двумя наборами листов. Те, которые называются B1 , B2 , ... и листы, которые называются O1 , O2 , .... у каждого листы должны иметь линию заголовка и запутанный код. Листы, названные B# должны содержать все запутывание для этого данного базового кода. Листы, названные O# должны содержать все запутывание такого типа.
Уже есть 3 шаблона вопросов по умолчанию в папке Automation/Question_Templates . Вопросы 1 и 2 будут вставить базовый код и запутанное код до и после AND в файле. Вопрос 3 использует только запутывание. Чтобы добавить новый вопрос, создайте файл в папке шаблона вопросов и создайте копию файла questionLoader_Q1.py и отредактируйте его, чтобы следовать формату вопроса нового вопроса. Единственные серьезные изменения в необходимом файле: правильно вставить код в новый вопрос, когда создается строка вопроса, и столбцы в Excel, в которую вставлена информация. Переменная question_number должна быть изменена на новый номер вопроса. question_column диктуют, где вопрос вставлен в таблицу. answer_column диктует, куда положил ответ. Файл codeLoader.py также должен быть отредактирован, чтобы получить раскрытие рейтинга правильной оценки для нового вопроса. Template таблицу также необходимо отредактировать, чтобы добавить заголовки для нового вопроса.
API-интерфейсы Three Language Model Model, которые уже настроены,-это CHATGPT 3.5 OpenAI, AI21 Studio Jurassic-2 и Google Palm. Файлы, содержащие вызовы API, находятся в каталоге Automation . Чтобы добавить еще одну языковую модель, просто создайте файл, содержащий метод с именем askQuestion , который рассматривает вопрос в качестве строки.
Необходимо создать Automation/key.py , чтобы удерживать ключи API.
После того, как сценарий codeLoader.py был запущен. Выберите вопрос для запуска из файлов с именем questionLoader_Q#.py .
root_dir_workbook на тот же каталог, который использовался в codeLoader.pycurrent_workbook на ранее созданную рабочую книгу.LM на имя LM, который вы хотите использовать.Automation , используя команду python questionLoader_Q1.pyNONE на вопросы. Это ошибка с API и нашими вопросами, которые не были рассмотрены. Папка Compiled_Code и файлы C_codeLoader.py и C_questionLoader_Q#.py предназначены для будущих направлений в этом исследовании. Папка Compiled_Code содержит версию сборки всего запутанного кода, созданную с использованием https://godbolt.org/. Файлы C_ представляют собой измененные версии обычных сценариев, созданных для работы с составленным кодом. Примечание. Если вы запустили вопросы с составленным кодом, размер токена во многих случаях слишком велик из -за длины кода сборки.
Вероятно, есть другие случайные файлы, но большинство файлов должны быть функциональными.
Это было протестировано только на Windows 10 на одном компьютере. Если он работает на моем компьютере, я уверен, что он будет работать на вашем. Единственное дополнительное необходимое программное обеспечение - Excel.
openpyxl используется в этом проекте для форматирования данных в электронных таблицах Excel. Библиотека должна быть доступна через PIP.