OpenPrompt скачать - загрузка исходного кода OpenPrompt

OpenPrompt

Другой исходный код

v1.0.0

Скачать

Рамка с открытым исходным кодом для быстрого обучения.

Обзор • Установка • Как использовать • Документы • Бумага • Цитирование • Производительность •

Что нового?

❗ Апрель 2023 г.: $ color {red} { normalsize { textbf {хочу построить свой чат ai?}}} $ Мы выпускаем Ultrachat, используем OpenPrompt и Ultrachat для проведения контролируемой настройки инструкций, см ./tutorial/9_UltraChat.py .
Август 2022: Благодаря участнику Zhiyongliu1114, OpenPrompt теперь поддерживает Ernie 1.0 в PaddlePaddle.
Июль 2022 года: OpenPrompt поддерживает OPT сейчас.
Июнь 2022 года: OpenPrompt выигрывает ACL 2022 Best Demo Paper Award.
Март 2022: Мы добавляем учебник в качестве ответа на выпуск 124, который использует настраиваемый tokenizer_wrapper для выполнения задач, которые не находятся в конфигурации OpenPrompt по умолчанию (например, модель Bert Tokenizer+T5).
Февраль 2022 года. Проверьте нашу сестру Repo Opendelta!
Декабрь 2021: pip install openprompt
Декабрь 2021: производительность суперклейки добавлена
Декабрь 2021: Мы поддерживаем парадигму генерации для всех задач , добавив новый вербайзер: Generationverbalizer и учебник: 4.1_all_tasks_are_generation.py
Ноябрь 2021 года. Теперь мы выпустили бумагу OpenPrompt: рамка с открытым исходным кодом для быстрого обучения.
Ноябрь 2021 г. Префикстун поддерживает T5 сейчас.
Ноябрь 2021 года. Мы внесли несколько серьезных изменений из последней версии, где вновь введен гибкий язык шаблонов! Часть документов устарела, и мы скоро это исправим.

Обзор

Обратное обучение -это последняя парадигма для адаптации предварительно обученных языковых моделей (PLMS) к нижним задачам NLP, которая изменяет входной текст с помощью текстового шаблона и непосредственно использует PLM для выполнения предварительно обученных задач. Эта библиотека обеспечивает стандартную, гибкую и расширяемую структуру для развертывания трубопровода по быстрому обучению. OpenPrompt поддерживает загрузку PLM непосредственно от трансформаторов HuggingFace. В будущем мы также будем поддерживать PLMS, реализованные другими библиотеками. Для получения дополнительных ресурсов о быстрой обучении, пожалуйста, проверьте наш список бумаги.

Что вы можете сделать через OpenPrompt?

демо

Используйте реализации текущих подходов к быстрому обучению.* Мы реализовали различные методы подсказования, включая стратегии шаблона, вербализации и оптимизации в соответствии с единым стандартом. Вы можете легко позвонить и понять эти методы.
Создайте свою собственную работу по быстрому обучению. С расширением OpenPrompt вы можете быстро попрактиковаться в своих быстро обучающихся идеях.

Установка

Примечание. Пожалуйста, используйте Python 3.8+ для OpenPrompt

Использование PIP

Наш репо протестирован на Python 3.8+ и Pytorch 1.8.1+ , установите OpenPrompt, используя PIP следующим образом:

pip install openprompt

Чтобы играть с последними функциями, вы также можете установить OpenPrompt из источника.

Используя git

Клонировать репозиторий от GitHub:

git clone https://github.com/thunlp/OpenPrompt.git
cd OpenPrompt
pip install -r requirements.txt
python setup.py install

Изменить код

 python setup.py develop

Используйте OpenPrompt

Базовые концепции

Объект PromptModel содержит PLM , (или (или множественную) Template и (или множественный) Verbalizer , где класс Template определяется для обертывания исходного ввода шаблонами, а класс Verbalizer - это создание проекции между метками и целевыми словами в текущем словаре. И объект PromptModel практически участвует в обучении и выводе.

Введение по простому примеру

Благодаря модульности и гибкости OpenPrompt вы можете легко разработать процесс быстрого обучения.

Шаг 1: Определите задачу

Первым шагом является определение текущей задачи NLP, подумайте о том, как выглядят ваши данные и что вы хотите от данных! То есть сущность этого шага состоит в том, чтобы определить classes и InputExample задачи. Для простоты мы используем анализ настроений в качестве примера. Tutorial_task.

 from openprompt . data_utils import InputExample
classes = [ # There are two classes in Sentiment Analysis, one for negative and one for positive
    "negative" ,
    "positive"
]
dataset = [ # For simplicity, there's only two examples
    # text_a is the input text of the data, some other datasets may have multiple input sentences in one example.
    InputExample (
        guid = 0 ,
        text_a = "Albert Einstein was one of the greatest intellects of his time." ,
    ),
    InputExample (
        guid = 1 ,
        text_a = "The film was badly made." ,
    ),
]

Шаг 2: Определите предварительно обученные языковые модели (PLMS) как основу.

Выберите PLM, чтобы поддержать вашу задачу. Различные модели имеют разные атрибуты, мы поощряем вас использовать OpenPrompt для изучения потенциала различных PLMS. OpenPrompt совместим с моделями на HuggingFace.

 from openprompt . plms import load_plm
plm , tokenizer , model_config , WrapperClass = load_plm ( "bert" , "bert-base-cased" )

Шаг 3: Определите шаблон.

Template -это модификатор исходного входного текста, который также является одним из наиболее важных модулей в быстрого обучении. Мы определили text_a на шаге 1.

 from openprompt . prompts import ManualTemplate
promptTemplate = ManualTemplate (
    text = '{"placeholder":"text_a"} It was {"mask"}' ,
    tokenizer = tokenizer ,
)

Шаг 4: Определите вербализатор

Verbalizer является еще одним важным (но не необходимым) в быстром обучении, какое проектирует исходные этикетки (мы определили их как classes , помните?) На набор слов метки. Вот пример, который мы проецируем negative класс на слово «плохо» и продемонстрируем positive класс для слов хорошего, замечательного, великолепного.

 from openprompt . prompts import ManualVerbalizer
promptVerbalizer = ManualVerbalizer (
    classes = classes ,
    label_words = {
        "negative" : [ "bad" ],
        "positive" : [ "good" , "wonderful" , "great" ],
    },
    tokenizer = tokenizer ,
)

Шаг 5: Объедините их в приглашенную модель

Учитывая задачу, теперь у нас есть PLM , Template и Verbalizer , мы комбинируем их в PromptModel . Обратите внимание, что, хотя пример наивно объединяет три модуля, вы можете фактически определить некоторые сложные взаимодействия между ними.

 from openprompt import PromptForClassification
promptModel = PromptForClassification (
    template = promptTemplate ,
    plm = plm ,
    verbalizer = promptVerbalizer ,
)

Шаг 6: Определите DataLoader

PromptDataLoader - это в основном оперативная версия DataLoader Pytorch, которая также включает в себя Tokenizer , Template и TokenizerWrapper .

 from openprompt import PromptDataLoader
data_loader = PromptDataLoader (
    dataset = dataset ,
    tokenizer = tokenizer ,
    template = promptTemplate ,
    tokenizer_wrapper_class = WrapperClass ,
)

Шаг 7: Поезд и вывод

Сделанный! Мы можем проводить обучение и вывод, как и другие процессы в Pytorch.

 import torch

# making zero-shot inference using pretrained MLM with prompt
promptModel . eval ()
with torch . no_grad ():
    for batch in data_loader :
        logits = promptModel ( batch )
        preds = torch . argmax ( logits , dim = - 1 )
        print ( classes [ preds ])
# predictions would be 1, 0 for classes 'positive', 'negative'

Пожалуйста, обратитесь к нашим учебным сценариям и документации для более подробной информации.

Наборы данных

Мы предоставляем серию загрузочных сценариев в dataset/ папке, не стесняемся использовать их для загрузки тестов.

Отчет о производительности

Существует слишком много возможных комбинаций, основанных на OpenPrompt. Мы стараемся как можно скорее проверить производительность различных методов. Производительность будет постоянно обновляться в таблицах. Мы также призываем пользователей найти лучшие гиперпараметры для своих собственных задач и сообщать о результатах, сделав запрос на вытяжение.

Известные проблемы

Основное улучшение/улучшение в будущем.

Мы внесли некоторые серьезные изменения из последней версии, поэтому часть документов устарела. Мы скоро это исправим.

Цитирование

Пожалуйста, процитируйте нашу газету, если вы используете OpenPrompt в своей работе

 @article { ding2021openprompt ,
  title = { OpenPrompt: An Open-source Framework for Prompt-learning } ,
  author = { Ding, Ning and Hu, Shengding and Zhao, Weilin and Chen, Yulin and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong } ,
  journal = { arXiv preprint arXiv:2111.01998 } ,
  year = { 2021 }
}

Участники

Мы благодарим всех участников этого проекта, приветствуются больше участников!

Расширять

Дополнительная информация

Версия v1.0.0
Тип Другой исходный код
Время обновления 2025-02-28
размер 2.51MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

OpenPrompt

Что нового?

Обзор

Что вы можете сделать через OpenPrompt?

Установка

Использование PIP

Используя git

Используйте OpenPrompt

Базовые концепции

Введение по простому примеру

Шаг 1: Определите задачу

Шаг 2: Определите предварительно обученные языковые модели (PLMS) как основу.

Шаг 3: Определите шаблон.

Шаг 4: Определите вербализатор

Шаг 5: Объедините их в приглашенную модель

Шаг 6: Определите DataLoader

Шаг 7: Поезд и вывод

Наборы данных

Отчет о производительности

Известные проблемы

Цитирование

Участники

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf