Содержание генерации шаблона, такого как о нас, новости, художественные, название новостей, описание продукта и т. Д. Использование модели с предварительным языком GPT-3
Ключевые концепции и методы, которые являются фундаментальными для использования API OpenAI для любой задачи, включая:
API OpenAI может применяться практически к любой задаче, которая включает в себя понимание или генерирование естественного языка или кода.
GPT-3 или третье поколение генеративного предварительно обученного трансформатора, представляет собой модель машинного обучения нейронного сети, обученная с использованием данных Интернета для генерации любого типа текста. Это требует небольшого количества входного текста для создания больших объемов соответствующего и сложного машинного текста.
Нейронная сеть GPT-3-это модель с более чем 175 миллиардами параметров машинного обучения. В результате GPT-3 лучше, чем любая предыдущая модель для создания текста, который достаточно убедителен, чтобы показаться, что человек мог бы написать его.
Конечная точка completions является ядром API OpenAI и обеспечивает простой интерфейс, который чрезвычайно гибкий и мощный.
Вы вводите какой -то текст в качестве подсказки, и API вернет завершение текста, которое пытается соответствовать любым инструкциям или контексту, которые мы его дали.
Вы можете думать об этом как о очень продвинутом автозаполнении - модель обрабатывает ваш текстовый приглашение и пытается предсказать, что наиболее вероятно будет дальше. Проектирование подсказки, по сути, то, как мы «программируем» модель.
Во многих случаях это полезно показывать и рассказать модели, что вы хотите. Добавление примеров в подсказку может помочь сообщить закономерности или нюансы.
Обработка естественного языка включает в себя как один из основных компонентов естественной генерации Langauge. которые сосредоточены на создании естественного текста человека. Тем не менее, генерирование понятного содержания человека является проблемой для машин, которые на самом деле не знают сложности и нюансов языка. Используя текст в Интернете, GPT-3 обучен генерировать реалистичный человеческий текст.
GPT-3 использовался для создания статей, поэзии, историй, новостей и диалога с использованием лишь небольшого количества входного текста, который можно использовать для производства большого количества качественной копии.
GPT-3 также используется для автоматизированных разговорных задач, отвечая на любой текст, который человек вписывает в компьютер с новой частью текста, подходящего для контекста. GPT-3 может создавать что-либо со структурой текста, а не только текстом человеческого языка. Он также может автоматически генерировать текстовые суммирования и даже код программирования.
GPT-3-модель прогнозирования языка. Это означает, что у него есть модель машинного обучения нейронной сети, которая может принять входной текст в качестве ввода и преобразовать его в то, что он предсказывает, что наиболее полезный результат будет. Это достигается путем обучения системы на обширном объеме интернет -текста для определения шаблонов. Более конкретно, GPT-3 является третьей версией модели, которая сосредоточена на генерации текста, основанной на предварительном обучении на огромном объеме текста.
Есть три основные рекомендации по созданию подсказок:
Show and tell : проясните, что вы хотите, либо через инструкции, примеры, либо комбинацию двух. Если вы хотите, чтобы модель оценила список элементов в алфавитном порядке или классифицировать абзац по настроению, покажите, что вы хотите.Provide quality data : если вы пытаетесь создать классификатор или заставить модель следовать шаблону, убедитесь, что примеры достаточно. Модель обычно достаточно умна, чтобы увидеть основные ошибки правописания и дать вам ответ, но она также может предположить, что это преднамеренное, и она может повлиять на ответ.Check your settings : настройки температуры и TOP_P управляют тем, насколько детерминированная модель является генерацией ответа. prompt : подсказка для создания комплексов для, закодированных как строка, массив струн, массив жетонов или массива массива токенов. <|endoftext|> - это отдельный документ, который модель видит во время обучения, поэтому, если не указана подсказка, модель будет генерировать так, как будто с начала нового документа.engine : Text-Davinci-001 является наиболее способной моделью GPT-3. Может выполнять любую задачу, которую могут выполнять другие модели, часто с меньшим контекстом. В дополнение к ответу на быстрое, также поддерживает вставку завершений в текст.temperature : температура означает какую температуру отбора проб для использования. Более высокое значение означает, что модель будет иметь больше рисков, мы можем использовать 0,9 для более креативных приложений и 0 для тех с четко определенным ответом.max_tokens : максимальное количество токенов для генерации в комплексе. Большая часть модели имеет длину контекста 2048.top_p : альтернатива отбора проб с температурой, называемой отбором ядра. Если модель учитывает результат токенов с массой вероятности TOP_P, поэтому 0,1 означает, что только токены, содержащие 10% вероятности, рассматриваютсяfrequency_penalty : Положительные значения наказывают новые токены на основе их существующей частоты в тексте, что до сих пор уменьшает вероятность повторения одной и той же строки.presence_penalty : положительное значение наказывает новые токены на основе того, появляются ли они в тексте, увеличивая вероятность того, что модель будет говорить о новых темах. Если у вас нет pip в вашей системе, вы можете скачать его с помощью этой команды:
sudo apt-get install python3-pip
Вы можете создать виртуальную среду с Anaconda, если она есть в вашей системе, создайте VirtualEnv с командой ниже:
conda create -n yourenvname python==x.x
conda activate yourenvname
Или вы можете установить VirtualWrapper с командой ниже:
sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv
А после установки создать виртуальную среду:
cd/your/path && mkvirtualenv --python=python3 yourenvname
Установите требуемые пакеты из TEDS.TXT для запуска этого проекта:
pip install -r requirements.txt
Запустить этот проект наиболее важным - иметь секретный ключ API от OpenaI, который позволяет модели генерировать содержимое. Если у вас есть секретный ключ API, вы должны установить его как переменную среды под названием OPENAI_API_KEY и прочитать его с помощью пакета python-dotenv .