Template_Content_Generator загрузка - Template_Content_Generator исходный код скачать

Template_Content_Generator

AI Исходный код

1.0.0

Скачать

template_content_generator

Содержание генерации шаблона, такого как о нас, новости, художественные, название новостей, описание продукта и т. Д. Использование модели с предварительным языком GPT-3

Ключевые концепции и методы, которые являются фундаментальными для использования API OpenAI для любой задачи, включая:

Содержание генерации
Суммирование
Классификация, категоризация и анализ настроений
Извлечение данных
Перевод и т. Д.

Введение

API OpenAI может применяться практически к любой задаче, которая включает в себя понимание или генерирование естественного языка или кода.

GPT-3 или третье поколение генеративного предварительно обученного трансформатора, представляет собой модель машинного обучения нейронного сети, обученная с использованием данных Интернета для генерации любого типа текста. Это требует небольшого количества входного текста для создания больших объемов соответствующего и сложного машинного текста.

Нейронная сеть GPT-3-это модель с более чем 175 миллиардами параметров машинного обучения. В результате GPT-3 лучше, чем любая предыдущая модель для создания текста, который достаточно убедителен, чтобы показаться, что человек мог бы написать его.

Конечная точка completions является ядром API OpenAI и обеспечивает простой интерфейс, который чрезвычайно гибкий и мощный.
Вы вводите какой -то текст в качестве подсказки, и API вернет завершение текста, которое пытается соответствовать любым инструкциям или контексту, которые мы его дали.
Вы можете думать об этом как о очень продвинутом автозаполнении - модель обрабатывает ваш текстовый приглашение и пытается предсказать, что наиболее вероятно будет дальше. Проектирование подсказки, по сути, то, как мы «программируем» модель.
Во многих случаях это полезно показывать и рассказать модели, что вы хотите. Добавление примеров в подсказку может помочь сообщить закономерности или нюансы.

Что может сделать GPT-3?

Обработка естественного языка включает в себя как один из основных компонентов естественной генерации Langauge. которые сосредоточены на создании естественного текста человека. Тем не менее, генерирование понятного содержания человека является проблемой для машин, которые на самом деле не знают сложности и нюансов языка. Используя текст в Интернете, GPT-3 обучен генерировать реалистичный человеческий текст.

GPT-3 использовался для создания статей, поэзии, историй, новостей и диалога с использованием лишь небольшого количества входного текста, который можно использовать для производства большого количества качественной копии.

GPT-3 также используется для автоматизированных разговорных задач, отвечая на любой текст, который человек вписывает в компьютер с новой частью текста, подходящего для контекста. GPT-3 может создавать что-либо со структурой текста, а не только текстом человеческого языка. Он также может автоматически генерировать текстовые суммирования и даже код программирования.

Как работает GPT-3?

GPT-3-модель прогнозирования языка. Это означает, что у него есть модель машинного обучения нейронной сети, которая может принять входной текст в качестве ввода и преобразовать его в то, что он предсказывает, что наиболее полезный результат будет. Это достигается путем обучения системы на обширном объеме интернет -текста для определения шаблонов. Более конкретно, GPT-3 является третьей версией модели, которая сосредоточена на генерации текста, основанной на предварительном обучении на огромном объеме текста.

Быстрый дизайн

Есть три основные рекомендации по созданию подсказок:

Show and tell : проясните, что вы хотите, либо через инструкции, примеры, либо комбинацию двух. Если вы хотите, чтобы модель оценила список элементов в алфавитном порядке или классифицировать абзац по настроению, покажите, что вы хотите.
Provide quality data : если вы пытаетесь создать классификатор или заставить модель следовать шаблону, убедитесь, что примеры достаточно. Модель обычно достаточно умна, чтобы увидеть основные ошибки правописания и дать вам ответ, но она также может предположить, что это преднамеренное, и она может повлиять на ответ.
Check your settings : настройки температуры и TOP_P управляют тем, насколько детерминированная модель является генерацией ответа.

Модель запроса корпуса

prompt : подсказка для создания комплексов для, закодированных как строка, массив струн, массив жетонов или массива массива токенов. <|endoftext|> - это отдельный документ, который модель видит во время обучения, поэтому, если не указана подсказка, модель будет генерировать так, как будто с начала нового документа.
engine : Text-Davinci-001 является наиболее способной моделью GPT-3. Может выполнять любую задачу, которую могут выполнять другие модели, часто с меньшим контекстом. В дополнение к ответу на быстрое, также поддерживает вставку завершений в текст.
temperature : температура означает какую температуру отбора проб для использования. Более высокое значение означает, что модель будет иметь больше рисков, мы можем использовать 0,9 для более креативных приложений и 0 для тех с четко определенным ответом.
Помните, что модель предсказывает, какой текст, скорее всего, будет следовать по тексте, предшествующему ему. Температура - это значение от 0 до 1, которое по сути позволяет вам контролировать, насколько уверенной должна быть модель при создании этих прогнозов. Понижение температуры означает, что это потребует меньше рисков, а завершения будут более точными и детерминированными. Повышение температуры приведет к более разнообразным завершениям.
max_tokens : максимальное количество токенов для генерации в комплексе. Большая часть модели имеет длину контекста 2048.
top_p : альтернатива отбора проб с температурой, называемой отбором ядра. Если модель учитывает результат токенов с массой вероятности TOP_P, поэтому 0,1 означает, что только токены, содержащие 10% вероятности, рассматриваются
frequency_penalty : Положительные значения наказывают новые токены на основе их существующей частоты в тексте, что до сих пор уменьшает вероятность повторения одной и той же строки.
presence_penalty : положительное значение наказывает новые токены на основе того, появляются ли они в тексте, увеличивая вероятность того, что модель будет говорить о новых темах.

Настройка разработки

Если у вас нет pip в вашей системе, вы можете скачать его с помощью этой команды:

 sudo apt-get install python3-pip

Настройка виртуальной среды

Вы можете создать виртуальную среду с Anaconda, если она есть в вашей системе, создайте VirtualEnv с командой ниже:

 conda create -n yourenvname python==x.x
conda activate yourenvname

Или вы можете установить VirtualWrapper с командой ниже:

 sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv

А после установки создать виртуальную среду:

 cd/your/path && mkvirtualenv --python=python3 yourenvname

Установите требуемые пакеты из TEDS.TXT для запуска этого проекта:

 pip install -r requirements.txt

Руководство по вопросам предмета первой необходимости проекта

Запустить этот проект наиболее важным - иметь секретный ключ API от OpenaI, который позволяет модели генерировать содержимое. Если у вас есть секретный ключ API, вы должны установить его как переменную среды под названием OPENAI_API_KEY и прочитать его с помощью пакета python-dotenv .

Расширять

Дополнительная информация