소개 된 언어 모델 GPT-3 사용과 같은 템플릿 컨텐츠 생성
다음을 포함한 모든 작업에 OpenAI API를 사용하는 데 기본적인 핵심 개념 및 기술.
OpenAI API는 자연어 또는 코드를 이해하거나 생성하는 사실상 모든 작업에 적용될 수 있습니다.
GPT-3 또는 3 세대 생성 사전 훈련 된 변압기는 인터넷 데이터를 사용하여 모든 유형의 텍스트를 생성하기 위해 교육을받은 신경망 기계 학습 모델입니다. 많은 양의 관련 및 정교한 기계 생성 텍스트를 생성하려면 소량의 입력 텍스트가 필요합니다.
GPT-3의 딥 러닝 신경망은 1,750 억 이상의 기계 학습 매개 변수를 가진 모델입니다. 결과적으로 GPT-3은 인간이 글을 쓸 수있는 것처럼 보일 정도로 설득력있는 텍스트를 생성하기위한 이전 모델보다 낫습니다.
completions 엔드 포인트는 OpenAI API의 핵심이며 매우 유연하고 강력한 간단한 인터페이스를 제공합니다.
당신은 텍스트를 프롬프트로 입력하고 API는 우리가 준 지침이나 컨텍스트와 일치시키려는 텍스트 완료를 반환합니다.
이를 매우 고급 자동 완성으로 생각할 수 있습니다. 모델은 텍스트 프롬프트를 처리하고 다음에 올 가능성이 가장 높은 것을 예측하려고합니다. 프롬프트를 설계하는 것은 본질적으로 우리가 모델을 "프로그램"하는 방법입니다.
많은 경우에, 당신이 원하는 것을 보여주고 말하는 것이 도움이됩니다. 프롬프트에 예제를 추가하면 패턴이나 뉘앙스를 전달하는 데 도움이 될 수 있습니다.
자연 언어 처리에는 주요 구성 요소 자연 랑 게이지 생성 중 하나가 포함됩니다. 인간의 랑가우지 자연 텍스트를 생성하는 데 중점을 둡니다. 그러나 인간의 이해할 수있는 콘텐츠를 생성하는 것은 언어의 복잡성과 뉘앙스를 실제로 모르는 기계의 경우 도전입니다. 인터넷에서 텍스트를 사용하여 GPT-3은 현실적인 인간 텍스트를 생성하도록 교육을받습니다.
GPT-3은 많은 양의 품질 사본을 생성하는 데 사용할 수있는 소량의 입력 텍스트 만 사용하여 기사,시, 이야기, 뉴스 보고서 및 대화를 만드는 데 사용되었습니다.
GPT-3은 또한 자동화 된 대화 작업에 사용되고 있으며, 개인이 컨텍스트에 적합한 새로운 텍스트 조각으로 컴퓨터에 유형을 입력하는 텍스트에 응답합니다. GPT-3은 인간 언어 텍스트뿐만 아니라 텍스트 구조로 무엇이든 만들 수 있습니다. 또한 텍스트 요약 및 프로그래밍 코드를 자동으로 생성 할 수도 있습니다.
GPT-3은 언어 예측 모델입니다. 즉, 입력 텍스트를 입력으로 취하고 가장 유용한 결과가 예측할 수있는 것으로 변환 할 수있는 신경망 머신 러닝 모델이 있음을 의미합니다. 이것은 인터넷 텍스트의 광대 한 본문에서 시스템을 패턴으로 구성하여 시스템을 훈련시켜 달성됩니다. 보다 구체적으로, GPT-3은 엄청난 양의 텍스트에 미리 훈련 된 것을 기반으로 텍스트 생성에 중점을 둔 모델의 세 번째 버전입니다.
프롬프트 생성에 대한 세 가지 기본 지침이 있습니다.
Show and tell : 지침, 예 또는 두 가지의 조합을 통해 원하는 것을 분명히하십시오. 모델이 알파벳 순서로 항목 목록을 순위에 올리거나 정서적으로 단락을 분류하려면 원하는 것임을 보여주십시오.Provide quality data : 분류기를 구축하거나 모델이 패턴을 따를 경우 충분한 예가 있는지 확인하십시오. 이 모델은 일반적으로 기본 철자 실수를 통해보고 응답을 제공 할만 큼 충분히 똑똑하지만, 이는 의도적이라고 가정 할 수도 있고 응답에 영향을 줄 수 있습니다.Check your settings : 온도 및 TOP_P 설정은 모델이 응답을 시작하는 데 얼마나 결정적인 지 제어합니다. prompt : 문자열, 문자열 배열, 토큰 배열 또는 토큰 배열에 대한 상보를 생성하는 프롬프트. <|endoftext|> 는 교육 중에 모델이 보는 문서 섹퍼레이터이므로 프롬프트가 지정되지 않으면 모델이 새 문서의 시작부터 마치 마치 생성됩니다.engine : Text-Davinci-001 은 가장 유능한 GPT-3 모델입니다. 다른 모델이 할 수있는 모든 작업을 수행 할 수 있으며, 종종 컨텍스트가 적습니다. 프롬프트에 응답하는 것 외에도 텍스트 내에 완료를 삽입하는 것이 지원됩니다.temperature : 온도는 사용해야 할 샘플링 온도를 의미합니다. 값이 높을수록 모델이 더 많은 위험을 감수하고, 더 창의적인 애플리케이션에는 0.9를 사용할 수 있으며, 정의 된 답변이있는 경우 0은 0.9를 사용할 수 있습니다.max_tokens : 합의에서 생성 할 최대 토큰 수. 대부분의 모델은 컨텍스트 길이가 2048입니다.top_p : 핵 샘플링이라고 불리는 온도로 샘플링을위한 대안. 모델이 TOP_P 확률 질량으로 토큰의 결과를 고려하는 경우, 0.1은 상위 10% 확률 질량을 포함하는 토큰 만 고려됩니다.frequency_penalty : 긍정적 값은 지금까지 텍스트의 기존 주파수에 따라 새로운 토큰을 불평하여 동일한 줄을 반복 할 가능성을 줄입니다.presence_penalty : 긍정적 가치는 지금까지 텍스트에 나타나지 여부에 따라 새로운 토큰을 처벌하여 새로운 주제에 대해 이야기 할 가능성이 높아집니다. 시스템에 pip 없는 경우이 명령의 도움으로 다운로드 할 수 있습니다.
sudo apt-get install python3-pip
시스템에있는 경우 Anaconda로 가상 환경을 만들 수 있습니다.
conda create -n yourenvname python==x.x
conda activate yourenvname
또는 아래에 명령으로 가상 자극을 설치할 수 있습니다.
sudo pip3 install virtualenvwrapper
sudo pip3 install --upgrade virtualenv
설치 후 가상 환경을 만듭니다.
cd/your/path && mkvirtualenv --python=python3 yourenvname
이 프로젝트를 실행하려면 요구 사항에서 필요한 패키지를 설치하십시오.
pip install -r requirements.txt
이 프로젝트를 실행하려면 가장 중요한 것은 OpenAI의 비밀 API 키를 사용하여 모델이 내용을 생성 할 수 있도록하는 것입니다. Secret API 키가있는 경우 OPENAI_API_KEY 이름으로 환경 변수로 설정하고 python-dotenv 패키지를 사용하여 읽어야합니다.