내 강의 슬라이드에 대한 chatgpt

Llamaindex와 Langchain으로 구동되는 간소로 제작되었습니다.
OpenAi의 최신 chatgpt API를 사용합니다.
anthensgpt에서 영감을 얻었습니다
GPTSimpleVectorIndex 사용한 색인 구조text-embedding-ada-002 모델은 임베딩을 만드는 데 사용됩니다gpt-3.5-turbo 사용합니다 aws configure고유 한 이름의 S3 버킷을 만듭니다
Codebase에서 버킷 이름을 변경하십시오 ( bucket_name = "classgpt" 찾은 모든 것에 대해 찾으십시오.
[.env.local.example]을 .env 로 이름을 바꾸고 OpenAI 자격 증명을 추가하십시오
conda create -n classgpt python=3.9
conda activate classgpt pip install -r requirements.txt cd app/
streamlit run app/01_❓_Ask.py대안, Docker를 사용할 수 있습니다
docker compose up그런 다음 새 탭을 열고 http : // localhost : 8501/로 이동합니다.
토큰은 단어의 조각으로 생각할 수 있습니다. API가 프롬프트를 처리하기 전에 입력은 토큰으로 나뉩니다. 이 토큰은 단어가 시작하거나 끝나는 곳에서 정확히 절단되지 않습니다. 토큰에는 후행 공간과 하위 단어가 포함될 수 있습니다. 다음은 길이 측면에서 토큰을 이해하는 데 유용한 경험 규칙입니다.
OpenAi 토큰 화기 도구를 사용해보십시오
원천
임베딩은 부동 소수점 번호의 벡터 (목록)입니다. 두 벡터 사이의 거리는 관련성을 측정합니다. 작은 거리는 높은 관련성을 암시하고 먼 거리는 낮은 관련성을 암시합니다.
text-embedding-ada-002 의 경우 비용은 $ 0.0004 / 1k 토큰 또는 3000 페이지 / 달러입니다.
gpt-3.5-turbo 모델 (ChatGptapi) 비용의 경우 비용은 $0.002 / 1K tokens 입니다.
text-davinci-003 모델의 경우 비용은 $0.02 / 1K tokens 입니다
데이터로드
멀티 모달
chatgpt
source 명령이 작동하지 않습니다.