ชั้นเรียน
chatgpt สำหรับสไลด์บรรยายของฉัน

สร้างด้วย Streamlit ขับเคลื่อนโดย Llamaidex และ Langchain
ใช้ API CHATGPT ล่าสุดจาก OpenAI
แรงบันดาลใจจาก Athensgpt
การสาธิตแอพ
demo.mp4
วิธีการทำงานนี้
- Parses PDF ด้วย pypdf
- การก่อสร้างดัชนีกับ
GPTSimpleVectorIndex ของ LlamaineDex- รุ่น
text-embedding-ada-002 ใช้เพื่อสร้าง embeddings - ดูหน้าดัชนี Vector Store เพื่อเรียนรู้เพิ่มเติม
- นี่คือดัชนีตัวอย่าง
- ดัชนีและไฟล์จะถูกเก็บไว้ใน S3
- สอบถามดัชนี
- ใช้รุ่น Chatgpt ล่าสุด
gpt-3.5-turbo
การใช้งาน
การกำหนดค่าและความลับ
- กำหนดค่า AWS (QuickStart)
สร้างถัง S3 ด้วยชื่อที่ไม่ซ้ำกัน
เปลี่ยนชื่อถังใน codebase (ค้นหา bucket_name = "classgpt" เป็นสิ่งที่คุณสร้างขึ้น
เปลี่ยนชื่อ [. env.local.example] เป็น .env และเพิ่มข้อมูลรับรอง OpenAI ของคุณ
ในระดับท้องถิ่น
- สร้าง python env
conda create -n classgpt python=3.9
conda activate classgpt- ติดตั้งการพึ่งพา
pip install -r requirements.txt
- เรียกใช้แอพ Streamlit
cd app/
streamlit run app/01_❓_Ask.py นักเทียบท่า
ทางเลือกคุณสามารถใช้ Docker
จากนั้นเปิดแท็บใหม่และนำทางไปที่ http: // localhost: 8501/
สิ่งที่ต้องทำ
คำถามที่พบบ่อย
โทเค็น
โทเค็นสามารถคิดว่าเป็นชิ้นส่วนของคำ ก่อนที่ API จะประมวลผลพรอมต์อินพุตจะถูกแบ่งออกเป็นโทเค็น โทเค็นเหล่านี้ไม่ได้ถูกตัดอย่างแน่นอนว่าคำเริ่มต้นหรือสิ้นสุด - โทเค็นอาจรวมถึงช่องว่างต่อท้ายและแม้แต่คำย่อย นี่คือกฎที่เป็นประโยชน์ของนิ้วหัวแม่มือสำหรับการทำความเข้าใจโทเค็นในแง่ของความยาว:
- 1 โทเค็น ~ = 4 ตัวอักษรเป็นภาษาอังกฤษ
- 1 โทเค็น ~ = ¾คำ
- 100 โทเค็น ~ = 75 คำ
- 1-2 ประโยค ~ = 30 โทเค็น
- 1 ย่อหน้า ~ = 100 โทเค็น
- 1,500 คำ ~ = 2048 โทเค็น
ลองใช้เครื่องมือ Openai Tokenizer
แหล่งที่มา
การฝัง
การฝังคือเวกเตอร์ (รายการ) ของหมายเลขจุดลอยตัว ระยะห่างระหว่างเวกเตอร์สองตัววัดความสัมพันธ์ของพวกเขา ระยะทางเล็ก ๆ แนะนำความเกี่ยวข้องสูงและระยะทางไกลแนะนำความสัมพันธ์ต่ำ
สำหรับ text-embedding-ada-002 ค่าใช้จ่ายคือ $ 0.0004 / 1K โทเค็นหรือ 3000 หน้า / ดอลลาร์
- EMBEDDINGS - Openai API
- คำและประโยคฝังตัวคืออะไร?
แบบจำลอง
สำหรับค่าใช้จ่าย gpt-3.5-turbo (CHATGPTAPI) คือ $0.002 / 1K tokens
สำหรับรุ่น text-davinci-003 ค่าใช้จ่ายคือ $0.02 / 1K tokens
- การแชทเสร็จสิ้น - Openai API
การอ้างอิง
มีแสงสว่าง
- เพิ่มขีด จำกัด การอัปโหลดของ St.File_uploader
- St.Cache_Resource - เอกสารที่มีความคล่องตัว
- สถานะเซสชัน
- Hayabhay/Whisper-ui: streamlit ui สำหรับ Whisper ของ Openai
ไม่เอื้ออำนวย
- คู่มือการปรับใช้ Streamlit (Wiki) - การปรับใช้ - Streamlit
- วิธีการปรับใช้แอปพลิเคชัน Streamlit เป็น AWS ตอนที่ 3
llamainedex
- รูปแบบการใช้งาน llamaidex
- ดัชนีการออม
กำลังโหลดข้อมูล
- ตัวโหลด PDF
- llama-hub github repo
- ชั้นเรียนเอกสาร
- คลาส PDFREADER
หลายรูปแบบ
- llama_index/multimodal.ipynb ที่หลัก
CHATGPT
- gpt_index/simpleindexdemo-chatgpt.ipynb
คนขี้เกียจ
- gpt_index/langchaindemo.ipynb
- Openaichat
Boto3
- boto3 file_upload ตรวจสอบว่าไฟล์มีอยู่จริงหรือไม่
- Boto 3: Resource vs Client
- การเขียน JSON เป็นไฟล์ใน Bucket S3
ของ Docker
- Amazon Web Services - วิธีที่ดีที่สุดในการส่งผ่านข้อมูลรับรอง AWS ไปยังคอนเทนเนอร์ Docker คืออะไร?
- Docker-compose up ล้มเหลวเนื่องจาก: ข้อผิดพลาด: ไม่พบ Rust Compiler ·ออก #572 · ACHEONG08/CHATGPT
- Linux - เมื่อติดตั้ง Rust Toolchain ใน Docker คำสั่ง Bash
source ไม่ทำงาน - การติดตั้งซอฟต์แวร์ - วิธีการติดตั้งแพ็คเกจที่มี APT โดยไม่ต้องใช้ "คุณต้องการดำเนินการต่อ [Y/N] หรือไม่?" พรอมต์? - ถาม Ubuntu
- จะใช้ sudo ภายในคอนเทนเนอร์ Docker ได้อย่างไร?