Classe de classe
Chatgpt pour mes diapositives de conférence

Construit avec rational, propulsé par Llamaindex et Langchain.
Utilise la dernière API Chatgpt d'OpenAI.
Inspiré par Athènes
Démo d'applications
démo.mp4
Comment ça marche
- PASES PDF avec PYPDF
- Index Construction avec
GPTSimpleVectorIndex de Llamaindex- Le modèle
text-embedding-ada-002 est utilisé pour créer des intérêts - Voir la page d'index du magasin vectoriel pour en savoir plus
- Voici un échantillon d'index
- Les index et les fichiers sont stockés sur S3
- Interroger l'index
- Utilise le dernier modèle Chatgpt
gpt-3.5-turbo
Usage
Configuration et secrets
- Configurer AWS (QuickStart)
Créez un seau S3 avec un nom unique
Modifiez le nom du seau dans la base de code (recherchez bucket_name = "classgpt" en tout ce que vous avez créé.
renommer [.env.local.example] à .env et ajoutez vos informations d'identification OpenAI
Localement
- Créer Python Env
conda create -n classgpt python=3.9
conda activate classgpt- Installer des dépendances
pip install -r requirements.txt
- Exécuter l'application Streamlit
cd app/
streamlit run app/01_❓_Ask.py Docker
Alternative, vous pouvez utiliser Docker
Ensuite, ouvrez un nouvel onglet et accédez à http: // localhost: 8501 /
FAIRE
FAQ
Jetons
Les jetons peuvent être considérés comme des morceaux de mots. Avant que l'API ne traite les invites, l'entrée est décomposée en jetons. Ces jetons ne sont pas découpés exactement là où les mots commencent ou se terminent - les jetons peuvent inclure des espaces de fuite et même des sous-mots. Voici quelques règles de base utiles pour comprendre les jetons en termes de longueurs:
- 1 jeton ~ = 4 caractères en anglais
- 1 jeton ~ = ¾ mots
- 100 jetons ~ = 75 mots
- 1-2 phrase ~ = 30 jetons
- 1 paragraphe ~ = 100 jetons
- 1 500 mots ~ = 2048 jetons
Essayez l'outil Openai Tokenizer
Source
Incorporer
Une intégration est un vecteur (liste) de numéros de points flottants. La distance entre deux vecteurs mesure leur relation. De petites distances suggèrent une forte parenté et de grandes distances suggèrent une faible parenté.
Pour text-embedding-ada-002 , le coût est de 0,0004 $ / 1k jetons ou 3000 pages / dollar
- Intégres - API Openai
- Que sont les incorporations de mots et de phrases?
Modèles
Pour le modèle gpt-3.5-turbo (Chatgptapi), le coût est $0.002 / 1K tokens
Pour le modèle text-davinci-003 , le coût est $0.02 / 1K tokens
- Achèvement du chat - API OpenAI
Références
Rationaliser
- Augmenter la limite de téléchargement de St.File_uploader
- St.Cache_Resource - Rational Docs
- État de session
- Hayabhay / Whisper-UI: Sationlit UI pour le chuchotement d'Openai
Dépyant
- Guide de déploiement (Wiki) de rationalisation - Déploiement - Rationau
- Comment déployer une application rationalisée sur AWS? Partie-3
Llamaindex
- Modèle d'utilisation de Llamaindex
- Index de sauvegarde
Chargement des données
- Chargeur PDF
- REMAMA-HUB GITHUB REPO
- classe de documents
- Classe pdfreader
multimodal
- llama_index / multimodal.ipynb à Main
Chatte
- gpt_index / SimpleIndexdemo-chatgpt.ipynb
Lubriole
- gpt_index / langchaindemo.ipynb
- Openaichat
Boto3
- boto3 file_upload il vérifie si le fichier existe
- Boto 3: Ressource vs Client
- Écrire JSON pour déposer dans S3 Bucket
Trucs Docker
- Amazon Web Services - Quelle est la meilleure façon de transmettre des informations d'identification AWS à un conteneur Docker?
- docker-compose up défaillant dû à: Erreur: Impossible de trouver le compilateur de rouille · Issue # 572 · Acheong08 / Chatgpt
- Linux - Lors de l'installation de la chaîne d'outils de rouille dans Docker, la commande Bash
source ne fonctionne pas - Installation du logiciel - Comment installer un package avec APT sans le "Voulez-vous continuer [O / N]?" rapide? - Demandez à Ubuntu
- Comment utiliser Sudo dans un conteneur Docker?