Téléchargement BambooAI - BambooAI Source Code Download

Bamboue

Une bibliothèque légère utilisant des modèles de grande langue (LLM) pour fournir des capacités d'interaction en langage naturel, un peu comme un assistant de recherche et d'analyse de données permettant une conversation avec vos données. Vous pouvez soit fournir vos propres ensembles de données, soit permettre à la bibliothèque de localiser et de récupérer des données pour vous. Il prend en charge les recherches sur Internet et les interactions API externes.

Objectif

La bibliothèque Bambooai est un outil expérimental et LightWeigh qui utilise des modèles de langues importants (LLM) pour faciliter l'analyse des données, ce qui la rend plus accessible aux utilisateurs, y compris celles sans expertise en programmation. Il fonctionne comme un assistant pour la recherche et l'analyse des données, permettant aux utilisateurs d'interagir avec leurs données par le langage naturel. Les utilisateurs peuvent fournir leurs propres ensembles de données ou Bambooai peut aider à s'approvisionner les données nécessaires. L'outil intègre également les recherches sur Internet et accède aux API externes pour améliorer sa fonctionnalité.

Bambooai traite les requêtes en langage naturel sur les ensembles de données et peut générer et exécuter le code Python pour l'analyse et la visualisation des données. Cela permet aux utilisateurs de dériver des informations de leurs données sans connaissances approfondies. Les utilisateurs saisissent simplement leur ensemble de données, posent des questions en anglais simple, et Bambooai fournit les réponses, ainsi que des visualisations si nécessaire, pour mieux comprendre les données.

Bambooai vise à augmenter les capacités des analystes de données à tous les niveaux. Il simplifie l'analyse et la visualisation des données, contribuant à rationaliser les workflows. La bibliothèque est conçue pour être conviviale, efficace et adaptable pour répondre à divers besoins.

Prévisualisation

Essayez-le dans Google Colab:

Un exemple d'apprentissage automatique à l'aide de DataFrame fourni:

 !pip install pandas
!pip install bambooai

import pandas as pd
from bambooai import BambooAI

df = pd.read_csv('titanic.csv')
bamboo = BambooAI(df, debug=False, vector_db=False, search_tool=True)
bamboo.pd_agent_converse()

Cahier Jupyter:

Tâche: pouvez-vous s'il vous plaît concevoir un modèle d'apprentissage machine pour prédire la survie des passagers sur le Titanic? Sortir la précision du modèle. Tracez la matrice de confusion, la matrice de corrélation et d'autres mesures pertinentes. Recherchez Internet la meilleure approche de cette tâche.

Titanic_ml.mp4

UI Web:

Tâche: diverses requêtes liées à l'analyse des données sportives

Bambooai_demo_ui.mp4

Comment ça marche

L'agent Bambooai fonctionne à travers plusieurs étapes clés pour interagir avec les utilisateurs et générer des réponses:

1. Initiation

L'utilisateur lance l'agent Bambooai avec une question.
Si aucune question initiale n'est fournie, l'agent invite l'utilisateur à une question ou à une commande «sortie» pour mettre fin au programme.
L'agent entre ensuite dans une boucle où il répond à chaque question fournie et, une fois terminé, invite l'utilisateur à la question suivante. Cette boucle se poursuit jusqu'à ce que l'utilisateur choisit de quitter le programme.

2. Évaluation des tâches

L'agent stocke la question reçue et utilise le modèle grand langage (LLM) pour l'évaluer et le classer.
Le LLM détermine si la question nécessite une réponse textuelle, des informations supplémentaires (recherche Google: https://serper.dev/), ou peut être résolu à l'aide du code.
Selon l'évaluation et la classification des tâches, l'agent appelle l'agent approprié.

3. Bâtiment invite dynamique

Si la question peut être résolue par le code, l'agent détermine si les données nécessaires sont contenues dans l'ensemble de données fournie, nécessitent le téléchargement à partir d'une source externe, ou si la question est de nature générique et que les données ne sont pas requises.
L'agent choisit ensuite son approche en conséquence. Il formule un algorithme, exprimé comme une liste de tâches, pour servir de plan pour l'analyse.
La question d'origine est modifiée pour s'aligner sur cet algorithme. L'agent effectue une recherche sémantique contre une base de données vectorielle pour des questions similaires.
Toutes les questions correspondantes trouvées sont annexées à l'invite comme exemples. GPT-3.5, GPT-4 ou un modèle OSS local est ensuite utilisé pour générer du code basé sur l'algorithme.

4. Débogage, exécution et correction d'erreur

Si le code généré nécessite un débogage, GPT-4 est engagé.
Le code est exécuté et si des erreurs se produisent, l'agent enregistre le message d'erreur et le fait référence à la LLM pour correction.
Ce processus se poursuit jusqu'à l'exécution de code réussie.

5. Résultats, classement et construction de la base de connaissances

Après une exécution réussie, GPT-4 est utilisé pour classer la réponse.
Si le grade dépasse un seuil défini, la question, la réponse, le code et le rang sont stockées dans la base de données de vecteur de pinone.
Quel que soit le rang, la réponse ou la visualisation finale est formatée et présentée à l'utilisateur.

6. Rétroaction humaine et continuation de boucle

L'agent demande les commentaires de l'utilisateur.
Si l'utilisateur valide le classement généré automatiquement, la paire de questions / réponses est stockée dans la base de données vectorielle.
Sinon, une nouvelle boucle d'exécution commence.

Tout au long de ce processus, l'agent sollicite continuellement la saisie de l'utilisateur, stocke les messages pour le contexte et génère et exécute du code pour garantir des résultats optimaux. Divers modèles d'IA et une base de données vectorielle sont utilisés dans ce processus pour fournir des réponses précises et utiles aux questions de l'utilisateur.

Tableau d'écoulement (flux général d'agent):

Fournisseurs / modèles pris en charge

La bibliothèque prend en charge l'utilisation de divers modèles open source ou propriétaires, via l'API ou la location.

API:

Openai - Tous les modèles
Google - Modèles Gemini
Anthropic - tous les modèles
Groq - Tous les modèles
Mistral - Tous les modèles

Locale:

Olllama - Tous les modèles
Une sélection de modèles locaux (plus d'informations ci-dessous)

Vous pouvez spécifier le fournisseur / modèle que vous souhaitez utiliser pour un agent spécifique en modifiant le contenu du fichier LLM_Config, en remplaçant le nom du modèle OpenAI par défaut par le modèle et le fournisseur de votre choix. par exemple, par exemple {"agent": "Code Generator", "details": {"model": "open-mixtral-8x22b", "provider":"mistral","max_tokens": 4000, "temperature": 0}} . Le but de LLM_Config est décrit plus en détail ci-dessous.

Comment utiliser

Installation

 pip install bambooai

Usage

Paramètres

 df: pd.DataFrame - Dataframe (It will try to source the data from internet, if 'df' is not provided)

max_conversations: int - Number of "user:assistant" conversation pairs to keep in memory for a context. Default=4

debug: bool - If True, the received code is sent back to the LLM for evaluation of its relevance to the user's question, along with code error checking and debugging.

search_tool: bool - If True, the Planner agent will use a "google search API: https://serper.dev/" if the required information is not available or satisfactory. By default it only support HTML sites, but can be enhanced with Selenium if the ChromeDriver exists on the system (details below).

vector_db: bool - If True, each answer will first be ranked from 1 to 10. If the rank surpasses a certain threshold (8), the corresponding question (vectorised), plan, code, and rank (metadata) are all stored in the Pinecone database. Each time a new question is asked, these records will be searched. If the similarity score is above 0.9, they will be offered as examples and included in the prompt (in a one-shot learning scenario)

df_onthology: bool - If True, the onthology defined in the module `df_onthology.py` will be used to inform LLM of the dataframe structure, metrics, record frequency, keys, joins, abstract functions etc. The onthology is custom for each dataframe type, and needs to be defined by the user. Sample onthology is included. This feature signifficantly improves performance, and quality of the solutions.

exploratory: bool - If set to True, the LLM will evaluate the user's question and select an "Expert" that is best suited to address the question (experts: Research Specialist, Data Analyst). In addition, if the task involves code generation/execution, it will generate a task list detailing the steps, which will subsequently be sent to the LLM as a part of the prompt for the next action. This method is particularly effective for vague user prompts, but it might not perform as efficiently with more specific prompts. The default setting is True.

e.g. bamboo = BambooAI(df, debug=True, vector_db=True, search_tool=True, exploratory=True)
     bamboo = BambooAI(df,debug=False, vector_db=False, exploratory=True, search_tool=True)

Avis de dépréciation (25 octobre 2023): Veuillez noter que le "llm", "local_code_model", "llm_switch_plan" et "llm_switch_code" Les paramètres ont été dépréciés en tant que V 0.3.29. L'attribution des modèles et des paramètres du modèle aux agents est désormais gérée via LLM_Config. Cela peut être défini soit en tant que variable d'environnement, soit via un fichier llm_config.json dans le répertoire de travail. Veuillez consulter les détails ci-dessous

Configuration llm

La configuration LLM spécifique de l'agent est stockée dans la variable d'environnement LLM_CONFIG , ou dans le fichier "llm_config.json qui doit être stocké dans le répertoire de travail du bambouai. La configuration est sous une forme de liste JSON de dictionnaires et spécifie le nom du modèle, le fournisseur, la température et le maximum pour chaque agent. La configuration pour refléter vos préférences.

Modèles rapides

La bibliothèque Bambooai utilise un ensemble de modèles d'invite codé par défaut par défaut pour chaque agent. Si vous souhaitez expérimenter avec eux, vous pouvez modifier le fichier "invite_template_sample.json", supprimez le "_Sample de son nom et de son stockage dans le répertoire de travail. Par la suite, le contenu de l'invite instant_Template.json" modifié est utilisé à la place de l'invite modifiée.

Exemple d'utilisation: exécuter dans une boucle

 # Run in a loop remembering the conversation history
import pandas as pd
from bambooai import BambooAI

df = pd.read_csv('test_activity_data.csv')
bamboo = BambooAI(df)
bamboo.pd_agent_converse()

Exemple d'utilisation: exécution unique

 # Run programaticaly (Single execution).
import pandas as pd
from bambooai import BambooAI

df = pd.read_csv('test_activity_data.csv')
bamboo = BambooAI(df)
bamboo.pd_agent_converse("Calculate 30, 50, 75 and 90 percentiles of the heart rate column")

Variables d'environnement

La bibliothèque nécessite un compte API OpenAI et la touche API pour se connecter à OpenAI LLMS. La touche API OpenAI doit être stockée dans une variable d'environnement OPENAI_API_KEY . La clé peut être obtenue à partir d'ici: https://platform.openai.com/Account/API-Keys.

En plus des modèles OpenAI, une sélection de modèles de différents fournisseurs est également prise en charge (Groq, Gemini, Mistral, anthropic). Les touches API doivent être stockées dans les variables d'environnement au format suivant <VENDOR_NAME>_API_KEY . Vous devez utiliser GEMINI_API_KEY pour les modèles Google Gemini.

Comme mentionné ci-dessus, la configuration LLM peut être stockée dans un format de chaîne dans la variable d'environnement LLM_CONFIG . Vous pouvez utiliser le contenu du LLM_Config_sample.json fourni comme point de départ et modifiez votre préférence, selon les modèles auxquels vous avez accès.

La DB du vecteur Pincone est facultative. Si vous ne voulez pas l'utiliser, vous n'avez rien à faire. Si vous avez un compte avec PineCone et que vous souhaitez utiliser la base de connaissances et les fonctionnalités de classement, vous devrez configurer PINECONE_API_KEY ENVIROOMENT Variable, et définir le paramètre 'Vector_DB' sur true. L'indice DB vectoriel est créé lors de la première exécution.

La recherche Google est également facultative. Si vous ne voulez pas l'utiliser, vous n'avez rien à faire. Si vous avez un compte avec Serper et que vous souhaitez utiliser la fonctionnalité de recherche Google, vous devrez configurer et rendre compte avec ": https://serper.dev/", et définir la variable d'environnement SERPER_API_KEY et définir le paramètre 'search_tool' sur true. Par défaut, Bambooai ne peut gratter que les sites Web avec du contenu HTML. Cependant, il est également capable d'utiliser du sélénium avec Chromedriver, qui est beaucoup plus puissant. Pour activer cette fonctionnalité, vous devrez télécharger une version de ChromEdriver qui correspond à votre version du navigateur Chrome, stocker sur le système de fichiers et créer une variable d'environnement SELENIUM_WEBDRIVER_PATH avec un chemin vers votre ChromEdriver. Bambooai le ramassera automatiquement et utilise le sélénium pour toutes les tâches de grattage.

Modèles open source locaux

La bibliothèque prend actuellement en charge directement les modèles open source suivants. J'ai sélectionné les modèles qui marquent actuellement le plus haut sur la référence Humaneval.

WizardCoder (Wizardlm): WizardCoder-15B-V1.0, WizardCoder-Python-7B-V1.0, WizardCoder-Python-13B-V1.0, WizardCoder-Python-34B-V1.0
WizardCoder GPTQ (Thebloke): WizardCoder-15b-1.0-GPTQ, WizardCoder-Python73B-V1.0-GPTQ, WizardCoder-Python-13b-V1.0-GPTQ, Wizardcoder-Python-34B-V1.0-GPTQ
Codellama instruct (thebloke): Codellama-7B-Instruct-FP16, Codellama-13B-Instruct-FP16, Codellama-34B-Instruct-FP16
Codellama Instruct (Phind): Phind-Codellama-34B-V2
Codellama Achèvement (TheBloke): Codellama-7b-Python-FP16, Codellama-13b-Python-FP16, Codellama-34B-Python-FP16

Si vous souhaitez utiliser le modèle local pour un agent spécifique, modifiez le contenu LLM_Config en remplaçant le nom du modèle OpenAI par le nom du modèle local et modifiez la valeur du fournisseur en «local». par exemple, par exemple {"agent": "Code Generator", "details": {"model": "Phind-CodeLlama-34B-v2", "provider":"local","max_tokens": 2000, "temperature": 0}} À l'heure actuelle, il est recommandé d'utiliser unique Modèles Openai de choix. Le modèle est téléchargé à partir de HuggingFace et Cached Localy pour les exécutions ultérieures. Pour une performance raisonnable, il nécessite GPU compatible CUDA et la bibliothèque Pytorch compatible avec la version CUDA. Vous trouverez ci-dessous les bibliothèques requises qui ne sont pas incluses dans le package et devront être installées indépendamment:

 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 (Adjust to match your CUDA version. This library is already included in Colab notebooks)
pip install auto-gptq (Only required if using WizardCoder-15B-1.0-GPTQ model)
pip install accelerate
pip install einops
pip install xformers
pip install bitsandbytes

Les paramètres et paramètres des modèles locaux sont situés dans le module local_models.py et peuvent être ajustés pour correspondre à votre configuration ou préférences particulières.

Ollla

La bibliothèque prend également en charge l'utilisation de Olllama https://ollama.com/ et tous ses modèles. Si vous souhaitez utiliser un modèle Olllama local pour un agent spécifique, modifiez le contenu LLM_Config en remplaçant le nom du modèle OpenAI par le nom du modèle Olllama et modifiez la valeur du fournisseur en «olllama». par exemple, par exemple {"agent": "Code Generator", "details": {"model": "llama3:70b", "provider":"ollama","max_tokens": 2000, "temperature": 0}}

Enregistrement

Toutes les interactions LLM (locales ou via API) sont enregistrées dans le fichier bambooai_consolidated_log.json . Lorsque la taille du fichier journal atteint 5 Mo, un nouveau fichier journal est créé. Un total de 3 fichiers journaux sont conservés sur le système de fichiers avant que le fichier le plus ancien ne soit remplacé.

Les détails suivants sont capturés:

Chaîne ID
Tous les appels LLM (étapes) dans la chaîne , y compris les détails de chaque appel, par exemple. Nom de l'agent, horodatage, modèle, invite (mémoire de contexte), réponse, utilisation des jetons, coût, jetons par seconde, etc.
Résumé de la chaîne , y compris l'utilisation de jetons, le coût, le nombre d'appels LLM, les jetons par seconde, etc.
Résumé par LLM , y compris l'utilisation de jetons, le coût, le nombre d'appels, les jetons par seconde, etc.

Structure du journal:

 - chain_id: 1695375585
  ├─ chain_details (LLM Calls)
  │   ├─ List of Dictionaries (Multiple Steps)
  │       ├─ Call 1
  │       │   ├─ agent (String)
  │       │   ├─ chain_id (Integer)
  │       │   ├─ timestamp (String)
  │       │   ├─ model (String)
  │       │   ├─ messages (List)
  │       │   │   └─ role (String)
  │       │   │   └─ content (String)
  │       │   └─ Other Fields (content, prompt_tokens, completion_tokens, total_tokens, elapsed_time, tokens_per_second, cost)
  │       ├─ Call 2
  │       │   └─ ... (Similar Fields)
  │       └─ ... (Call 3, Call 4, Call 5 ...)
  │
  ├─ chain_summary
  │   ├─ Dictionary
  │       ├─ Total LLM Calls (Integer)
  │       ├─ Prompt Tokens (Integer)
  │       ├─ Completion Tokens (Integer)
  │       ├─ Total Tokens (Integer)
  │       ├─ Total Time (Float)
  │       ├─ Tokens per Second (Float)
  │       ├─ Total Cost (Float)
  │
  ├─ summary_per_model
      ├─ Dictionary
          ├─ LLM 1 (Dictionary)
          │   ├─ LLM Calls (Integer)
          │   ├─ Prompt Tokens (Integer)
          │   ├─ Completion Tokens (Integer)
          │   ├─ Total Tokens (Integer)
          │   ├─ Total Time (Float)
          │   ├─ Tokens per Second (Float)
          │   ├─ Total Cost (Float)
          ├─ LLM 2
          |   └─ ... (Similar Fields)
          └─ ... (LLM 3, LLM 4, LLM 5 ...)

Comparaison des performances (3 mai 2024)

Tâche: concevoir un modèle d'apprentissage automatique pour prédire la survie des passagers sur le Titanic. La sortie doit inclure la précision du modèle et les visualisations de la matrice de confusion, la matrice de corrélation et d'autres mesures pertinentes.

Ensemble de données: titanic.csv

Modèle: GPT-4-turbo

API Assistants OpenAI (interprète de code)

Résultat:
- Matrice de confusion:
  - Vrai négatif (TN): 90 passagers ont été correctement prédits comme ne survivant pas.
  - True Positive (TP): 56 passagers ont été correctement prédits comme survivant.
  - Faux négatifs (FN): 18 passagers étaient incorrectement prédits comme ne survivant pas.
  - Faux positifs (FP): 15 passagers ont été mal prédits comme survivant.

Métrique	Valeur
Temps d'exécution	77,12 secondes
Jetons d'entrée	7128
Jetons de sortie	1215
Coût total	0,1077 $

Bambouai (pas de planification, de recherche Google ou DB vectoriel)

Résultat:
- Matrice de confusion:
  - Vrai négatif (TN): 92 passagers ont été correctement prédits comme ne survivant pas.
  - True Positive (TP): 55 passagers ont été correctement prédits comme survivant.
  - Faux négatifs (FN): 19 passagers étaient incorrectement prédits comme ne survivant pas.
  - Faux positifs (FP): 13 passagers étaient à tort prédits comme survivant.

Métrique	Valeur
Temps d'exécution	47,39 secondes
Jetons d'entrée	722
Jetons de sortie	931
Coût total	0,0353 $

Report EVAL 18 août 2024

Évaluation objective des outils d'IA pour l'analyse des données sportives_ Maxwell-V2 vs Generic Llms.pdf

Notes

La bibliothèque prend actuellement en charge les modèles de chat Openai. Il a été testé avec GPT-3.5-Turbo et GPT-4. Le GPT-3.5-Turbo semble fonctionner OK pour les tâches plus simples et est la bonne option de démarrage / exploration en raison de son 10x plus bas.
Il peut également être utilisé avec des modèles des fournisseurs suivants via l'API. Anthropique, Mistral, Google Gemini, Groq. Tout ce dont vous avez besoin est la clé API.
L'utilisation d'Olllama et de tous ses modèles est également prise en charge. Cela pourrait être très pratique car une bouche de lalama 3 finetunes est sur le point de commencer à atterrir.
Pour le codage des tâches, il prend également en charge les modèles de code open source SOTA comme Codellama et WizardCoder.
La bibliothèque exécute le code Python généré par LLM, cela peut être mauvais si le code Python généré par LLM est nuisible. Utilisez avec prudence.
Assurez-vous de surveiller votre utilisation de jeton. Au moment de la rédaction du moment de la rédaction, le coût par 1 000 jetons d'entrée est de 0,01 USD pour GPT-4-turbo et 0,001 USD pour GPT-3,5-turbo. Il est important de garder ces coûts à l'esprit lors de l'utilisation de la bibliothèque, en particulier lors de l'utilisation des modèles les plus chers.
Modèles OpenAI pris en charge: GPT-3.5-Turbo, GPT-3.5-Turbo-613, GPT-3.5-Turbo-16k, GPT-4, GPT-4-Turbo.
Modèles open source pris en charge: wizardcoder-15b-v1.0, wizardcoder-python-7b-v1.0, wizardcoder-python-13b-v1.0, wizardcoder-python-34b-v1.0, wizardcoder-15b-1.0-gptq, wizardcoder WizardCoder-Python-13B-V1.0-GPTQ, WizardCoder-Python-34B-V1.0-GPTQ, CodeLlama-7B-Instruct-fp16, CodeLlama-13B-Instruct-fp16, CodeLlama-34B-Instruct-fp16, CodeLlama-7B-Python-fp16, CodeLlama-13B-Python-fp16, Codellama-34B-Python-FP16, Phind-Codellama-34B-V2.

Contributif

Les contributions sont les bienvenues; N'hésitez pas à ouvrir une demande de traction. Gardez à l'esprit que notre objectif est de maintenir une base de code concise avec une grande lisibilité.