Téléchargement LLMFlex - Téléchargement du code source LLMFlex

LLMFlex

Autre code source

1.0.0

Télécharger

Llmflex

Un package Python pour développer des applications d'IA avec des LLM locaux

LLMFLEX est un package Python qui permet aux développeurs Python de travailler avec différents modèles de langage grand (LLM) et de faire une ingénierie rapide avec une interface simple. Il favorise les ressources libres et locales au lieu d'utiliser des API payantes pour développer des solutions alimentées par l'IA véritablement locales et privées.

Il fournit des classes pour charger des modèles LLM, des modèles d'intégration et des bases de données vectorielles pour créer des applications alimentées par LLM avec vos propres techniques d'ingénierie et de chiffon rapides. Avec une commande unique, vous pouvez charger une interface chatbot pour discuter avec le LLM ou servir également une API OpenAI.

Installation de LLMFLEX

La création d'un environnement virtuel avant d'installer le package est fortement recommandée. Assurez-vous également que vous avez installé Pytorch et Llama-Cpp-Python avec la méthode d'installation correcte en fonction de votre configuration matérielle avant d'installer LLMFLEX. Veuillez visiter les liens fournis pour les forfaits respectifs pour des guides d'installation plus détaillés.

Après avoir fait les étapes ci-dessus, vous pouvez facilement installer LLMFLEX avec pip .

 pip install llmflex

Vous pouvez également installer EXLLAMAV2, AUTOAWQ et AUTOGPTQ si vous avez des appareils CUDA. Veuillez visiter les liens fournis pour les forfaits respectifs pour des guides d'installation plus détaillés.

Caractéristiques

1. LLMS multiple avec des configurations de génération différentes à partir d'un modèle

Contrairement à Langchain, vous pouvez créer plusieurs LLM avec une température différente, de nouveaux jetons max, des mots d'arrêt, etc. avec le même modèle sous-jacent sans charger le modèle plusieurs fois en utilisant la classe LlmFactory . Cela peut être utile lorsque vous créez votre propre agent avec différentes tâches LLM qui nécessitent différentes configurations.

2. Compatibilité de Langchain avec des performances améliorées

Tous les LLM créés avec LlmFactory sont compatibles Langchain et peuvent être intégrés de manière transparente dans votre code Langchain existant. Toutes les classes LLM sont des réimplémentations de certaines classes Langchain LLM qui prennent en charge le streaming plus efficace et la gestion des mots d'arrêt, le tout avec une interface unifiée.

3. Prise en charge des formats de modèles multiples

Plusieurs formats de modèles sont tous pris en charge, et le processus de chargement est tous géré dans la classe LlmFactory , il est donc juste plug and play. Formats pris en charge:

Pytorch , AWQ , GPTQ (Transformers Uvia)
GGUF (via Llama-Cpp-Python)
API OpenAI (Travaillez avec tous les serveurs locaux qui servent des modèles au format API OpenAI)
Exl2 (via exllamav2)

4. Outils personnalisés

Un BaseTool de base pour créer des outils à alimentation LLM. Un BrowserTool propulsé par DuckDuckgo est implémenté comme exemple.

5. Agents LLM

Une classe Agent est fournie. Vous pouvez transmettre vos outils et LLM pour initialiser l'agent, après avoir donné une tâche à l'agent, l'agent élaborera la magie pour vous avec les outils donnés.

6. Intégration des boîtes à outils

Classes groupées pour l'utilisation de modèles d'incorporation qui contient le modèle d'incorporation et un séparateur de texte basé sur des jetons à l'aide du modèle d'incorporation.

7. Base de données vectorielle

En utilisant des kits d'outils d'intégration et Faish, une classe FaissVectorDatabase peut vous permettre de stocker et de rechercher des textes pour vos tâches de chiffon.

8. Mémoires de chat

Classes de mémoire de chat pour stocker la mémoire de chat sur le disque.

BaseChatMemory
Classe de mémoire sans utiliser de modèles d'intégration ou de bases de données vectorielles.
LongShortTermChatMemory
Classe de mémoire utilisant une FaissVectorDatabase sous-jacente pour maintenir la mémoire à long terme avec la mémoire la plus récente.

9. Modèle rapide

Une classe PromptTemplate est implémentée pour formater votre invite avec différents formats d'invite pour des modèles de différentes sources. Certains préréglages comme Llama3 , ChatML , Vicuna et plus sont déjà implémentés, mais vous pouvez toujours ajouter votre propre modèle de format rapide.

10. Interface Frontend Chatbot

Un WebApp rationalisé est fourni pour l'utilisation locale de chatbot AI. L'appel de fonction et le chiffon sur vos propres documents sont pris en charge sur le WebApp. Vous pouvez également diriger la réponse du LLM en fournissant le texte de début pour la réponse.

Utilisation de llmflex

1. Créer des LLM

C'est ainsi que vous pouvez commencer par n'importe quel modèle de génération de texte sur HuggingFace avec votre machine.

 from llmflex import LlmFactory

# Load the model from Huggingface
model = LlmFactory ( "TheBloke/OpenHermes-2.5-Mistral-7B-GGUF" )

# Create a llm
llm = model ( temperature = 0.7 , max_new_tokens = 512 )

# Use the LLM for your task
prompt = "Q: What is the colour of an apple? A:"
ans = llm . invoke ( prompt , stop = [ 'Q:' ])
print ( ans )

# Or if you prefer to generate the output with token streamming.
for token in llm . stream ( prompt , stop = [ 'Q:' ]):
    print ( token , end = "" )

2. Chargez la boîte à outils Embeddings et créez une base de données vectorielle

Pour charger un modèle d'intégration et utiliser une base de données vectorielle:

 from llmflex . Embeddings import HuggingfaceEmbeddingsToolkit
from llmflex . VectorDBs import FaissVectorDatabase

# Loading the embedding model toolkit
embeddings = HuggingfaceEmbeddingsToolkit ( model_id = "thenlper/gte-small" )

# Create a vector database
food = [ "Apple" , "Banana" , "Pork" ]
vectordb = FaissVectorDatabase . from_texts ( embeddings = embeddings , texts = food )

# Do semantic search on the vector database
print ( vectordb . search ( "Beef" ))

3. Utilisez des outils

Une classe BrowserTool est implémentée comme exemple pour créer un outil avec LLMFlex. L'outil utilise DuckDuckGo par défaut. Voici comment vous pouvez l'utiliser:

 from llmflex . Tools import BrowserTool
from llmflex . Rankers import FlashrankRanker

# Create a reranker
ranker = FlashrankRanker ()

# Create a broswer tool with the embeddings toolkit created earlier
tool = BrowserTool ( embeddings = embeddings , llm = llm , ranker = ranker )

# Run the tool
tool ( search_query = 'Install python' )

4. Exécuter un agent

Utilisez l'agent React One-Shot pour passer par des workflows plus compliqués.

 from llmflex . Agents import Agent

agent = Agent ( llm = llm , tools = [ tool ], prompt_template = model . prompt_template )
agent . run ( "Do some research online to find out the latest trends about Generative AI." )

5. discuter avec le modèle dans une application Web rationalisée

Si vous voulez juste qu'un GUI commence à discuter avec votre modèle LLM avec une mémoire à long terme et à court terme, saisissez cette commande dans le terminal:

llmflex interface

Si vous souhaitez configurer le modèle LLM, le modèle d'intégration, le séparateur de texte et Reranker, créez un fichier de configuration et modifiez-le d'abord:

 # Create a config file for the webapp
llmflex create-app-config

Après avoir modifié le fichier, exécutez ce qui suit:

llmflex interface --config_dir chatbot_config.yaml

Vous verrez un frontend rationalisé, utilisez-le pour discuter avec le modèle LLM.

Vous pouvez maintenant télécharger vos fichiers texte pour créer des bases de connaissances et parler de vos documents avec votre assistant AI.

Pour plus de détails sur la façon de configurer votre YAML, veuillez lire la documentation fournie. GUI rationalisé

Documentations

La documentation Python pour toutes les classes, méthodes et fonctions est fournie dans le répertoire ./docs dans ce référentiel.

Licence

Ce projet est concédé sous licence de la licence du MIT.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-24
taille 491.38KB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout