Bienvenue dans la vitrine des grands modèles de langue! Ce référentiel est une collection organisée d' applications intéressantes, de cas d'utilisation , de référentiels GitHub et de tutoriels qui utilisent des modèles de langue de pointe, tels que GPT-3 et d'autres modèles de langues importants. Que vous soyez un passionné de langue, un chercheur à l'apprentissage automatique ou simplement quelqu'un intéressé par les capacités de l'IA, ce référentiel est l'endroit idéal pour explorer le monde du traitement du langage naturel et voir de quoi ces modèles puissants sont capables.
Dans ce référentiel, vous trouverez une variété d'exemples et de démonstrations de modèles de langage utilisés pour la génération de texte, la recherche, la réponse aux questions et plus encore. Vous trouverez également des tutoriels et des ressources pour créer vos propres applications, ainsi que des liens vers d'autres référentiels et ressources pour un apprentissage ultérieur.
Github
Ce script Python est un exemple d'un système de gestion des tâches alimenté en AI. Le système utilise des bases de données OpenAI et vectorielles telles que le chroma ou les weavate pour créer, hiérarchiser et exécuter des tâches. L'idée principale derrière ce système est qu'elle crée des tâches basées sur le résultat des tâches précédentes et un objectif prédéfini. Le script utilise ensuite les capacités de traitement du langage naturel d'OpenAI (NLP) pour créer de nouvelles tâches basées sur l'objectif, et chroma / weavate pour stocker et récupérer les résultats des tâches pour le contexte. Il s'agit d'une version épurée de l'agent autonome axé sur les tâches d'origine (28 mars 2023).
Github
Organisateur de mémoire épisodique (REMO) pour AI AI SystemsRemo: organisateur de mémoire épisodique récursive. Gestion efficace de la mémoire évolutive et évolutive. Organise les données conversationnelles dans les rangs taxonomiques. Chaque classement clusters d'éléments similaires sémantiquement. Outil puissant pour les systèmes d'IA complémentaires. Améliore les capacités conversationnelles, la précision du rappel.
Github
Window Ai est une extension de navigateur qui vous permet de configurer les modèles AI en un seul endroit et de les utiliser sur le Web. Pour les développeurs: créez facilement les applications multimodèles exemptes de coûts et de limites de l'API - utilisez simplement la bibliothèque Window.ai injectée. Tirez parti de l'IA décentralisée pour les utilisateurs: contrôlez l'IA que vous utilisez sur le Web, qu'il soit externe (comme OpenAI), proxie ou local, pour protéger la confidentialité. Pour les fournisseurs de modèles: branchez un écosystème d'utilisateurs sans obliger les développeurs à changer leurs applications.
Github
Openchatkit fournit une base puissante et open source pour créer des chatbots à usage spécialisé et généraux pour diverses applications. Le kit comprend des modèles de langage réglés par l'instruction, un modèle de modération et un système de récupération extensible pour inclure des réponses à jour à partir de référentiels personnalisés.
Github
Alpaca-Turbo est un frontage pour utiliser de grands modèles de langage qui peuvent être exécutés localement sans beaucoup de configuration requise. Il s'agit d'une interface utilisateur Web conviviale pour le lama.cpp, avec des fonctionnalités uniques qui le distinguent d'autres implémentations. L'objectif est de fournir une expérience de chat transparente facile à configurer et à utiliser, sans sacrifier la vitesse ou la fonctionnalité.
Github
Lors de la création d'applications de chat à l'aide de LLMS, la gestion de la mémoire est quelque chose qui doit être construit à chaque fois. Motorhead est un serveur pour aider à ce processus.
Github
Chatgpt et divers modèles de grandes langues (LLMS) possèdent une polyvalence incroyable, permettant le développement d'un large éventail d'applications. Cependant, à mesure que votre application gagne en popularité et rencontre des niveaux de trafic plus élevés, les dépenses liées aux appels API LLM peuvent devenir substantielles. De plus, les services LLM pourraient présenter des temps de réponse lents, en particulier lorsqu'ils traitent un nombre important de demandes.
Github
Ce script Python est un exemple d'un agent autonome alimenté par LLM. Le système utilise l'API OpenAI pour créer et exécuter des tâches. L'idée principale du projet est de fournir à l'assistant les outils dont il a besoin pour faire n'importe quelle tâche - s'il est assez intelligent. Il peut exécuter arbitrairement le code et contrôler son propre flux et sa propre mémoire, pour un agent suffisamment intelligent, soit par pré-formation, réglage fin ou optimisation rapide, cela devrait être suffisant (si cela est possible).
Github
EVAL (élastique Agent polyvalent avec Langchain) exécutera toutes vos demandes. Tout comme une méthode d'évaluation!
Blog
Une question à laquelle on m'a beaucoup posé récemment est la grande envergure des modèles de langage (LLMS) modifieront les flux de travail d'apprentissage automatique. Après avoir travaillé avec plusieurs sociétés qui travaillent avec des applications LLM et qui descendent personnellement un terrier de lapin en construisant mes applications ...
Github
Chameleon est un cadre de raisonnement de composition plug-and-play qui augmente les LLM avec différents types d'outils. Chameleon synthétise des programmes pour composer divers outils, notamment des modèles LLM, des modèles de vision standard, des moteurs de recherche Web, des fonctions Python et des modules basés sur des règles adaptés aux intérêts des utilisateurs. Construit au-dessus d'un LLM en tant que planificateur de langage naturel, le caméléon déduit la séquence appropriée d'outils pour composer et exécuter afin de générer une réponse finale.
Github
Une plate-forme ouverte pour la formation, le service et l'évaluation de modèles de grande langue. Libérez le répension à Vicuna et FastChat-T5.
Github
Nous présentons Vicuna-13b, un chatbot open source formé par Fineding Llama sur les conversations partagées par l'utilisateur collectées auprès de Sharegpt. L'évaluation préliminaire utilisant GPT-4 en tant que juge montre que Vicuna-13B atteint plus de 90% * la qualité d'Openai Chatgpt et Google Bard tout en surpassant d'autres modèles comme Llama et Stanford Alpaca dans plus de 90% * des cas.
Github
Déverrouillez le potentiel de GPT-4 avec M. Ranedeer AI Tutor, une invite personnalisable qui offre des expériences d'apprentissage personnalisées pour les utilisateurs ayant des besoins et des intérêts divers.
Blog
Le projet Redpajama vise à créer un ensemble de modèles open source de premier plan et à comprendre rigoureusement les ingrédients qui donnent de bonnes performances.
Github
Nous publions notre aperçu public d'OpenLlama, une reproduction open source autorisée avec permis de Meta AI, formé sur l'ensemble de données Redpajama de Meta AI. Les poids de notre modèle peuvent servir de baisse du remplacement de LLAMA 7B dans les implémentations existantes. Nous fournissons également une plus petite variante 3B du modèle LLAMA.
Github
Plongez dans une expérience d'apprentissage plus interactive avec la nouvelle fonctionnalité de chat de Knowledge! Engagez des conversations dynamiques avec vos projets et sources, en tirant parti de la puissance des modèles de gros langues. Posez des questions, explorez les concepts et approfondissez votre compréhension, le tout dans une interface de chat intuitive.
Github
MLC LLM est une solution universelle qui permet à tous les modèles de langue d'être déployés nativement sur un ensemble diversifié de backends matériels et d'applications natives, ainsi qu'un cadre productif pour que tout le monde optimise les performances du modèle pour ses propres cas d'utilisation.
Github
L'intelligence artificielle interactive Google-Bard publiée par Google AI prend officiellement l'anglais, le coréen et le japonais. Par conséquent, nous partageons des invites pour une meilleure utilisation de Google Bard. Amazing-Bard-PROMPTS est une fourche de chatteaux impressionnants et traduit avec le moteur Translate de Google. Les contributeurs peuvent modifier les fichiers CSV pour modifier, examiner et suggérer des invites adaptées à Google Bard.
Github
Le livre de cuisine OpenAI partage un exemple de code pour accomplir des tâches courantes avec l'API OpenAI.
Github
Les modèles génératifs de langage AI comme Chatgpt changent la façon dont les humains et l'IA interagissent et travaillent ensemble, mais comment ces modèles fonctionnent-ils réellement? Apprenez tout ce que vous devez savoir sur l'IA générative moderne pour la langue dans ce guide simple.
Github
SuperAgent est un outil puissant qui simplifie la configuration et le déploiement des agents LLM (modèle de grande langue) à la production. Il fournit une gamme de fonctionnalités et de fonctionnalités pour faciliter la création, gérer et déployer des agents d'IA à la production, y compris des fonctionnalités telles que la mémoire intégrée et la récupération de documents via des DB vectoriels, des outils puissants, des webhooks, des travaux cron, etc.
Github
Plateforme d'agentops pour développeur-First - Déployer, tester et surveiller les agents d'IA
Github
Zeno Build est un outil pour les développeurs qui souhaitent construire, comparer rapidement et itérer sur les applications à l'aide de grands modèles de langage.
Github
Discutez simultanément avec Chatgpt, Bing Chat, Bard, Alpaca, Vincuna, Claude, Chatglm, Moss, Iflytek Spark, Ernie et plus, découvrez les meilleures réponses.
Github
Un backend Fastapi et une interface utilisateur rationalisée pour PrivateGpt. Interagissez en privé avec vos documents en tant que WebApp en utilisant la puissance de GPT, 100% privé, aucune fuite de données.
Github
Chez Google, il y avait un document réunis par Jeff Dean, l'ingénieur légendaire, appelé Numbers que chaque ingénieur devrait connaître. Il est vraiment utile d'avoir un ensemble similaire de nombres pour que les développeurs LLM sachent qui sont utiles pour les calculs de l'enveloppe. Ici, nous partageons des nombres particuliers à toute utilisation à l'échelle, pourquoi le nombre est important et comment l'utiliser à votre avantage.
Github
Dans ce didacticiel, vous apprendrez à affiner et à déployer la base de beignets pour les documents comprises / battant des documents à l'aide de transformateurs de visage étreintes et d'Amazon Sagemaker.
Site web
Pandagpt est un modèle de suivi des instructions à usage général qui peut à la fois voir et entendre. Nos expériences pilotes montrent que Pandagpt peut effectuer des tâches complexes telles que la génération détaillée de la description de l'image, l'écriture d'histoires inspirées des vidéos et la réponse aux questions sur l'audios.
Github
Construire des applications avec LLMS via la composibilité
Github
Permet d'étendre l'API ChatGPT à plusieurs sessions simultanées avec une mémoire contextuelle et adaptative infinie alimentée par GPT et Redis.
Github
Il s'agit d'une collection d'exemples rapides à utiliser avec le modèle Chatgpt.
Girhub
Jarvis, un système pour connecter les LLM avec la communauté ML
Github
Une bibliothèque incluse des batteries pour la construction de logiciels alimentés par l'IA. Le travail de Marvin est d'intégrer l'IA directement dans votre base de code en le faisant ressembler à toute autre fonction.
Github
Llamaindex (GPT Index) est un projet qui fournit une interface centrale pour connecter vos LLM avec des données externes.
Github
Génération d'ontologies et de bases de connaissances à l'aide d'un outil d'extraction de connaissances GPT.
Blog
La construction d'un chatbot est devenue une compétence chaude, et avec la sortie de Chatgpt, nous voyons un grand nombre d'applications de chat publiées.
Blog
Formation efficace du modèle de langue grande avec Lora et Face étreint
Github
ChatDoctor: un modèle de chat médical affiné sur le modèle LLAMA utilisant des connaissances du domaine médical
Github
GPT4ALL: Un écosystème de chatbots open source a formé sur une collection massive de données d'assistant propres, y compris le code, les histoires et le dialogue. Demo, données et code pour former un modèle de grande langue de style assistant avec ~ 800k GPT-3.5-turbo générations basées sur LLAMA
Github
Ce référentiel contient le code expérimental pour reproduire les résultats dans la fusion de connaissances de données en fusionnant des poids de modèles linguistiques, un article à publier lors de la onzième conférence internationale sur les représentations d'apprentissage (ICLR 2023), qui se tiendra du 1er au 5 mai 2023 à Kigali, Rwanda.
Github
Guides, articles, conférences, cahiers et ressources pour l'ingénierie rapide
Site web
Il s'agit d'un prototype à moitié cuit qui vous «aide» à extraire des données structurées à partir de texte à l'aide de modèles de langage grand (LLMS)
Github
Une méthode pour corriger le GPT-3 après le déploiement avec les commentaires des utilisateurs, sans reconstitution.
Blog
Cet article se concentre davantage sur le fonctionnement de Chatgpt au niveau conceptuel et sur la façon dont il se compare aux graphiques de connaissances.
Github
Utilisez la nouvelle API GPT-4 pour créer un chatbot ChatGPT pour plusieurs grands fichiers PDF.
Github
Ce dépôt est de vous aider à construire un système de réponse de questions puissant qui peut répondre avec précision aux questions en combinant les modèles Langchain et de grands langues (LLM), y compris les modèles GPT3 d'OpenAI.
Github
ColossalChat est le projet de mise en œuvre de LLM avec RLHF, propulsé par le Colossal-AI Project.COATI signifie Colossalai Talking Intelligence. C'est le nom du module implémenté dans ce projet et est également le nom du modèle de grande langue développé par le projet ColossalChat.
Github
Recherche sémantique Openai pour toute liste de lecture YouTube - avec le podcast tout-in.
Github
Sketch est un assistant d'écriture de code AI pour les utilisateurs de Pandas qui comprend le contexte de vos données, améliorant considérablement la pertinence des suggestions. Sketch est utilisable en quelques secondes et ne nécessite pas d'ajouter un plugin à votre IDE.
Site web
Nous présentons Vicuna-13b, un chatbot open source formé par Fineding Llama sur les conversations partagées par l'utilisateur collectées auprès de Sharegpt. L'évaluation préliminaire utilisant GPT-4 en tant que juge montre que Vicuna-13b atteint plus de 90% _ la qualité d'Openai Chatgpt et Google Bard tout en surpassant d'autres modèles comme Llama et Stanford Alpaca dans plus de 90% de cas.
Site web
Présentation de l'agent à l'écosystème de la botte de foin. La mise en œuvre des agents est inspirée de deux articles: le document MRKL Systems (prononcé «miracle») et le document React. Si vous aimez lire des papiers, je recommande vivement ces deux-là. Ici, je vais expliquer comment nous introduisons cette fonctionnalité à la botte de foin.
Girhub
Une plate-forme ouverte pour la formation, le service et l'évaluation de chatbots basés sur un modèle de langue de grande langue.
Site web
LMQL est un langage de programmation pour l'interaction du modèle de langue.
Girhub
Modèle pour construire votre propre recherche de document de style Chatgpt personnalisé alimenté par Next.js, Openai et Supabase.
Github
Liaisons Python simples pour la bibliothèque llama.cpp.
Site web
Des modèles tels que Chatgpt, GPT-4 et Claude sont de puissants modèles de langage qui ont été affinés en utilisant une méthode appelée apprentissage du renforcement de la rétroaction humaine (RLHF) pour être mieux aligné sur la façon dont nous nous attendons à ce qu'ils se comportent et aimeraient les utiliser.
Site web
Assistant d'écriture de code AI pour les scientifiques des données, les ingénieurs et les analystes.
Github
Un code Visual Studio - Intégration de Chatgpt
Github
Le référentiel GitHub "GPTCache" est un système de cache haute performance pour des modèles de langage à grande échelle comme GPT. Il vise à réduire la latence d'inférence et le coût des modèles GPT en mettant en cache les résultats intermédiaires.
Blog
Le billet de blog traite de la mise en œuvre de la recherche sémantique à l'aide de Llamaindex et Langchain. Llamaindex est un système d'indexation rapide et économe en mémoire, tandis que Langchain est un modèle de langue qui peut convertir les requêtes en intégres pour la recherche sémantique.
Github
Auto-GPT est une application expérimentale open source présentant les capacités du modèle de langue GPT-4. Ce programme, motivé par le GPT-4, développe et gère de manière autonome les entreprises à augmenter la valeur nette. Comme l'un des premiers exemples de GPT-4 fonctionnant entièrement de manière autonome, Auto-GPT repousse les limites de ce qui est possible avec l'IA.
Site web
Dans ce didacticiel, nous apprendrons à s'entraîner et à affiner le lama (grand modèle de langue Meta Ai). Lit-Llama, une réécriture de Llama, peut exécuter l'inférence sur un GPU consommateur de 8 Go. Nous découvrirons également comment il utilise le tissu Lightning pour accélérer le code Pytorch.
Github
Il fournit une interface conviviale pour l'analyse et l'exploration des données interactives. Il permet aux utilisateurs de filtrer, trier et visualiser facilement les données, et comprend également des fonctionnalités pour l'apprentissage automatique et le traitement du langage naturel.
Github
Le référentiel GitHub "OpenPlayground" fournit un terrain de jeu interactif pour explorer les algorithmes d'apprentissage automatique et les réseaux de neurones. Il comprend des modèles et des ensembles de données prédéfinis, ainsi que la possibilité de télécharger des données et des modèles personnalisés.
Site web
Avec la pléthore des modèles de grande langue (LLMS) et des chatbots publiés semaine après semaine, souvent avec des affirmations grandioses de leur performance, il peut être difficile de filtrer les véritables progrès réalisés par la communauté open-source et quel modèle est l'état actuel de l'art. Le ? Open LLM Leadboard vise à suivre, classer et évaluer les LLM et les chatbots à mesure qu'ils sont publiés. ? Un avantage clé de ce classement est que quiconque de la communauté peut soumettre un modèle pour une évaluation automatisée sur le? Cluster GPU, tant qu'il est un? Transformers Modèle avec des poids sur le moyeu. L'évaluation des modèles avec des poids delta pour les modèles sous licence non commerciaux est également soutenue, comme LLAMA.
Les contributions à ce référentiel sont les bienvenues et encouragées! Si vous avez des applications ou des tutoriels intéressants qui utilisent des modèles de langue, n'hésitez pas à soumettre une demande de traction. Montons ensemble la puissance des modèles de langue AI!
Ce référentiel est concédé sous licence MIT.