¡Bienvenido a la exhibición de modelos de idiomas grandes! Este repositorio es una colección curada de aplicaciones interesantes, casos de uso , repositorios de GitHub y tutoriales que utilizan modelos de idiomas de última generación, como GPT-3 y otros modelos de idiomas grandes. Ya sea que sea un entusiasta del lenguaje, un investigador de aprendizaje automático o simplemente alguien interesado en las capacidades de la IA, este repositorio es el lugar perfecto para explorar el mundo del procesamiento del lenguaje natural y ver de qué son capaces estos poderosos modelos.
En este repositorio, encontrará una variedad de ejemplos y demostraciones de modelos de lenguaje utilizados para la generación de texto, búsqueda, respuesta de preguntas y más. También encontrará tutoriales y recursos para construir sus propias aplicaciones, así como enlaces a otros repositorios y recursos para un mayor aprendizaje.
Github
Este script de Python es un ejemplo de un sistema de gestión de tareas con IA. El sistema utiliza bases de datos Operai y vectoras como Chroma o Weaviate para crear, priorizar y ejecutar tareas. La idea principal detrás de este sistema es que crea tareas basadas en el resultado de tareas anteriores y un objetivo predefinido. Luego, el script utiliza las capacidades de procesamiento del lenguaje natural de OpenAI (PNL) para crear nuevas tareas basadas en el objetivo, y croma/tejido para almacenar y recuperar los resultados de la tarea para el contexto. Esta es una versión reducida del agente autónomo impulsado por la tarea original (28 de marzo de 2023).
Github
Organizador de memoria episódica ondulante (REMO) para AI AI AI SystemsRemo: organizador de memoria episódica recursiva. Gestión de memoria eficiente y escalable. Organiza datos de conversación en rangos taxonómicos. Cada rango grupos de elementos semánticamente similares. Herramienta potente para sistemas AI conscientes de contexto. Mejora las capacidades de conversación, la precisión del recuerdo.
Github
Window AI es una extensión del navegador que le permite configurar modelos AI en un solo lugar y usarlos en la web. Para los desarrolladores: Haga fácilmente aplicaciones de múltiples modelos libres de costos y límites de API, solo use la biblioteca inyectada Window.Ai. Aproveche la IA descentralizada para los usuarios: controle la IA que usa en la web, ya sea externa (como OpenAI), proxied o local, para proteger la privacidad. Para los proveedores de modelos: conecte a un ecosistema de usuarios sin exigir a los desarrolladores que cambien sus aplicaciones.
Github
OpenChatkit proporciona una base poderosa y de código abierto para crear chatbots de propósito especializado y general para diversas aplicaciones. El kit incluye un modelos de lenguaje ajustados a instrucciones, un modelo de moderación y un sistema de recuperación extensible para incluir respuestas actualizadas de repositorios personalizados.
Github
Alpaca-Turbo es un frontend para usar modelos de idiomas grandes que se pueden ejecutar localmente sin requerido mucha configuración. Es una interfaz de usuario web fácil de usar para Llama.cpp, con características únicas que lo hacen destacar de otras implementaciones. El objetivo es proporcionar una experiencia de chat perfecta que sea fácil de configurar y usar, sin sacrificar la velocidad o la funcionalidad.
Github
Al construir aplicaciones de chat usando LLMS, el manejo de la memoria es algo que debe construirse cada vez. Motorhead es un servidor para ayudar con ese proceso.
Github
CHATGPT y varios modelos de idiomas grandes (LLMS) cuentan con una increíble versatilidad, lo que permite el desarrollo de una amplia gama de aplicaciones. Sin embargo, a medida que su aplicación crece en popularidad y encuentra niveles de tráfico más altos, los gastos relacionados con las llamadas de API de LLM pueden volverse sustanciales. Además, los servicios de LLM pueden exhibir tiempos de respuesta lentos, especialmente cuando se trata de un número significativo de solicitudes. Para abordar este desafío, hemos creado GPTCache, un proyecto dedicado a construir un caché semántico para almacenar respuestas LLM.
Github
Este script de Python es un ejemplo de un agente autónomo impulsado por LLM. El sistema utiliza la API de OpenAI para crear y ejecutar tareas. La idea central del proyecto es proporcionar al asistente las herramientas que necesita para hacer cualquier tarea, si es lo suficientemente inteligente. Puede ejecutar arbitrariamente el código y controlar su propio flujo y memoria, para un agente suficientemente inteligente, ya sea por la capacitación, el ajuste fino o la optimización rápida, esto debería ser suficiente (si es posible).
Github
Eval (agente versátil elástico con Langchain) ejecutará todas sus solicitudes. ¡Al igual que un método de evaluación!
Blog
Una pregunta que me han hecho mucho recientemente es cómo los grandes modelos de idiomas (LLM) cambiarán los flujos de trabajo de aprendizaje automático. Después de trabajar con varias compañías que trabajan con aplicaciones de LLM y personalmente bajando por un agujero de conejo construyendo mis aplicaciones ...
Github
Chameleon es un marco de razonamiento de composición plug-and-play que aumenta los LLM con varios tipos de herramientas. Chameleon sintetiza programas para componer diversas herramientas, incluidos los modelos LLM, los modelos de visión en el estante, los motores de búsqueda web, las funciones de Python y los módulos basados en reglas adaptados a los intereses de los usuarios. Construido sobre un LLM como un planificador de lenguaje natural, Chameleon infiere la secuencia apropiada de herramientas para componer y ejecutar para generar una respuesta final.
Github
Una plataforma abierta para capacitar, servir y evaluar modelos de idiomas grandes. Libere el repositorio para Vicuna y Fastchat-T5.
Github
Presentamos Vicuna-13b, un chatbot de código abierto entrenado por afinando la llama en las conversaciones compartidas de usuarios recopiladas de ShareGPT. La evaluación preliminar utilizando GPT-4 como juez muestra que Vicuna-13b logra más del 90%* calidad de Operai Chatgpt y Google Bard, al tiempo que supera a otros modelos como Llama y Stanford Alpaca en más del 90%* de casos.
Github
Desbloquee el potencial de GPT-4 con el Sr. Ranedeer AI Tutor, un indicador personalizable que ofrece experiencias de aprendizaje personalizadas para usuarios con diversas necesidades e intereses.
Blog
El Proyecto Redpajama tiene como objetivo crear un conjunto de modelos líderes de código abierto y comprender rigurosamente los ingredientes que producen un buen rendimiento.
Github
Estamos lanzando nuestra vista previa pública de Openllama, una reproducción de código abierto con licencia permisiva del Llama 7B de Meta AI capacitado en el conjunto de datos de Redpajama. Los pesos de nuestro modelo pueden servir como la caída de reemplazo de Llama 7B en las implementaciones existentes. También proporcionamos una variante 3B más pequeña del modelo de llama.
Github
¡Sumérgete en una experiencia de aprendizaje más interactiva con la nueva función de chat del conocimiento! Participe en conversaciones dinámicas con sus proyectos y fuentes, aprovechando el poder de los grandes modelos de idiomas. Haga preguntas, explore conceptos y profundice su comprensión, todo dentro de una interfaz de chat intuitiva.
Github
MLC LLM es una solución universal que permite que los modelos de idioma se implementen de forma nativa en un conjunto diverso de backends de hardware y aplicaciones nativas, además de un marco productivo para que todos optimicen aún más el rendimiento del modelo para sus propios casos de uso.
Github
La inteligencia artificial interactiva Google-Bard lanzada por Google AI es oficialmente apoya el inglés, coreano y japonés. Por lo tanto, compartimos las indicaciones para un mejor uso de Google Bard. Amazing-Bard-ProMpts es una bifurcación de Awesome-ChatGPT-ProMpts y traducido con el motor Traducado de Google. Los contribuyentes pueden modificar archivos CSV para editar, revisar y sugerir indicaciones adecuadas para Google Bard.
Github
El libro de cocina de OpenAI comparte código de ejemplo para lograr tareas comunes con la API de OpenAI.
Github
Los modelos generativos de idiomas de IA como ChatGPT están cambiando la forma en que los humanos y la IA interactúan y trabajan juntos, pero ¿cómo funcionan realmente estos modelos? Aprenda todo lo que necesita saber sobre la IA generativa moderna para el lenguaje en esta guía simple.
Github
Superagent es una herramienta poderosa que simplifica la configuración y la implementación de agentes LLM (modelo de lenguaje grande) a la producción. Proporciona una gama de características y funcionalidades para facilitar que los desarrolladores construyan, administren e implementen agentes de IA en la producción, incluidas características como la memoria incorporada y la recuperación de documentos a través de DBS Vector, herramientas potentes, webhooks, trabajos cron, etc.
Github
Plataforma de desarrollador -primero Agente: implementar, probar y monitorear a los agentes de IA
Github
Zeno Build es una herramienta para los desarrolladores que desean construir, comparar e iterar rápidamente en aplicaciones utilizando modelos de idiomas grandes.
Github
Contratan simultáneamente con Chatgpt, Bing Chat, Bard, Alpaca, Vincuna, Claude, Chatglm, Moss, Iflytek Spark, Ernie y más, descubren las mejores respuestas.
Github
Un backend de Fastapi y una interfaz de usuario aerodinámica para privategpt. Interactúa en privado con sus documentos como una aplicación web utilizando el poder de GPT, 100% privado, sin filtraciones de datos.
Github
En Google, había un documento organizado por Jeff Dean, el ingeniero legendario, llamado números que todo ingeniero debería saber. Es realmente útil tener un conjunto similar de números para que los desarrolladores de LLM sepan que son útiles para los cálculos de los envolventes. Aquí compartimos números particulares que usamos en cualquier escala, por qué el número es importante y cómo usarlo para su ventaja.
Github
En este tutorial, aprenderá cómo ajustar e implementar la base de rosquillas para el entorno de documentos/emparejamiento de documentos utilizando transformadores faciales para abrazos y Amazon Sagemaker.
Sitio web
Pandagpt es un modelo de seguimiento de instrucciones de uso general que puede ver y escuchar. Nuestros experimentos piloto muestran que Pandagpt puede realizar tareas complejas, como la generación de descripción de imagen detallada, escribir historias inspiradas en videos y responder preguntas sobre audios.
Github
Construir aplicaciones con LLM a través de la composición
Github
Permite escalar la API CHATGPT a múltiples sesiones simultáneas con memoria contextual y adaptativa infinita alimentada por GPT y Redis DataStore.
Github
Esta es una colección de ejemplos de inmediato que se utilizará con el modelo CHATGPT.
Girhub
Jarvis, un sistema para conectar LLMS con ML Community
Github
Una biblioteca incluida en baterías para construir un software con AI. El trabajo de Marvin es integrar la IA directamente en su base de código haciendo que se vea y se sienta como cualquier otra función.
Github
Llamaindex (índice GPT) es un proyecto que proporciona una interfaz central para conectar sus LLM con datos externos.
Github
Generación de ontologías y bases de conocimiento utilizando GPT. Una herramienta de extracción de conocimiento que utiliza un modelo de lenguaje grande para extraer información semántica del texto
Blog
Construir un chatbot se ha convertido en una habilidad candente, y con el lanzamiento de ChatGPT vemos una gran cantidad de aplicaciones de chat.
Blog
Entrenamiento eficiente de modelos de idiomas grandes con Lora y cara de abrazo
Github
ChatDoctor: un modelo de chat médico ajustado en el modelo de llama utilizando conocimiento de dominio médico
Github
GPT4All: un ecosistema de chatbots de código abierto entrenados en una colección masiva de datos de asistente limpio que incluyen código, historias y diálogo. Demostración, datos y código para entrenar un modelo de idioma grande al estilo asistente con ~ 800k GPT-3.5-Turbo Generations basadas en LLAMA
Github
Este repositorio contiene el código experimental para reproducir los resultados en la fusión del conocimiento de la datos mediante la fusión de los pesos de los modelos de idiomas, un documento que se publicará durante la Undécima Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR 2023), que se llevará a cabo del 1 al 5 de mayo de 2023 en Kigali, Ruanda.
Github
Guías, documentos, conferencias, cuadernos y recursos para ingeniería rápida
Sitio web
Este es un prototipo a medias que le "ayuda" a extraer datos estructurados del texto utilizando modelos de lenguaje grandes (LLM)
Github
Un método para corregir GPT-3 después de la implementación con la retroalimentación del usuario, sin volver a entrenar.
Blog
Este artículo se centra más en cómo el chatGPT funciona a nivel conceptual y cómo se compara con los gráficos de conocimiento.
Github
Use la nueva API GPT-4 para crear un chatgpt chatbot para múltiples archivos PDF grandes.
Github
Este repositorio es ayudarlo a construir un poderoso sistema de respuesta de preguntas que pueda responder con precisión las preguntas combinando Langchain y los modelos de idiomas grandes (LLM), incluidos los modelos GPT3 de OpenAI.
Github
ColossalChat es el proyecto para implementar LLM con RLHF, impulsado por el proyecto Colossal-AI.Coati significa Colossalai Talking Intelligence. Es el nombre del módulo implementado en este proyecto y también es el nombre del modelo de lenguaje grande desarrollado por el proyecto ColossalChat.
Github
Búsqueda semántica con energía Operai para cualquier lista de reproducción de YouTube, con el podcast All-in.
Github
Sketch es un asistente de escritura de código AI para usuarios de Pandas que comprende el contexto de sus datos, mejorando en gran medida la relevancia de las sugerencias. El boceto se puede utilizar en segundos y no requiere agregar un complemento a su IDE.
Sitio web
Presentamos Vicuna-13b, un chatbot de código abierto entrenado por afinando la llama en las conversaciones compartidas de usuarios recopiladas de ShareGPT. La evaluación preliminar utilizando GPT-4 como juez muestra que Vicuna-13b logra más del 90%_ Calidad de Operai Chatgpt y Google Bard, al tiempo que supera a otros modelos como Llama y Stanford Alpaca en más del 90%de casos.
Sitio web
Introducción al agente al ecosistema de Haystack. La implementación de los agentes se inspira en dos documentos: el documento de sistemas MRKL (pronunciado 'milagro') y el documento React. Si te gusta leer documentos, te recomiendo estos dos. Aquí, explicaré cómo estamos presentando esta funcionalidad a Haystack.
Girhub
Una plataforma abierta para capacitar, servir y evaluar chatbots de modelos de lenguaje grande.
Sitio web
LMQL es un lenguaje de programación para la interacción del modelo de lenguaje.
Girhub
Plantilla para construir su propia búsqueda de Doc de estilo chatgpt personalizada alimentada por Next.js, OpenAi y Supabase.
Github
Python Bindings simples para Llama.CPP Biblioteca.
Sitio web
Modelos como ChatGPT, GPT-4 y Claude son modelos de lenguaje poderosos que han sido ajustados utilizando un método llamado aprendizaje de refuerzo de la retroalimentación humana (RLHF) para estar mejor alineados con la forma en que esperamos que se comporten y les gustaría usarlos.
Sitio web
Asistente de escritura de código AI para científicos de datos, ingenieros y analistas. Obtenga finalizaciones y sugerencias de código a medida que escribe.
Github
Un código de Visual Studio - Integración de chatgpt
Github
El repositorio de GitHub "GPTCACHE" es un sistema de caché de alto rendimiento para modelos de lenguaje a gran escala como GPT. Su objetivo es reducir la latencia de inferencia y el costo de los modelos GPT al almacenar en caché los resultados intermedios.
Blog
La publicación del blog discute la implementación de la búsqueda semántica utilizando llameAndex y Langchain. Llamaindex es un sistema de indexación de eficiencia rápida y de memoria, mientras que Langchain es un modelo de lenguaje que puede convertir consultas en insertos para la búsqueda semántica.
Github
Auto-GPT es una aplicación experimental de código abierto que muestra las capacidades del modelo de idioma GPT-4. Este programa, impulsado por GPT-4, desarrolla y administra de forma autónoma las empresas para aumentar el patrimonio neto. Como uno de los primeros ejemplos de GPT-4 que se ejecuta completamente autónomo, Auto-GPT empuja los límites de lo que es posible con AI.
Sitio web
En este tutorial, aprenderemos cómo entrenar y ajustar a Llama (Meta AI de modelo de lenguaje grande). Lit-Llama, una reescritura de Llama, puede ejecutar inferencia en una GPU de consumo de 8 GB. También descubriremos cómo utiliza la tela Lightning para acelerar el código Pytorch.
Github
Proporciona una interfaz fácil de usar para el análisis y exploración de datos interactivos. Permite a los usuarios filtrar, clasificar y visualizar fácilmente datos, y también incluye la funcionalidad para el aprendizaje automático y el procesamiento del lenguaje natural.
Github
El repositorio de GitHub "OpenPlayground" proporciona un patio de recreo interactivo para explorar algoritmos de aprendizaje automático y redes neuronales. Incluye modelos y conjuntos de datos preconstruidos, así como la capacidad de cargar datos y modelos personalizados.
Sitio web
Con la gran cantidad de modelos de idiomas grandes (LLM) y chatbots que se lanzan semana tras semana, a menudo con grandiosas afirmaciones de su rendimiento, puede ser difícil filtrar el progreso genuino que realiza la comunidad de código abierto y qué modelo es el estado actual de la técnica. El ? Open LLM Raeperboard tiene como objetivo rastrear, clasificar y evaluar LLMS y Chatbots a medida que se lanzan. ? Una ventaja clave de esta tabla de clasificación es que cualquier persona de la comunidad puede enviar un modelo para la evaluación automatizada en el? Clúster de GPU, siempre que sea un? Modelo de transformadores con pesas en el centro. También se admite la evaluación de modelos con peso delta para modelos con licencia no comercial, como LLAMA.
¡Las contribuciones a este repositorio son bienvenidas y alentadas! Si tiene alguna aplicación o tutorial interesante que usen modelos de idioma, no dude en enviar una solicitud de extracción. ¡Muestemos juntos el poder de los modelos de idiomas AI!
Este repositorio tiene licencia bajo la licencia MIT.