Descargar rag gpt - Descargar el código fuente de rag gpt

rag gpt

Otro código fuente

v0.2.2

Descargar

Trapo

Inicie rápidamente un sistema inteligente de servicio al cliente con Flask, LLM, RAG, incluidos frontend, backend y consola de administración.
Demostración en vivo

Contenido

Características
Arquitectura de recuperación en línea
Implementar el servicio Rag-GPT
- Paso 1: Descargar código de repositorio
- Paso 2: Configurar variables de .env
  - Usando OpenAi como la base de LLM
  - Usando Zhipuai como la base de LLM
  - Usando Deepseek como la base de LLM
  - Usando Moonshot como la base de LLM
  - Usando LLM locales
- Paso 3: Implementar rag-gpt
  - Implementar rag-gpt usando Docker
  - Implementar Rag-GPT del código fuente
    - Configurar el entorno Python Running
      - Crear y activar un entorno virtual
      - Instalar dependencias con PIP
    - Crear base de datos SQLite
    - Iniciar el servicio
Configurar la consola de administración
- Inicie sesión en la consola de administración
- Importa tus datos
  - importar sitios web
  - importar URL aisladas
  - Importar archivos locales
- Prueba el chatbot
- Incrustarse en su sitio web
- Panel de control de la solicitud histórica del usuario
El frontend de la consola de administración y el chatbot
- consola de administración
- chatbot

Características

Soporte de LLM incorporado : Support LLMS basado en la nube y LLM locales.
Configuración rápida : permite el despliegue de robots de servicio de conversación a nivel de producción en solo cinco minutos.
Integración de base de conocimiento diversa : admite múltiples tipos de bases de conocimiento, incluidos sitios web, URL aisladas y archivos locales.
Configuración flexible : ofrece un backend fácil de usar equipado con configuraciones personalizables para la gestión simplificada.
Atractiva UI : presenta una interfaz de usuario personalizable y visualmente atractiva.

Arquitectura de recuperación en línea

Implementar el servicio Rag-GPT

Paso 1: Descargar código de repositorio

Clon el repositorio:

git clone https://github.com/open-kf/rag-gpt.git && cd rag-gpt

Paso 2: Configurar variables de .env

Antes de comenzar el servicio RAG-GPT, debe modificar las configuraciones relacionadas para que el programa se inicialice correctamente.

Usando OpenAi como la base de LLM

cp env_of_openai .env

Las variables en .env

LLM_NAME= " OpenAI "
OPENAI_API_KEY= " xxxx "
GPT_MODEL_NAME= " gpt-4o-mini "
MIN_RELEVANCE_SCORE=0.4
BOT_TOPIC= " xxxx "
URL_PREFIX= " http://127.0.0.1:7000/ "
USE_PREPROCESS_QUERY=1
USE_RERANKING=1
USE_DEBUG=0
USE_LLAMA_PARSE=0
LLAMA_CLOUD_API_KEY= " xxxx "
USE_GPT4O=0

No modifique LLM_NAME
Modifique el OPENAI_API_KEY con su propia clave. Inicie sesión en el sitio web de OpenAI para ver su clave API.
Actualice la configuración GPT_MODEL_NAME , reemplazando gpt-4o-mini con gpt-4-turbo o gpt-4o si desea usar GPT-4.
Cambie BOT_TOPIC para reflejar el nombre de su bot. Esto es muy importante, ya que se utilizará en Prompt Construction . Intente usar una palabra concisa y clara, como OpenIM , LangChain .
Ajuste URL_PREFIX para que coincida con el dominio de su sitio web. Esto es principalmente para generar enlaces de URL accesibles para archivos locales cargados. Como http://127.0.0.1:7000/web/download_dir/2024_05_20/d3a01d6a-90cd-4c2a-b926-9cda12466caf/openssl-cookbook.pdf .
Establezca USE_LLAMA_PARSE en 1 si desea usar LlamaParse .
Modifique el LLAMA_CLOUD_API_KEY con su propia clave. Inicie sesión en el sitio web de Llamacloud para ver su clave API.
Establezca USE_GPT4O a 1 si desea usar el modo GPT-4o .
Para obtener más información sobre los significados y los usos de constantes, puede verificar en el directorio server/constant .

Usando Zhipuai como la base de LLM

Si no puede usar los servicios API de OpenAI, considere usar Zhipuai como alternativa.

cp env_of_zhipuai .env

Las variables en .env

LLM_NAME= " ZhipuAI "
ZHIPUAI_API_KEY= " xxxx "
GLM_MODEL_NAME= " glm-4-air "
MIN_RELEVANCE_SCORE=0.4
BOT_TOPIC= " xxxx "
URL_PREFIX= " http://127.0.0.1:7000/ "
USE_PREPROCESS_QUERY=1
USE_RERANKING=1
USE_DEBUG=0
USE_LLAMA_PARSE=0
LLAMA_CLOUD_API_KEY= " xxxx "

No modifique LLM_NAME
Modifique el ZHIPUAI_API_KEY con su propia clave. Inicie sesión en el sitio web de Zhipuai para ver su clave API.
Actualice la configuración GLM_MODEL_NAME , la lista de modelos es ['glm-3-turbo', 'glm-4', 'glm-4-0520', 'glm-4-air', 'glm-4-airx', 'glm-4-flash'] .
Cambie BOT_TOPIC para reflejar el nombre de su bot. Esto es muy importante, ya que se utilizará en Prompt Construction . Intente usar una palabra concisa y clara, como OpenIM , LangChain .
Ajuste URL_PREFIX para que coincida con el dominio de su sitio web. Esto es principalmente para generar enlaces de URL accesibles para archivos locales cargados. Como http://127.0.0.1:7000/web/download_dir/2024_05_20/d3a01d6a-90cd-4c2a-b926-9cda12466caf/openssl-cookbook.pdf .
Establezca USE_LLAMA_PARSE en 1 si desea usar LlamaParse .
Modifique el LLAMA_CLOUD_API_KEY con su propia clave. Inicie sesión en el sitio web de Llamacloud para ver su clave API.
Para obtener más información sobre los significados y los usos de constantes, puede verificar en el directorio server/constant .

Usando Deepseek como la base de LLM

Si no puede usar los servicios API de OpenAI, considere usar Deepseek como alternativa.

Nota

Deepseek no proporciona una Embedding API , por lo que aquí utilizamos Embedding API de Zhipuai.

cp env_of_deepseek .env

Las variables en .env

LLM_NAME= " DeepSeek "
ZHIPUAI_API_KEY= " xxxx "
DEEPSEEK_API_KEY= " xxxx "
DEEPSEEK_MODEL_NAME= " deepseek-chat "
MIN_RELEVANCE_SCORE=0.4
BOT_TOPIC= " xxxx "
URL_PREFIX= " http://127.0.0.1:7000/ "
USE_PREPROCESS_QUERY=1
USE_RERANKING=1
USE_DEBUG=0
USE_LLAMA_PARSE=0
LLAMA_CLOUD_API_KEY= " xxxx "

No modifique LLM_NAME
Modifique el ZHIPUAI_API_KEY con su propia clave. Inicie sesión en el sitio web de Zhipuai para ver su clave API.
Modifique el DEEPKSEEK_API_KEY con su propia clave. Inicie sesión en el sitio web de Deepseek para ver su clave API.
Actualice la configuración de DEEPSEEK_MODEL_NAME si desea usar otros modelos de Deepseek.
Cambie BOT_TOPIC para reflejar el nombre de su bot. Esto es muy importante, ya que se utilizará en Prompt Construction . Intente usar una palabra concisa y clara, como OpenIM , LangChain .
Ajuste URL_PREFIX para que coincida con el dominio de su sitio web. Esto es principalmente para generar enlaces de URL accesibles para archivos locales cargados. Como http://127.0.0.1:7000/web/download_dir/2024_05_20/d3a01d6a-90cd-4c2a-b926-9cda12466caf/openssl-cookbook.pdf .
Establezca USE_LLAMA_PARSE en 1 si desea usar LlamaParse .
Modifique el LLAMA_CLOUD_API_KEY con su propia clave. Inicie sesión en el sitio web de Llamacloud para ver su clave API.
Para obtener más información sobre los significados y los usos de constantes, puede verificar en el directorio server/constant .

Usando Moonshot como la base de LLM

Si no puede usar los servicios API de OpenAI, considere usar MoonShot como alternativa.

Nota

Moonshot no proporciona una Embedding API , por lo que aquí utilizamos Embedding API de Zhipuai.

cp env_of_moonshot .env

Las variables en .env

LLM_NAME= " Moonshot "
ZHIPUAI_API_KEY= " xxxx "
MOONSHOT_API_KEY= " xxxx "
MOONSHOT_MODEL_NAME= " moonshot-v1-8k "
MIN_RELEVANCE_SCORE=0.4
BOT_TOPIC= " xxxx "
URL_PREFIX= " http://127.0.0.1:7000/ "
USE_PREPROCESS_QUERY=1
USE_RERANKING=1
USE_DEBUG=0
USE_LLAMA_PARSE=0
LLAMA_CLOUD_API_KEY= " xxxx "

No modifique LLM_NAME
Modifique el ZHIPUAI_API_KEY con su propia clave. Inicie sesión en el sitio web de Zhipuai para ver su clave API.
Modifique el MOONSHOT_API_KEY con su propia clave. Inicie sesión en el sitio web de Moonshot para ver su clave API.
Actualice la configuración MOONSHOT_MODEL_NAME si desea usar otros modelos de MoonShot.
Cambie BOT_TOPIC para reflejar el nombre de su bot. Esto es muy importante, ya que se utilizará en Prompt Construction . Intente usar una palabra concisa y clara, como OpenIM , LangChain .
Ajuste URL_PREFIX para que coincida con el dominio de su sitio web. Esto es principalmente para generar enlaces de URL accesibles para archivos locales cargados. Como http://127.0.0.1:7000/web/download_dir/2024_05_20/d3a01d6a-90cd-4c2a-b926-9cda12466caf/openssl-cookbook.pdf .
Establezca USE_LLAMA_PARSE en 1 si desea usar LlamaParse .
Modifique el LLAMA_CLOUD_API_KEY con su propia clave. Inicie sesión en el sitio web de Llamacloud para ver su clave API.
Para obtener más información sobre los significados y los usos de constantes, puede verificar en el directorio server/constant .

Usando LLM locales

Si su base de conocimiento implica información confidencial y prefiere no usar LLM basados en la nube, considere usar Ollama para implementar modelos grandes localmente.

Nota

Primero, consulte Ollama para instalar Ollama y descargue el modelo de incrustación mxbai-embed-large y el modelo LLM como llama3 .

cp env_of_ollama .env

Las variables en .env

LLM_NAME= " Ollama "
OLLAMA_MODEL_NAME= " xxxx "
OLLAMA_BASE_URL= " http://127.0.0.1:11434 "
MIN_RELEVANCE_SCORE=0.4
BOT_TOPIC= " xxxx "
URL_PREFIX= " http://127.0.0.1:7000/ "
USE_PREPROCESS_QUERY=1
USE_RERANKING=1
USE_DEBUG=0
USE_LLAMA_PARSE=0
LLAMA_CLOUD_API_KEY= " xxxx "

No modifique LLM_NAME
Actualice la configuración OLLAMA_MODEL_NAME , seleccione un modelo apropiado de la biblioteca Ollama.
Si ha cambiado el IP:PORT predeterminado al iniciar Ollama , actualice OLLAMA_BASE_URL . Preste especial atención, solo ingrese el IP (dominio) y el puerto aquí, sin agregar un URI.
Cambie BOT_TOPIC para reflejar el nombre de su bot. Esto es muy importante, ya que se utilizará en Prompt Construction . Intente usar una palabra concisa y clara, como OpenIM , LangChain .
Ajuste URL_PREFIX para que coincida con el dominio de su sitio web. Esto es principalmente para generar enlaces de URL accesibles para archivos locales cargados. Como http://127.0.0.1:7000/web/download_dir/2024_05_20/d3a01d6a-90cd-4c2a-b926-9cda12466caf/openssl-cookbook.pdf .
Establezca USE_LLAMA_PARSE en 1 si desea usar LlamaParse .
Modifique el LLAMA_CLOUD_API_KEY con su propia clave. Inicie sesión en el sitio web de Llamacloud para ver su clave API.
Para obtener más información sobre los significados y los usos de constantes, puede verificar en el directorio server/constant .

Paso 3: Implementar rag-gpt

Implementar rag-gpt usando Docker

Nota

Al implementar con Docker, preste especial atención al host de URL_PREFIX en el archivo .env . Si usa Ollama , también preste especial atención al anfitrión de Ollama_Base_url en el archivo .env . Deben usar la dirección IP real de la máquina host.

docker-compose up --build

Implementar Rag-GPT del código fuente

Nota

Utilice Python versión 3.10.x o superior.

Configurar el entorno Python Running

Se recomienda instalar dependencias relacionadas con Python en un entorno virtual de Python para evitar afectar las dependencias de otros proyectos.

Crear y activar un entorno virtual

Si aún no ha creado un entorno virtual, puede crear uno con el siguiente comando:

python3 -m venv myenv

Después de la creación, active el entorno virtual:

 source myenv/bin/activate

Instalar dependencias con PIP

Una vez que se activa el entorno virtual, puede usar pip para instalar las dependencias requeridas.

pip install -r requirements.txt

Crear base de datos SQLite

El servicio RAG-GPT utiliza SQLite como su DB de almacenamiento. Antes de comenzar el servicio RAG-GPT, debe ejecutar el siguiente comando para inicializar la base de datos y agregar la configuración predeterminada para la consola de administración.

python3 create_sqlite_db.py

Iniciar el servicio

Si ha completado los pasos anteriores, puede intentar iniciar el servicio RAG-GPT ejecutando el siguiente comando.

Iniciar proceso único:

python3 rag_gpt_app.py

Iniciar múltiples procesos:

sh start.sh

Nota

El puerto de servicio para RAG-GPT es 7000 . Durante la primera prueba, intente no cambiar el puerto para que pueda experimentar rápidamente todo el proceso de producto.
Recomendamos comenzar el servicio RAG-GPT usando start.sh en modo multiprocesado para una experiencia de usuario más suave.

Configurar la consola de administración

Inicie sesión en la consola de administración

Acceda a la consola de administración a través del enlace http://your-server-ip:7000/open-kf-admin/ para llegar a la página de inicio de sesión. El nombre de usuario y la contraseña predeterminados son admin y open_kf_AIGC@2024 (se puede verificar en create_sqlite_db.py ).

Después de iniciar sesión con éxito, podrá ver la página de configuración de la consola de administración.

En la página http://your-server-ip:7000/open-kf-admin/#/ , puede establecer las siguientes configuraciones:

Elija la base LLM, actualmente solo la opción gpt-3.5-turbo está disponible, que se expandirá gradualmente.
Mensajes iniciales
Mensajes sugeridos
Marcador de posición de mensaje
Imagen de perfil (cargar una imagen)
Nombre para mostrar
Icono de chat (cargar una imagen)

Importa tus datos

Importar sitios web

Después de enviar la URL del sitio web, una vez que el servidor recupera la lista de todas las URL de la página web a través del rastreo, puede seleccionar las URL de la página web que necesita como base de conocimiento (todas seleccionadas de forma predeterminada). Se Recorded el Status inicial.

Puede actualizar activamente la página http://your-server-ip:7000/open-kf-admin/#/source en su navegador para obtener el progreso del procesamiento de URL de la página web. Después de que el contenido de la URL de la página web se ha rastreado y se completen el cálculo y el almacenamiento de la incrustación, puede ver el Size correspondiente en la consola de administración, y el Status también se actualizará a Trained .

Al hacer clic en la URL de una página web, revela en cuántas subpáginas se divide la página web y el tamaño de texto de cada subpágina.

Hacer clic en una subpágina le permite ver su contenido de texto completo. Esto será muy útil para verificar los efectos durante el proceso de prueba de experiencia.

Importar URL aisladas

Recopile las URL de las páginas web requeridas. Puede enviar hasta 10 URL de página web a la vez, y estas páginas pueden ser de diferentes dominios.

Importar archivos locales

Cargue los archivos locales requeridos. Puede cargar hasta 10 archivos a la vez, y cada archivo no puede exceder 30MB . Actualmente se admiten los siguientes tipos de archivos: [".txt", ".md", ".pdf", ".epub", ".mobi", ".html", ".docx", ".pptx", ".xlsx", ".csv"] .

Prueba el chatbot

Después de importar datos del sitio web en la consola de administración, puede experimentar el servicio de chatbot a través del enlace http://your-server-ip:7000/open-kf-chatbot/ .

Incrustarse en su sitio web

A través del enlace de la consola de administración http://your-server-ip:7000/open-kf-admin/#/embed , puede ver el tutorial detallado para configurar el iframe en su sitio web.

Openim chatbot

Panel de control de la solicitud histórica del usuario

A través del enlace de la consola de administración http://your-server-ip:7000/open-kf-admin/#/dashboard , puede ver los registros de solicitud históricos de todos los usuarios dentro de un rango de tiempo especificado.

El frontend de la consola de administración y el chatbot

El servicio Rag-GPT integra 2 módulos frontend, y su información del código fuente es la siguiente:

consola de administración

Repositorio de código

Una interfaz de administración intuitiva basada en la web para el servicio Smart QA, que ofrece un control integral sobre el contenido, la configuración y las interacciones del usuario. Permite una gestión sin esfuerzo de la base de conocimiento, monitoreo en tiempo real de consultas y comentarios, y una mejora continua basada en información del usuario.

chatbot

Repositorio de código

Una interfaz HTML5 para el servicio Smart QA diseñado para una fácil integración en sitios web a través de iframe, proporcionando a los usuarios acceso directo a una base de conocimiento personalizada sin salir del sitio, mejorando la funcionalidad y la resolución inmediata de consultas.

Expandir

Información adicional

Versión v0.2.2
Tipo Otro código fuente
Fecha de actualización 2025-03-11
tamaño 28.66MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
La última versión de GPT cine y televisión.

2023-10-30

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo