Descarga Recurrent LLM - Descargar el código fuente Recurrent LLM

Recurrent LLM

Otro código fuente

1.0.0

Descargar

Recurrente-llm

La implementación de documento de código abierto LLM:

RecurrentGPT: generación interactiva de texto (arbitrariamente) largo .

[Paper] [ARXIV] [Huggingface] [Oficial]

El contexto de tamaño fijo del transformador hace que los modelos GPT no puedan generar texto arbitrariamente largo. En este artículo, introducimos recurrentGPT, un simulacro basado en el lenguaje del mecanismo de recurrencia en RNN. RecurrentGPT se basa en un modelo de lenguaje grande (LLM) como ChatGPT y utiliza lenguaje natural para simular el mecanismo de memoria a largo plazo en un LSTM. En cada paso de tiempo, RecurrentGPT genera un párrafo de texto y actualiza su memoria de término a largo plazo basada en el lenguaje almacenada en el disco duro y el aviso, respectivamente. Este mecanismo de recurrencia permite que recurrentegpt genere textos de longitud arbitraria sin olvidar. Dado que los usuarios humanos pueden observar y editar fácilmente los recuerdos del lenguaje natural, RecurrentTPPT es interpretable y permite la generación interactiva de texto largo. RecurrentGPT es un paso inicial hacia los sistemas de escritura asistidos por computadora de próxima generación más allá de las sugerencias de edición locales. Además de producir contenido generado por IA (AIGC), también demostramos la posibilidad de usar recurrentGPT como una ficción interactiva que interactúa directamente con los consumidores. Llamamos a este uso de modelos generativos por `` AI como contenido '' (AIAC), que creemos que es la próxima forma de AIGC convencional. Además, demostramos la posibilidad de usar recurrentTPPT para crear ficción interactiva personalizada que interactúe directamente con los lectores en lugar de interactuar con los escritores. En términos más generales, RecurrentGPT demuestra la utilidad de las ideas de endeudamiento de los diseños de modelos populares en ciencias cognitivas y aprendizaje profundo para solicitar LLM.

Transformador 的固定尺寸上下文使得 gpt 模型无法生成任意长的文本。在本文中，我们介绍了 recurrentgpt ，一个基于语言的模拟 rnns 中的递归机制。recurrentgpt 建立在大型语言模型（ llm ）之上，如 chatgpt ，并使用自然语言来模拟 lstm 中的长短时记忆机制。在每个时间段， recurrentgpt 生成一段文字，并更新其基于语言的长短时记忆分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机分别存储在硬盘和提示器上。这种递归机制使 recurrentgpt 能够生成任意长度的文本而不被遗忘。由于人类用户可以很容易地观察和编辑自然语言记忆，因此 recurrentgpt 是可解释的，并能互动地生成长文本。Recurrentgpt 是朝着超越本地编辑建议的下一代计算机辅助写作系统迈出的第一步。除了制作人工智能生成的内容（ aigc），我们还展示了使用 recurrentgpt 作为直接与消费者互动的互动小说的可能性。我们称这种生成模型的使用为"Ai como contenido" （aiac），我们认为这是传统 aigc 的下一个形式。我们进一步展示了使用 recurrentgpt 创造个性化互动小说的可能性，这种小说直接与读者互动，而不是与作者互动。更广泛地说， recurrentgpt 证明了从认知科学和深度学习中流行的模型设计中借用思想来提示 llm 的效用。

Tabla de contenido

Recurrente-llm
Tabla de contenido
Requisitos
Configuración
- Configuración global
- Opciones de LLM compatibles
  - Operai Chatgpt
  - Vicuna
  - Chatglm
  - Baichuan
  - Águila
  - Halcón
Uso
- Iniciar servidor web
Webui
Historia de estrella
Licencia

Requisitos

 pip install transformers@git+https://github.com/huggingface/transformers.git
pip install peft@git+https://github.com/huggingface/peft.git
pip install accelerate@git+https://github.com/huggingface/accelerate.git
pip install bitsandbytes==0.39.0

pip install -U flagai
pip install bminf

Configuración

Configuración global

[global_config.py]

 lang_opt = "zh" #  zh or en. make English or Chinese Novel
llm_model_opt = "openai" # default is openai, it also can be other open-source LLMs as below

Opciones de LLM compatibles

Operai Chatgpt

Debe aplicar primero una llave API de OpenAI. entonces

 export OPENAI_API_KEY = "your key"

Vicuna

Descarga el modelo Vicuna. y configelo en modelos/vicuna_bin.py

Chatglm

 tokenizer = AutoTokenizer . from_pretrained ( model_name_or_path , trust_remote_code = True )
model_config = AutoConfig . from_pretrained ( model_name_or_path , trust_remote_code = True )
model = AutoModel . from_pretrained ( model_name_or_path , config = model_config , trust_remote_code = True )

Baichuan

 tokenizer = AutoTokenizer . from_pretrained ( "baichuan-inc/baichuan-7B" , trust_remote_code = True )
model = AutoModelForCausalLM . from_pretrained ( "baichuan-inc/baichuan-7B" , device_map = "auto" , trust_remote_code = True )

Águila

 loader = AutoLoader (
        "lm" ,
        model_dir = state_dict ,
        model_name = model_name ,
        use_cache = True ,
        fp16 = True )
model = loader . get_model ()
tokenizer = loader . get_tokenizer ()
model . eval ()

Si desea usar Bminf, agregue el código como se muestra a continuación:

 with torch . cuda . device ( 0 ):
    model = bminf . wrapper ( model , quantization = False , memory_limit = 2 << 30 )

Halcón

Uso

Iniciar servidor web

 python gradio_server.py

Webui

Historia de estrella

Donación

Si este proyecto lo ayuda a reducir el tiempo para desarrollarse, puede darme una taza de café :)

Alipay (支付宝)

Wechatpay (微信)

Licencia

MIT © Kun

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-03
tamaño 690.37KB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo