Descarga backprompt - Descargar el código fuente backprompt

Español

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Inicio>Relacionado con la programación>Código Fuente de IA

backprompt

Código Fuente de IA

1.0.0

Descargar

backprompt

backprompt proporciona una estructura de datos que permite a un usuario construir dinámicamente las indicaciones mientras evita los cálculos de LLM repetidos.

Motivación

En muchas tareas a gran escala realizadas por LLMS, se usa un aviso particular muchas veces, una vez para cada instancia de la tarea. En casos como estos, la cantidad de cálculo realizada por las futuras llamadas de LLM puede reducirse al almacenar en caché y la reutilización de la representación de la solicitud de la LLM.

backprompt lleva a esta idea bien conocida un paso más allá al almacenar en caché las representaciones LLM de texto intermedio en el aviso. El almacenamiento en caché intermedio puede ser útil cuando uno necesita ajustar dinámicamente el indicador sin tener que volver a competir la representación de la LLM. backprompt abstrae el complejo proceso de construcción rápida y almacenamiento en caché como concatenación de cuerdas simple.

Uso

Consulte las demos/minimal_example.ipynb para un caso de uso más realista. Aquí hay una demostración de juguete:

 from transformers import AutoModelForCausalLM , AutoTokenizer
from backprompt import Text

# Load a GPT model and its tokenizer
model_name = 'gpt2'
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )
if tokenizer . pad_token is None :
    tokenizer . pad_token = tokenizer . eos_token
mt = ( model , tokenizer )

# Wrap strings in Text and construct them via concatenation
context = Text ( 'Hello there.' , mt )
choices = [ Text ( ' Senator' , mt ), Text ( ' General' , mt )]
endings = [ Text ( ' Amidala' , mt ), Text ( ' Kenobi...' , mt )]

texts = [ context + choice + ending for choice in choices for ending in endings ]
print ( texts [ - 1 ]. string )
# Hello there. General Kenobi...

# Get next-token logits by calling every text obj
# The punchline is that you don't have to worry about repeated computation
for text in texts :
    text ()

texts [ - 1 ]. model_repr [ 1 ]. logits [:, - 1 , :]

Instalación

 python -m pip install git+https://github.com/kddubey/backprompt.git

Cómo funciona

Si básicamente sabe cómo funciona BackProp (mire este video de YouTube), y básicamente sabe cómo funciona un modelo de idioma autorregresivo solo de decodificador (mire este video de YouTube), entonces sabe cómo funciona backprompt :-)

Analogías:

Backprop → Gradiente "intermedio" de una función
backprompt → Bloque de atención teclas y valores.
backprop → gradiente de una función
backprompt → logits de token.
Backprop → Regla de cadena
contratenación backprompt → tensor.

TODO: visualización de gráficos

Pruebas

TODO: expandir los casos de prueba

 pytest

Diádico

Investigación

¿Cuál es la complejidad computacional de usar claves y valores pasados WRT # tokens?
¿Los indicaciones de pocos disparos exhiben independencias interesantes? Si es así, uno podría construir indicaciones utilizando diferentes ejemplos sobre la mosca.

Código