Descarga Conformers - Descarga del código fuente Conformers

Conformers

Código Fuente de IA

1.0.0

Descargar

Conformadores

Esta es una implementación no oficial del modelado de lenguaje conforme en papel. Encontré el papel interesante y quería jugar con él. Todavía en un estado muy temprano, la única garantía estadística rigurosa actualmente es que hay errores y malentendidos. Disculpe el estado del código actual. ¡Lo limpiaré, lo prometo!

Estado

Implementación inicial realizada
Pruebas
Procedimiento de prueba de Pareto (en lugar de la búsqueda actual de la red + combo de Bonferroni)
Selección de componentes
Paquete PYPI
Experimentos

Cambios del papel

El muestreo ya no es codicioso: los autores afirman usar un muestreo codicioso (muestreo de transformador predeterminado), pero esto dará como resultado la misma salida para todas las muestras.
La selección de la función de admisión, el umbral de la función de admisión y Epsilon parece ser muy sensible. En el documento, los autores seleccionan los umbrales de la función de admisión dependiente de la tarea (que supongo que derivaron experimentalmente) y prueban diferentes valores de Epsilon. En esta implementación intentaré introducir funciones de admisión más genéricas.

Instalación

Todavía no hay paquete PYPI disponible. Para instalar, clona el repositorio y ejecute

pip install poetry
poetry install

Uso

La API de Python aún no está puesta en piedra, pero el objetivo es facilitar experimentar con diferentes funciones de admisión, confianza grupal y rechazo. Potencialmente algunas combinaciones bastante interesantes con el reciente documento del modelo de idioma CFG. A continuación se muestra un ejemplo con GPT2.

 from conformer import Calibrator , Sampler , Components
import torch
from random import randint


x = [
    "What is the capital of France?" ,
    "Which prime-minster of the UK was the biggest nob?" ,
] 

from transformers import GPT2LMHeadModel , GPT2Tokenizer

model_name = "gpt2"
model = GPT2LMHeadModel . from_pretrained ( model_name ). cuda ()
tokenizer = GPT2Tokenizer . from_pretrained ( model_name )
tokenizer . pad_token_id = tokenizer . eos_token_id

calibrator = Calibrator (
    model = model ,
    tokenizer = tokenizer ,
    calibration_prompts = x ,
)

calibrator . set_admission_function ( Components . admission . debug )
calibrator . set_group_confidence_function ( Components . group_confidence . debug , torch . tensor ([ 0.1 , 0.5 , 1 ]))
calibrator . add_rejection_function ( Components . rejection . debug , torch . tensor ([ 0.1 , 0.5 , 1 ]))
calibrator . set_FWER ( Components . FWER . debug )

lambdaz = calibrator . search ()

sampler = Sampler . from_calibrator ( calibrator )

sampler . sample_with_rejection ( "What is the capital of France?" )

Esto utiliza algunas de las funciones de admisión/GF/FWER/rechazo incorporadas. También puede usar su propia función, por ejemplo:

 calibrator . set_group_confidence_function ( lambda x : x > 0.5 , torch . tensor ([ 0.1 , 0.5 , 1 ]))

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-11
tamaño 65.01KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo