
Proyecto | Papel | Documentación
Gundam es un administrador de datos que utiliza modelos de lenguaje para manejar eficientemente los datos textuales, que se basa en Pytorch. Gundam es:
Gundam es un nuevo marco de gestión de datos que mide la suficiencia y la necesidad de enchufar demostraciones condicionadas en modelos de lenguaje. Mostramos que las métricas propuestas de suficiencia y necesidad se pueden operar tanto en instancias de demostración (es decir, nivel de instancia) como en conjuntos de demostraciones (es decir, nivel establecido). Por lo tanto, el conjunto de datos de complemento suficientes y necesarios, nombrados como un conjunto de complementos dorados, puede considerarse como un conjunto de núcleo que incluye las muestras informativas. Dado que enumerar y medir todos los subconjuntos posibles es inviable, diseñamos nuevos algoritmos de búsqueda basados en árboles para extraer el conjunto Golden Plug-in. Observe que el conjunto de complementos Golden podría ser precomputado y almacenado para ahorrar costos de cálculo en línea. En este sentido, los retrievers de demostración no paramétricos podrían funcionar en el conjunto de complementos dorado almacenado en lugar de todo el corpus de datos, para evitar recuperar demostraciones insuficientes o innecesarias. Además, teniendo en cuenta que muchos corpus de datos del mundo real seguirían creciendo, desarrollamos un algoritmo de actualización incremental para evitar volver a competir a Gundam sobre todas las partes cambiadas y sin cambios.

La ventaja significativa de Gundam es que Gundam se puede implementar fácilmente en cualquier plataforma de gestión de datos existente porque la idea central de Gundam es asignar diferentes niveles de prioridad a los datos almacenados para mostrar sus cualidades de datos con respecto al modelo de idioma dado.
@software { GUNDAM ,
author = { Jiarui Jin, Yuwei Wu, Mengyue Yang, Xiaoting He, Weinan Zhang, Yiming Yang, Yong Yu, and Jun Wang } ,
title = { GUNDAM: A Data-Centric Manager for Your Plug-in Data with Language Models } ,
year = { 2023 } ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
version = { 0.0 } ,
howpublished = { url{https://github.com/GUNDAM-Labet/GUNDAM} } ,
}Los desarrolladores centrales del sistema Gundam son Jiarui Jin, Yuwei Wu y Mengyue Yang.
Gundam se lanza bajo la licencia Apache, versión 2.0.