
Projekt | Papier | Dokumentation
Gundam ist ein Datenmanager, der Sprachmodelle verwendet, um Textdaten effizient zu verarbeiten, die auf Pytorch basieren. Gundam ist:
Gundam ist ein neuartiger Datenmanagement-Framework, der die Ausreicherung und Notwendigkeit von Anschlussvorführungen misst, die auf Sprachmodellen bedingt sind. Wir zeigen, dass die vorgeschlagenen Messdaten für ausreichende und nötige Notwendigkeit sowohl in Demonstrationsinstanzen (dh, Instanzebene) als auch in Demonstrationssätzen (dh eingestelltes Level) betrieben werden können. Somit kann der Satz ausreichender und notwendiger Plug-in-Daten, der als goldener Plug-in-Set bezeichnet wird, als Kernsatz einschließlich der informativen Proben angesehen werden. Da die Aufzählung und Messung aller möglichen Teilmengen nicht zulistbar ist, entwerfen wir neue baumbasierte Suchalgorithmen, um das goldene Plug-in-Set abzubauen. Beachten Sie, dass das Golden Plug-In-Set vorbereitet und gespeichert werden kann, um Online-Berechnungskosten zu sparen. In dieser Hinsicht könnten nicht parametrische Demonstrationsretriever am gespeicherten goldenen Plug-in-Set anstelle des gesamten Datenkorpus durchführen, um nicht ausreichend oder unnötige Demonstrationen abzurufen. In Anbetracht der Tatsache, dass viele reale Datenkorpus weiterhin wachsen würden, entwickeln wir einen inkrementellen Update-Algorithmus, um Gundam über alle veränderten und unveränderten Teile erneut zu komputieren.

Der wesentliche Vorteil von Gundam besteht darin, dass Gundam auf jeder vorhandenen Datenverwaltungsplattform problemlos bereitgestellt werden kann, da die Kernidee von Gundam darin besteht, den gespeicherten Daten unterschiedliche Prioritätsniveaus zuzuweisen, um ihre Datenqualitäten in Bezug auf das angegebene Sprachmodell anzuzeigen.
@software { GUNDAM ,
author = { Jiarui Jin, Yuwei Wu, Mengyue Yang, Xiaoting He, Weinan Zhang, Yiming Yang, Yong Yu, and Jun Wang } ,
title = { GUNDAM: A Data-Centric Manager for Your Plug-in Data with Language Models } ,
year = { 2023 } ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
version = { 0.0 } ,
howpublished = { url{https://github.com/GUNDAM-Labet/GUNDAM} } ,
}Kernentwickler des Gundam -Systems sind Jiarui Jin, Yuwei Wu und Mengyue Yang.
Gundam wird unter der Apache -Lizenz, Version 2.0, veröffentlicht.