Comparez visuellement les invites LLM à remplir pour découvrir les biais et les associations apprises!
????

Les modèles de grandes langues (LLM) tels que Bert et GPT-3 ont connu des améliorations significatives des performances des tâches en langage naturel, leur permettant d'aider les gens à répondre aux questions, à générer des essais, à résumer de longs articles, etc. Pourtant, comprendre ce que ces modèles ont appris et pourquoi ils fonctionnent est toujours un défi ouvert. Pour les chercheurs et les ingénieurs de traitement du langage naturel (PNL) qui forment et déploient de plus en plus les LLM en tant que `` boîtes noires '' pour générer du texte, explorer comment les comportements apprises pendant la formation se manifestent dans les tâches en aval peuvent les aider à améliorer le développement du modèle; Par exemple, en faisant surface des stéréotypes nocifs .
KnowledgeVis est un système d'analyse visuelle humaine en boucle pour comparer les invites à remplir en blanc pour découvrir les associations à partir de représentations de texte apprises. KnowledgeVis aide les développeurs à créer des ensembles efficaces d'invites, à sonder plusieurs types de relations entre les mots, à tester différentes associations qui ont été apprises et à trouver des informations sur plusieurs ensembles de prédictions pour tout modèle linguistique basé sur Bert.
Collectivement, ces visualisations aident l'utilisateur à identifier la probabilité et l'unicité des prédictions individuelles, comparer des ensembles de prédictions entre les invites et résumer les modèles et les relations entre les prédictions à toutes les invites.
Ce code accompagne le document de recherche:
Knowledgevis: Interpréter les modèles de langue en comparant les invites à remplissage
Adam Coscia, Alex Entert
Transactions IEEE sur la visualisation et les graphiques informatiques (TVCG), 2023 (pour apparaître)
| Papier |



Regardez la vidéo de démonstration pour un tutoriel complet ici: https://youtu.be/hbx4rsumr_i
Pour une démo en direct, visitez: https://adamcoscia.com/papers/knowledgevis/demo/
? Vous pouvez tester nos visualisations sur votre propre LLMS en quelques étapes faciles!
v3.9.x (dernière version)git clone [email protected]:AdamCoscia/KnowledgeVIS.git
# use --depth if you don't want to download the whole commit history
git clone --depth 1 [email protected]:AdamCoscia/KnowledgeVIS.gitAccédez au dossier d'interface:
cd interfacepy -3.9 -m http.serverpython3.9 -m http.serverAccédez à LocalHost: 8000. Vous devriez voir Knowledgevis fonctionner dans votre navigateur :)
Accédez au dossier du serveur:
cd serverCréer un environnement virtuel:
# Start a virtual environment
py -3.9 -m venv venv
# Activate the virtual environment
. v env S cripts a ctivate # Start a virtual environment
python3.9 -m venv venv
# Activate the virtual environment
source venv/bin/activateInstallez les dépendances:
python -m pip install -r requirements.txt Installer Pytorch v2.0.x (instructions)
Pytorch est installé séparément car certains systèmes peuvent prendre en charge CUDA, ce qui nécessite un processus d'installation différent et peut accélérer considérablement l'outil.
Ensuite, exécutez le serveur:
python main.pyDirigée par Adam Coscia, Knowledgevis est le résultat d'une collaboration entre des experts en visualisation dans la conception de l'informatique et de l'interaction centrée sur l'homme de Georgia Tech. Knowledgevis est créé par Adam Coscia et Alex Entert.
Pour en savoir plus sur KnowledgeVis, veuillez lire notre document de recherche (pour apparaître dans IEEE TVCG).
@article { Coscia:2023:KnowledgeVIS ,
author = { Coscia, Adam and Endert, Alex } ,
journal = { IEEE Transactions on Visualization and Computer Graphics } ,
title = { KnowledgeVIS: Interpreting Language Models by Comparing Fill-in-the-Blank Prompts } ,
year = { 2023 } ,
volume = { } ,
number = { } ,
pages = { 1-13 } ,
doi = { 10.1109/TVCG.2023.3346713 }
}Le logiciel est disponible sous la licence MIT.
Si vous avez des questions, n'hésitez pas à ouvrir un problème ou à contacter Adam Coscia.