Téléchargement interpretable embeddings Embeddings - Téléchargement du code source interpretable embeddings

interpretable embeddings

Code Source AI

1.0.0

Télécharger

❓ INCHEDADS DE L'ANSERSING DE QUESTION ❓

Création d'incorporation interprétable en posant des questions LLMS, code pour le papier QA-EMB.

QA-EMBS construit des intégrés d'incorporation en posant une série de questions oui-non à un LLM autorégressif pré-formé.

Start

Si vous souhaitez simplement utiliser QA-EMB dans votre propre application, la manière la plus simple est le package IMODELSX. Pour installer, exécutez simplement pip install imodelsx .

Ensuite, vous pouvez générer vos propres intérêts interprétables en proposant des questions pour votre domaine:

 from imodelsx import QAEmb
import pandas as pd

questions = [
    'Is the input related to food preparation?' ,
    'Does the input mention laughter?' ,
    'Is there an expression of surprise?' ,
    'Is there a depiction of a routine or habit?' ,
    'Does the sentence contain stuttering?' ,
    'Does the input contain a first-person pronoun?' ,
]
examples = [
    'i sliced some cucumbers and then moved on to what was next' ,
    'the kids were giggling about the silly things they did' ,
    'and i was like whoa that was unexpected' ,
    'walked down the path like i always did' ,
    'um no um then it was all clear' ,
    'i was walking to school and then i saw a cat' ,
]

checkpoint = 'meta-llama/Meta-Llama-3-8B-Instruct'

embedder = QAEmb (
    questions = questions , checkpoint = checkpoint , use_cache = False )
embeddings = embedder ( examples )

df = pd . DataFrame ( embeddings . astype ( int ), columns = [
    q . split ()[ - 1 ] for q in questions ])
df . index = examples
df . columns . name = 'Question (abbreviated)'
display ( df . style . background_gradient ( axis = None ))
- - - - - - - - DISPLAYS ANSWER FOR EACH QUESTION IN EMBEDDING - - - - - - - -

Configuration de l'ensemble de données

Instructions pour l'installation des ensembles de données requis pour reproduire les expériences IRMf dans l'article.

Téléchargez les données avec python experiments/00_load_dataset.py
- Créez un data Dir sous partout où vous l'exécutez et utilisera Datalad pour télécharger les données prétraitées ainsi que les espaces de fonctions nécessaires pour ajuster les modèles de codage sémantique
Définissez neuro1.config.root_dir à l'endroit où vous souhaitez stocker les données
Pour faire des FlatMaps, vous devez définir [Pycortex FileStore] sur {root_dir}/ds003020/derivative/pycortex-db/
Pour exécuter ENG1000, besoin de saisir le répertoire em_data à partir d'ici et de déplacer son contenu vers {root_dir}/em_data
Chargement des réponses
- neuro1.data.response_utils function load_response
- Charge les réponses de AT {root_dir}/ds003020/derivative/preprocessed_data/{subject} , ils sont stockés dans un fichier H5 pour chaque histoire, par exemple wheretheressmoke.h5
stimulus de chargement
- neuro1.features.stim_utils Fonction load_story_wordseqs
- Charge TextGrids de {root_dir}/ds003020/derivative/TextGrids", where each story has a TextGrid file, eg wherethessmoke.textgrid`
- utilise {root_dir}/ds003020/derivative/respdict.json pour obtenir la durée de chaque histoire

Installation de code

Instructions pour l'installation du code ici comme un package pour le développement complet.

Dans le répertoire Repo, commencez avec pip install -e . Pour installer localement le package neuro1
python 01_fit_encoding.py --subject UTS03 --feature eng1000
- Les autres paramètres facultatifs que Encoding.py prennent tels que les sessions, Ndelay, Single_Alpha permettent à l'utilisateur de modifier la quantité de données et les aspects de régularisation de la régression linéaire utilisée.
- Cette fonction économisera ensuite les métriques de performance du modèle et les poids du modèle sous forme de tableaux Numpy.

Citation

 @ misc { benara2024crafting ,
      title = { Crafting Interpretable Embeddings by Asking LLMs Questions }, 
      author = { Vinamra Benara and Chandan Singh and John X. Morris and Richard Antonello and Ion Stoica and Alexander G. Huth and Jianfeng Gao },
      year = { 2024 },
      eprint = { 2405.16714 },
      archivePrefix = { arXiv },
      primaryClass = { cs.CL }
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-10
taille 28.36MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout