TextGenerationEvaluationMetrics Download - TextGenerationEvaluationMetrics Source Code Téléchargement

TextGenerationEvaluationMetrics

Code Source AI

1.0.0

Télécharger

Mesurer conjointement la diversité et la qualité des modèles de génération de texte

Il s'agit de la mise en œuvre de mesures pour mesurer la diversité et la qualité, qui sont introduites dans cet article. En outre, certaines autres mesures existent.

Pour BLEU et OFFEUU, cette implémentation d'hyperformance est utilisée.

Utilisation des échantillons

Distances multiset

Voici un exemple pour calculer la distance MS-Jaccard. La contribution de ces mesures est une liste de phrases tokenisées.

 from multiset_distances import MultisetDistances

ref1 = [ 'It' , 'is' , 'a' , 'guide' , 'to' , 'action' , 'that' , 'ensures' , 'that' , 'the' , 'military' , 'will' , 'forever' , 'heed' , 'Party' , 'commands' ]
ref2 = [ 'It' , 'is' , 'the' , 'guiding' , 'principle' , 'which' , 'guarantees' , 'the' , 'military' , 'forces' , 'always' , 'being' , 'under' , 'the' , 'command' , 'of' , 'the' , 'Party' ]
ref3 = [ 'It' , 'is' , 'the' , 'practical' , 'guide' , 'for' , 'the' , 'army' , 'always' , 'to' , 'heed' , 'the' , 'directions' , 'of' , 'the' , 'party' ]
sen1 = [ 'It' , 'is' , 'a' , 'guide' , 'to' , 'action' , 'which' , 'ensures' , 'that' , 'the' , 'military' , 'always' , 'obeys' , 'the' , 'commands' , 'of' , 'the' , 'party' ]
sen2 = [ 'he' , 'read' , 'the' , 'book' , 'because' , 'he' , 'was' , 'interested' , 'in' , 'world' , 'history' ]

references = [ ref1 , ref2 , ref3 ]
sentences = [ sen1 , sen2 ]

msd = MultisetDistances ( references = references )
msj_distance = msd . get_jaccard_score ( sentences = sentences )

La valeur de msj_distance est {3: 0.17, 4: 0.13, 5: 0.09} , qui montre MS-Jaccard pour 3 grammes, 4-garm et 5 grammes, respectivement.

Distances basées sur Bert

Voici un exemple pour calculer la distance FBD et EMBD. L'entrée de ces mesures est une liste de chaînes et Bert Tokenizer est utilisé dans le code.

 from bert_distances import FBD , EMBD
references = [ "that is very good" , "it is great" ]
sentences1 = [ "this is nice" , "that is good" ]
sentences2 = [ "it is bad" , "this is very bad" ]

fbd = FBD ( references = references , model_name = "bert-base-uncased" , bert_model_dir = "/tmp/Bert/" )
fbd_distance_sentences1 = fbd . get_score ( sentences = sentences1 )
fbd_distance_sentences2 = fbd . get_score ( sentences = sentences2 )
# fbd_distance_sentences1 = 17.8, fbd_distance_sentences2 = 22.0

embd = EMBD ( references = references , model_name = "bert-base-uncased" , bert_model_dir = "/tmp/Bert/" )
embd_distance_sentences1 = embd . get_score ( sentences = sentences1 )
embd_distance_sentences2 = embd . get_score ( sentences = sentences2 )
# embd_distance_sentences1 = 10.9, embd_distance_sentences2 = 20.4

Ressources

Papier
Affiche
Vidéo de présentation
Glisser

Citation

Veuillez citer notre article si cela aide à vos recherches.

@misc{montahaei2019jointly,
    title={Jointly Measuring Diversity and Quality in Text Generation Models},
    author={Ehsan Montahaei and Danial Alihosseini and Mahdieh Soleymani Baghshah},
    year={2019},
    eprint={1904.03971},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-10
taille 5.75KB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout