GSM8K Consistency
1.0.0
Konsistensi GSM8K adalah database benchmark untuk menganalisis konsistensi Arithmetic Reasoning on GSM8K .
Ini adalah tolok ukur perturbasi semantik yang terkait dengan matematika yang dapat sangat membantu untuk mengevaluasi konsistensi kemampuan penalaran aritmatika.
Jalankan perintah berikut untuk memuat data:
from datasets import load_dataset
dataset = load_dataset ( "shuyuej/GSM8K-Consistency" )
dataset = dataset [ 'train' ]
print ( dataset )Dataset Deskripsi:
Dataset ({
features : [ 'id' , 'original_question' , 'paraphrased_question' , 'answer_detail' , 'numerical_answer' ],
num_rows : 85225
})