Il s'agit d'un référentiel contenant du code et des données pour le papier:
K. Noorbakhsh, M. Sulaiman, M. Sharifi, K. Roy et P. Jamshidi. Les modèles de langue pré-entraînés sont également des résolveurs de mathématiques symboliques!
Site Web du projet
Ce code dépend des packages suivants:
TorchNumPySymPyTransformersApex trainer.py contient du code pour affiner les modèles de langue pré-formés. Veuillez modifier les paramètres suivants pour l'exécution:
language : la langue pré-formée.Model_Type : Mbart ou Marian.path1 et path2 : Le chemin de la formation et les données de validation.max_input_length et max_output_length : 1024 pour le modèle MBART et 512 pour le modèle Marian-MT.model_name : nom du modèle que vous souhaitez enregistrer. evaluator.py contient du code d'évaluation du modèle de langue affinée sur les données mathématiques symboliques. Veuillez modifier le paramètre 1-4 Identique à la section trainer et modifier également le paramètre suivant:
path : le chemin du chemin de l'ensemble de données de test.saved_model : Le chemin du modèle fini enregistré. src/hf_utils.py contient du code pour lire les ensembles de données et certains utilitaires pour l'évaluation.
Le reste du code est adopté à partir de l'apprentissage en profondeur pour les mathématiques symboliques (Lample et al.).
Les ensembles de données sont disponibles ici.
train , valid et test contiennent les ensembles de données de formation, de validation et de test pour le modèle MBART.language_data contient des données pour les ensembles de données de formation, de validation et de test du modèle Marian-MT.distribution_test contient les fichiers de test pour la section Shift de distribution (polynôme, trgonométrique et logarithmique). Veuillez nous citer si vous utilisez notre travail dans votre recherche.
@article{noorbakhsh2021pretrained,
title={Pretrained Language Models are Symbolic Mathematics Solvers too!},
author={Kimia Noorbakhsh and Modar Sulaiman and Mahdi Sharifi and Kallol Roy and Pooyan Jamshidi},
journal={arXiv preprint arXiv:2110.03501},
year={2021}
}