LLMSymbolicReasoningBench Téléchargement - LLMSymbolicReasoningBench Code source Téléchargement

LLMSymbolicReasoningBench

Code Source AI

1.0.0

Télécharger

Ensembles de données synthétiques pour les modèles de langue

Ce référentiel est dédié à la génération d'ensembles de données pour diverses tâches de modélisation des langues. Notre objectif est de fournir une implémentation pour la génération d'ensembles de données qui ne sont pas publiques ou qui n'ont pas de mise en œuvre officielle, et de faciliter la création et les reproduire facilement.

Nous encourageons les contributions et les commentaires à faire de ce référentiel une ressource précieuse pour la communauté. Si vous avez des questions ou des suggestions, n'hésitez pas à ouvrir un problème ou à soumettre une demande de traction.

Faites vos demandes de traction (PRS)

Si vous souhaitez contribuer, nous vous encourageons à faire un RP à ce référentiel conformément aux directives suivantes.

Structure de répertoire

Chaque PR doit inclure le code et la description de Markdown dans un sous-répertoire. Un exemple d'arbre de sous-répertoire:

 └── DataGenLM
    └── <Your PR directory>: Dataset name
        ├── example.json (Optional)
        ├── README.md
        ├── requirements.txt
        └── <Your code>

Veuillez exclure les grands fichiers de données dans le PR car ils prennent trop de place. Au lieu de cela, décrivez la méthode pour acquérir les données dans votre README.md et fournissez éventuellement un extrait de petite génération ( example.json ). Voir les sous-répertoires de la colonisation de coin-flip et last-letter-concatenation pour un exemple.

Description de la tâche (readme.md)

Veuillez inclure les sections suivantes dans votre lecture pour aider à mieux utiliser:

Nom de l'ensemble de données : sert de titre Markdown.
Auteurs : Vos noms, votre contact (e-mail) et URL à votre (s) page d'accueil (si disponible).
Description de la tâche : un court paragraphe pour introduire brièvement le sujet de l'ensemble de données et de la tâche correspondante.
Commandes en cours : instructions pour générer l'ensemble de données.
Référence : Informations sur la citation appropriées pour l'ensemble de données (le cas échéant).