libsa4py
v0.4.0
LibSA4Py est une bibliothèque d'analyse statique pour Python, qui extrait les indices et les fonctionnalités de type pour la formation de modèles d'inférence de type ML.
git clone https://github.com/saltudelft/libsa4py.git
cd libsa4py && pip install .
Compte tenu des référentiels Python, exécutez la commande suivante pour traiter les fichiers de code source et générer des sorties format JSON:
libsa4py process --p $REPOS_PATH --o $OUTPUT_PATH --d $DUPLICATE_PATH --j $WORKERS_COUNT --l $LIMIT --c --no-nlp --pyre
Description:
--p $REPOS_PATH : le chemin du Corpus Python ou de l'ensemble de données.--o $OUTPUT_PATH : chemin pour stocker des projets traités.--d $DUPLICATE_PATH : Path to Dupliquer les fichiers de l'ensemble de données donné (IE JSONL.GZ Fichier produit par l'outil CD4PY). [ Facultatif ]--s : Chemin vers le fichier CSV pour diviser l'ensemble de données donné. [ Facultatif ]--j $WORKERS_COUNT : nombre de travailleurs pour le traitement des projets. [ Facultatif , par défaut = non. des cœurs CPU disponibles]--l $LIMIT : nombre de projets à traiter. [ Facultatif ]--c : Il faut ignorer les projets traités. [ Facultatif , par défaut = false]--no-nlp : Il faut appliquer des techniques NLP standard aux identifiants extraits. [ Facultatif , par défaut = true]--pyre : s'il faut exécuter pyre pour déduire les types de variables pour les projets donnés. [ Facultatif , par défaut = false]--tc : Que ce soit pour vérifier les annotations de type dans les projets. [ Facultatif , par défaut = false] Pour fusionner tous les projets formés par JSON traités en un seul DataFrame, exécutez la commande suivante:
libsa4py merge --o $OUTPUT_PATH --l $LIMIT
Description:
--o $OUTPUT_PATH : chemin vers les projets traités, utilisés à l'étape de traitement précédente.--l $LIMIT : nombre de projets à fusionner. [ Facultatif ] Pour appliquer les types inférés de Pyre aux projets, exécutez la commande suivante:
libsa4py apply --p $REPOS_PATH --o $OUTPUT_PATH
Description:
--p $REPOS_PATH : le chemin du Corpus Python ou de l'ensemble de données.--o $OUTPUT_PATH : chemin vers les projets traités, utilisés à l'étape de traitement précédente.Après avoir traité chaque projet, un fichier format JSON est produit, qui est décrit ici.