libsa4py
v0.4.0
LibSA4Py 는 Python 용 정적 분석 라이브러리로, ML 기반 유형 추론 모델을 훈련하기위한 유형 힌트 및 기능을 추출합니다.
git clone https://github.com/saltudelft/libsa4py.git
cd libsa4py && pip install .
Python 리포지토리가 주어지면 다음 명령을 실행하여 소스 코드 파일을 처리하고 JSON 형식 출력을 생성합니다.
libsa4py process --p $REPOS_PATH --o $OUTPUT_PATH --d $DUPLICATE_PATH --j $WORKERS_COUNT --l $LIMIT --c --no-nlp --pyre
설명:
--p $REPOS_PATH : 파이썬 코퍼스 또는 데이터 세트로가는 경로.--o $OUTPUT_PATH : 처리 된 프로젝트를 저장하는 경로.--d $DUPLICATE_PATH : 주어진 데이터 세트의 중복 파일로가는 경로 (예 : CD4Py 도구에서 생성 된 JSONL.GZ 파일). [ 선택 사항 ]--s : 주어진 데이터 세트를 분할하기위한 CSV 파일로가는 경로. [ 선택 사항 ]--j $WORKERS_COUNT : 프로젝트 처리를위한 근로자 수. [ 선택 사항 , 기본값 = 아니오. 사용 가능한 CPU 코어]--l $LIMIT : 처리 할 프로젝트 수. [ 선택 사항 ]--c : 처리 된 프로젝트를 무시할지 여부. [ 선택 사항 , default = false]--no-nlp : 추출 된 식별자에 표준 NLP 기술을 적용할지 여부. [ 선택 사항 , default = true]--pyre : 주어진 프로젝트의 변수 유형을 추론하기 위해 pyre 를 실행할지 여부. [ 선택 사항 , default = false]--tc : 프로젝트에서 유형 유형 주석을 유형할지 여부. [ 선택 사항 , default = false] 처리 된 모든 JSON 형식 프로젝트를 단일 데이터 프레임으로 병합하려면 다음 명령을 실행하십시오.
libsa4py merge --o $OUTPUT_PATH --l $LIMIT
설명:
--o $OUTPUT_PATH : 이전 처리 단계에서 사용 된 처리 된 프로젝트로의 경로.--l $LIMIT : 병합 될 프로젝트 수. [ 선택 사항 ] Pyre의 추론 된 유형을 프로젝트에 적용하려면 다음 명령을 실행하십시오.
libsa4py apply --p $REPOS_PATH --o $OUTPUT_PATH
설명:
--p $REPOS_PATH : 파이썬 코퍼스 또는 데이터 세트로가는 경로.--o $OUTPUT_PATH : 이전 처리 단계에서 사용 된 처리 된 프로젝트로의 경로.각 프로젝트를 처리 한 후 JSON 형식의 파일이 생성되며 여기에 설명되어 있습니다.