?? Bahasa Inggris |

Codeassist adalah alat penyelesaian kode canggih yang secara cerdas menyediakan penyelesaian kode berkualitas tinggi untuk Python, Java, dan C ++ dan sebagainya.
Codeassist adalah alat penyelesaian kode berkualitas tinggi yang melengkapi kode untuk bahasa pemrograman seperti Python, Java, dan C ++.
Python , Java , C++ , javascript dan sebagainya| Lengkungan | Basemodel | Model | Ukuran model |
|---|---|---|---|
| GPT | gpt2 | Shibing624/Code-Autocomplete-GPT2-BASE | 487MB |
| GPT | Distilgpt2 | shibing624/kode-autocomplete-disilgpt2-python | 319MB |
| GPT | Bigcode/StarCoder | Wizardlm/wizardcoder-15b-v1.0 | 29GB |
Demo HuggingFace: https://huggingface.co/spaces/shibing624/code-autocomplete
Model Backend: shibing624/code-autocomplete-gpt2-base
pip install torch # conda install pytorch
pip install -U codeassistatau
git clone https://github.com/shibing624/codeassist.git
cd CodeAssist
python setup.py install WizardCoder-15B adalah bigcode/starcoder yang disesuaikan dengan data kode ALPACA, Anda dapat menggunakan kode berikut untuk menghasilkan kode:
Contoh: Contoh/wizardcoder_demo.py
import sys
sys . path . append ( '..' )
from codeassist import WizardCoder
m = WizardCoder ( "WizardLM/WizardCoder-15B-V1.0" )
print ( m . generate ( 'def load_csv_file(file_path):' )[ 0 ])keluaran:
import csv
def load_csv_file ( file_path ):
"""
Load data from a CSV file and return a list of dictionaries.
"""
# Open the file in read mode
with open ( file_path , 'r' ) as file :
# Create a CSV reader object
csv_reader = csv . DictReader ( file )
# Initialize an empty list to store the data
data = []
# Iterate over each row of data
for row in csv_reader :
# Append the row of data to the list
data . append ( row )
# Return the list of data
return dataOutput model sangat efektif, saat ini mendukung input bahasa Inggris dan Cina, Anda dapat memasukkan instruksi atau awalan kode sesuai kebutuhan.
DistilGPT2 Code Fine-Tuned Model AutoComplete, Anda dapat menggunakan kode berikut:
Contoh: Contoh/Distilgpt2_Demo.py
import sys
sys . path . append ( '..' )
from codeassist import GPT2Coder
m = GPT2Coder ( "shibing624/code-autocomplete-distilgpt2-python" )
print ( m . generate ( 'import torch.nn as' )[ 0 ])keluaran:
import torch.nn as nn
import torch.nn.functional as FContoh: Contoh/use_transformers_gpt2.py
Contoh: Contoh/pelatihan_wizardcoder_mydata.py
cd examples
CUDA_VISIBLE_DEVICES=0,1 python training_wizardcoder_mydata.py --do_train --do_predict --num_epochs 1 --output_dir outputs-wizard --model_name WizardLM/WizardCoder-15B-V1.0Contoh: Contoh/pelatihan_gpt2_mydata.py
cd examples
python training_gpt2_mydata.py --do_train --do_predict --num_epochs 15 --output_dir outputs-gpt2 --model_name gpt2PS: Model hasil yang disempurnakan adalah GPT2-Python: Shibing624/Code-Autocomplete-GPT2-Base, saya menghabiskan sekitar 24 jam dengan V100 untuk menyempurnakannya.
Mulai server FastAPI:
Contoh: Contoh/server.py
cd examples
python server.pyBuka URL: http://0.0.0.0:8001/docs

Ini memungkinkan untuk menyesuaikan pembangunan dataset.
Mari kita gunakan kode Python dari daftar pytorch yang mengagumkan
Dataset Tree:
examples/download/python
├── train.txt
└── valid.txt
└── test.txtAda tiga cara untuk membangun dataset:
from datasets import load_dataset
dataset = load_dataset ( "shibing624/source_code" , "python" ) # python or java or cpp
print ( dataset )
print ( dataset [ 'test' ][ 0 : 10 ])keluaran:
DatasetDict({
train: Dataset({
features: [ ' text ' ],
num_rows: 5215412
})
validation: Dataset({
features: [ ' text ' ],
num_rows: 10000
})
test: Dataset({
features: [ ' text ' ],
num_rows: 10000
})
})
{ ' text ' : [
" {'max_epochs': [1, 2]},n " ,
' refit=False,n ' , ' cv=3,n ' ,
" scoring='roc_auc',n " , ' )n ' ,
' search.fit(*data)n ' ,
' ' ,
' def test_module_output_not_1d(self, net_cls, data):n ' ,
' from skorch.toy import make_classifiern ' ,
' module = make_classifier(n '
]}| Nama | Sumber | Unduh | Ukuran |
|---|---|---|---|
| Python+Java+kode sumber CPP | Daftar Awesome-Pytorch (5,22 juta baris) | github_source_code.zip | 105m |
Unduh dataset dan unzip, masukkan ke examples/ .
persiapan_code_data.py
cd examples
python prepare_code_data.py --num_repos 260
Jika Anda menggunakan Codeassist dalam penelitian Anda, silakan kutip dalam format berikut:
APA:
Xu, M. codeassist: Code AutoComplete with GPT model (Version 1.0.0) [Computer software]. https://github.com/shibing624/codeassistBibtex:
@software{Xu_codeassist,
author = {Ming Xu},
title = {CodeAssist: Code AutoComplete with Generation model},
url = {https://github.com/shibing624/codeassist},
version = {1.0.0}
}Repositori ini dilisensikan di bawah Lisensi Apache 2.0.
Harap ikuti atribusi-nonkomersial 4.0 International untuk menggunakan model WizardCoder.
Kode proyek masih sangat kasar.
testspython setup.py test untuk menjalankan semua tes unit untuk memastikan bahwa semua tes tunggal dilewatkanAnda dapat mengirimkan PR Anda nanti.