CodeAssist DOWNLOAD - CodeAssist -Quellcode Download

CodeAssist

Anderer Quellcode

v0.1.0

Herunterladen

Chinesisch |

CODEASSIST: Advanced Code Completion -Tool

Einführung

Codeassist ist ein erweitertes Code-Completion-Tool, das intelligent qualitativ hochwertige Code-Abschlüsse für Python, Java und C ++ usw. bietet.

Codeassist ist ein qualitativ hochwertiges Code-Completion-Tool, das den Code für Programmiersprachen wie Python, Java und C ++ vervollständigt.

Merkmale

GPT -basierter Codeabschluss
Code -Abschluss für Python , Java , C++ , javascript usw.
Fertigstellung von Zeilen- und Blockcode
Zug (Feinabstimmung) und Vorhersage des Modells mit eigenen Daten

Modelle freigeben

Bogen	Basemodel	Modell	Modellgröße
Gpt	gpt2	Shibing624/Code-Autokometer-GPT2-Base	487MB
Gpt	DISTILGPT2	Shibing624/Code-Autokometer-Distilgpt2-Python	319MB
Gpt	BigCode/StarCoder	WizardLM/WizardCoder-15b-V1.0	29 GB

Demo

Huggingface Demo: https://huggingface.co/spaces/Shibing624/Code-autocomplete

Backend-Modell: shibing624/code-autocomplete-gpt2-base

Installieren

pip install torch # conda install pytorch
pip install -U codeassist

oder

git clone https://github.com/shibing624/codeassist.git
cd CodeAssist
python setup.py install

Verwendung

Assistentenmodell

WizardCoder-15b ist fein abgestimmter bigcode/starcoder mit Alpaca-Codedaten. Sie können den folgenden Code verwenden, um Code zu generieren:

Beispiel: Beispiele/WizardCoder_demo.py

 import sys

sys . path . append ( '..' )
from codeassist import WizardCoder

m = WizardCoder ( "WizardLM/WizardCoder-15B-V1.0" )
print ( m . generate ( 'def load_csv_file(file_path):' )[ 0 ])

Ausgabe:

 import csv

def load_csv_file ( file_path ):
    """
    Load data from a CSV file and return a list of dictionaries.
    """
    # Open the file in read mode
    with open ( file_path , 'r' ) as file :
        # Create a CSV reader object
        csv_reader = csv . DictReader ( file )
        # Initialize an empty list to store the data
        data = []
        # Iterate over each row of data
        for row in csv_reader :
            # Append the row of data to the list
            data . append ( row )
    # Return the list of data
    return data

Die Modellausgabe ist beeindruckend effektiv. Derzeit unterstützt sie englische und chinesische Eingaben. Sie können Anweisungen oder Codepräfixe bei Bedarf eingeben.

DISTILGPT2 MODELL

DISTILGPT2 FIND-TUND-CODE Autokaponete Modell, Sie können den folgenden Code verwenden:

Beispiel: Beispiele/distilgpt2_demo.py

 import sys

sys . path . append ( '..' )
from codeassist import GPT2Coder

m = GPT2Coder ( "shibing624/code-autocomplete-distilgpt2-python" )
print ( m . generate ( 'import torch.nn as' )[ 0 ])

Ausgabe:

import torch.nn as nn
import torch.nn.functional as F

Verwendung mit Umarmungen/Transformatoren:

Beispiel: Beispiele/USE_TRANSFORMERS_GPT2.PY

Zugmodell

Zug -Assistentenmodell

Beispiel: Beispiele/Training_wizardcoder_mydata.py

 cd examples
CUDA_VISIBLE_DEVICES=0,1 python training_wizardcoder_mydata.py --do_train --do_predict --num_epochs 1 --output_dir outputs-wizard --model_name WizardLM/WizardCoder-15B-V1.0

GPU -Speicher: 31GB
Finetune Need 2*V100 (32 GB)
Inferenz benötigt 1*V100 (32 GB)

Train Destilgpt2 Modell

Beispiel: Beispiele/Training_GPT2_MYDATA.PY

 cd examples
python training_gpt2_mydata.py --do_train --do_predict --num_epochs 15 --output_dir outputs-gpt2 --model_name gpt2

PS: Das feinstimmige Ergebnismodell ist GPT2-Python: Shibing624/Code-Autokompleter-GPT2-Base, ich habe ungefähr 24 Stunden mit V100 verbracht, um es zu optimieren.

Server

Fastapi Server starten:

Beispiel: Beispiele/Server.py

 cd examples
python server.py

Öffnen Sie die URL: http://0.0.0.0:8001/docs

API

Datensatz

Dies ermöglicht das Anpassen des Datensatzes.

Verwenden wir Python-Codes von Awesome-Pytorch-List

Wir möchten, dass das Modell automatische Codes auf allgemeiner Ebene hilft.
Dieser Code aus diesem Projekt ist gut geschrieben (hochwertige Codes).

Datensatzbaum:

examples/download/python
├── train.txt
└── valid.txt
└── test.txt

Es gibt drei Möglichkeiten, den Datensatz zu erstellen:

Verwenden Sie die Bibliothek von Huggingface/Datasets. Laden Sie die Datensätze des Datensatzes https://huggingface.co/datasets/shibing624/source_code

 from datasets import load_dataset
dataset = load_dataset ( "shibing624/source_code" , "python" ) # python or java or cpp
print ( dataset )
print ( dataset [ 'test' ][ 0 : 10 ])

Ausgabe:

DatasetDict({
    train: Dataset({
        features: [ ' text ' ],
        num_rows: 5215412
    })
    validation: Dataset({
        features: [ ' text ' ],
        num_rows: 10000
    })
    test: Dataset({
        features: [ ' text ' ],
        num_rows: 10000
    })
})
{ ' text ' : [
"            {'max_epochs': [1, 2]},n " , 
'            refit=False,n ' , '            cv=3,n ' , 
"            scoring='roc_auc',n " , '        )n ' , 
'        search.fit(*data)n ' , 
' ' , 
'    def test_module_output_not_1d(self, net_cls, data):n ' , 
'        from skorch.toy import make_classifiern ' , 
'        module = make_classifier(n '
]}

Laden Sie den Datensatz aus Cloud herunter

Name	Quelle	Herunterladen	Größe
Python+Java+CPP -Quellcode	Awesome-Pytorch-Liste (5,22 Millionen Linien)	github_source_code.zip	105 m

Laden Sie den Datensatz herunter und entpacken Sie es, geben Sie es an examples/ .

Holen Sie sich Quellcode von Grund auf neu und erstellen Sie den Datensatz

prepe_code_data.py

 cd examples
python prepare_code_data.py --num_repos 260

Kontakt

Problem (Vorschläge):
Senden Sie mir eine E -Mail: Xuming: [email protected]
Wechat Me: Fügen Sie mich Wechat ID hinzu: Xuming624, Hinweis: Persönlicher Name - Firma - NLP zu NLP Exchange Group.

Zitat

Wenn Sie Codeassist in Ihrer Forschung verwenden, zitieren Sie diese bitte im folgenden Format:

APA:

Xu, M. codeassist: Code AutoComplete with GPT model (Version 1.0.0) [Computer software]. https://github.com/shibing624/codeassist

Bibtex:

@software{Xu_codeassist,
author = {Ming Xu},
title = {CodeAssist: Code AutoComplete with Generation model},
url = {https://github.com/shibing624/codeassist},
version = {1.0.0}
}

Lizenz

Dieses Repository ist unter der Apache -Lizenz 2.0 lizenziert.

Bitte folgen Sie dem Attribution-Noncommercial 4.0 International, um das Assistentcoder-Modell zu verwenden.

Beitragen

Der Projektcode ist immer noch sehr rau.

Fügen Sie die entsprechenden Unit -Tests in tests
Verwenden Sie python setup.py test um alle Unit -Tests auszuführen, um sicherzustellen, dass alle einzelnen Tests bestanden werden

Sie können Ihre PR später einreichen.

Referenz

GPT-2-Simple
Galois-Autokalleter
WizardLM/WizardCoder-15b-V1.0

Expandieren

Zusätzliche Informationen

Version v0.1.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-06
Größe 741.3KB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

CodeAssist

CODEASSIST: Advanced Code Completion -Tool

Einführung

Merkmale

Modelle freigeben

Demo

Installieren

Verwendung

Assistentenmodell

DISTILGPT2 MODELL

Verwendung mit Umarmungen/Transformatoren:

Zugmodell

Zug -Assistentenmodell

Train Destilgpt2 Modell

Server

Datensatz

Kontakt

Zitat

Lizenz

Beitragen

Referenz

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express