CodeAssist скачать - загрузка исходного кода CodeAssist

CodeAssist

Другой исходный код

v0.1.0

Скачать

Китайский |

Codeassist: расширенный инструмент завершения кода

Введение

Codeassist -это расширенный инструмент завершения кода, который интеллектуально предоставляет высококачественные завершения кода для Python, Java и C ++ и т. Д.

Codeassist-это высококачественный инструмент завершения кода, который завершает код для языков программирования, таких как Python, Java и C ++.

Функции

Завершение кода на основе GPT
Завершение кода для Python , Java , C++ , javascript и т. Д.
Завершение кода строки и блока
Поезд (тонкая настройка) и прогнозируйте модель с помощью собственных данных

Выпустить модели

Архи	BaseModel	Модель	Размер модели
Гф	GPT2	Shibing624/Code-Autocoplete-gpt2-base	487 МБ
Гф	Distilgpt2	shibing624/code-autocoplete-distilgpt2-python	319 МБ
Гф	BigCode/StarCoder	Wizardlm/WizardCoder-15B-V1.0	29 ГБ

Демо

Demo GuggingFace: https://huggingface.co/spaces/shibing624/code-autocopplite

Бэкэнд-модель: shibing624/code-autocomplete-gpt2-base

Установить

pip install torch # conda install pytorch
pip install -U codeassist

или

git clone https://github.com/shibing624/codeassist.git
cd CodeAssist
python setup.py install

Использование

Модель WizardCoder

WizardCoder-15B-это точный настройка bigcode/starcoder с данными кода Alpaca, вы можете использовать следующий код для генерации кода:

Пример: примеры/wizardcoder_demo.py

 import sys

sys . path . append ( '..' )
from codeassist import WizardCoder

m = WizardCoder ( "WizardLM/WizardCoder-15B-V1.0" )
print ( m . generate ( 'def load_csv_file(file_path):' )[ 0 ])

выход:

 import csv

def load_csv_file ( file_path ):
    """
    Load data from a CSV file and return a list of dictionaries.
    """
    # Open the file in read mode
    with open ( file_path , 'r' ) as file :
        # Create a CSV reader object
        csv_reader = csv . DictReader ( file )
        # Initialize an empty list to store the data
        data = []
        # Iterate over each row of data
        for row in csv_reader :
            # Append the row of data to the list
            data . append ( row )
    # Return the list of data
    return data

Вывод модели впечатляюще эффективен, в настоящее время он поддерживает ввод английского и китайского, вы можете ввести инструкции или префиксы кода по мере необходимости.

Distilgpt2 модель

Distilgpt2 Автозаполняющий модель с тонким настройкой, вы можете использовать следующий код:

Пример: примеры/distilgpt2_demo.py

 import sys

sys . path . append ( '..' )
from codeassist import GPT2Coder

m = GPT2Coder ( "shibing624/code-autocomplete-distilgpt2-python" )
print ( m . generate ( 'import torch.nn as' )[ 0 ])

выход:

import torch.nn as nn
import torch.nn.functional as F

Используйте с Huggingface/Transformers:

Пример: примеры/use_transformers_gpt2.py

Модель поезда

Поезда модель WizardCoder

Пример: примеры/training_wizardcoder_mydata.py

 cd examples
CUDA_VISIBLE_DEVICES=0,1 python training_wizardcoder_mydata.py --do_train --do_predict --num_epochs 1 --output_dir outputs-wizard --model_name WizardLM/WizardCoder-15B-V1.0

Память графического процессора: 31 ГБ
Finetune Need 2*v100 (32 ГБ)
Вывод нужен 1*v100 (32 ГБ)

Поезд Distilgpt2 модель

Пример: примеры/training_gpt2_mydata.py

 cd examples
python training_gpt2_mydata.py --do_train --do_predict --num_epochs 15 --output_dir outputs-gpt2 --model_name gpt2

PS: тонкая модель результатов-GPT2-Python: Shibing624/Code-AutocOpplite-GPT2-база, я потратил около 24 часов с V100, чтобы настраивать его.

Сервер

запустить сервер FASTAPI:

Пример: примеры/server.py

 cd examples
python server.py

Открытый URL: http://0.0.0.0:8001/docs

API

Набор данных

Это позволяет настроить наборы данных.

Давайте использовать коды Python от Awesome-Pytorch-List

Мы хотим, чтобы модель помогала автоматическим кодам на общем уровне.
Этот код из этого проекта хорошо написан (высококачественные коды).

Дерево наборов данных:

examples/download/python
├── train.txt
└── valid.txt
└── test.txt

Есть три способа создания набора данных:

Используйте библиотеку HuggingFace/DataSets Загрузить наборы данных наборов данных https://huggingface.co/datasets/shibing624/source_code

 from datasets import load_dataset
dataset = load_dataset ( "shibing624/source_code" , "python" ) # python or java or cpp
print ( dataset )
print ( dataset [ 'test' ][ 0 : 10 ])

выход:

DatasetDict({
    train: Dataset({
        features: [ ' text ' ],
        num_rows: 5215412
    })
    validation: Dataset({
        features: [ ' text ' ],
        num_rows: 10000
    })
    test: Dataset({
        features: [ ' text ' ],
        num_rows: 10000
    })
})
{ ' text ' : [
"            {'max_epochs': [1, 2]},n " , 
'            refit=False,n ' , '            cv=3,n ' , 
"            scoring='roc_auc',n " , '        )n ' , 
'        search.fit(*data)n ' , 
' ' , 
'    def test_module_output_not_1d(self, net_cls, data):n ' , 
'        from skorch.toy import make_classifiern ' , 
'        module = make_classifier(n '
]}

Скачать набор данных из облака

Имя	Источник	Скачать	Размер
Python+Java+CPP исходный код	Awesome-Pytorch-List (5,22 миллиона строк)	github_source_code.zip	105 м

Загрузите набор данных и раскрипипируйте его, поместите в examples/ .

Получить исходный код с нуля и создать набор данных

PRIPARE_CODE_DATA.PY

 cd examples
python prepare_code_data.py --num_repos 260

Контакт

Проблема (предложения):
Напишите мне: xuming: [email protected]
WeChat Me: добавьте меня идентификатор WeChat: Xuming624, Примечание: Личное имя - Компания - NLP в NLP Exchange Group.

Цитирование

Если вы используете CodeAssist в своем исследовании, укажите его в следующем формате:

APA:

Xu, M. codeassist: Code AutoComplete with GPT model (Version 1.0.0) [Computer software]. https://github.com/shibing624/codeassist

Bibtex:

@software{Xu_codeassist,
author = {Ming Xu},
title = {CodeAssist: Code AutoComplete with Generation model},
url = {https://github.com/shibing624/codeassist},
version = {1.0.0}
}

Лицензия

Этот репозиторий лицензируется по лицензии Apache 2.0.

Пожалуйста, следуйте Attribution-Noncommercial 4.0 International, чтобы использовать модель WizardCoder.

Способствовать

Код проекта по -прежнему очень грубо.

Добавить соответствующие модульные тесты в tests
Используйте python setup.py test для запуска всех модульных тестов, чтобы убедиться, что все отдельные тесты проходят

Вы можете отправить свой PR позже.

Ссылка

GPT-2-Simple
Галуа-Аутоколтеттер
Wizardlm/WizardCoder-15B-V1.0

Расширять

Дополнительная информация

Версия v0.1.0
Тип Другой исходный код
Время обновления 2025-03-06
размер 741.3KB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

CodeAssist

Codeassist: расширенный инструмент завершения кода

Введение

Функции

Выпустить модели

Демо

Установить

Использование

Модель WizardCoder

Distilgpt2 модель

Используйте с Huggingface/Transformers:

Модель поезда

Поезда модель WizardCoder

Поезд Distilgpt2 модель

Сервер

Набор данных

Контакт

Цитирование

Лицензия

Способствовать

Ссылка

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express