Download unit minions - Download de código -fonte unit minions

"Pesquisa de melhoria de eficiência em P&D da AI: Treinamento do faça você mesmo Lora"

PS: consulte https://github.com/unit-sesh/unit-eval para tunção fina relacionada à conclusão do código e geração de documentos:

Declaração: Os conjuntos de dados e o binário lora fornecidos por este projeto são todos criados pelo OpenAI ou publicados online. Fornecemos apenas tutoriais relacionados ao treinamento de modelos, e todas as consequências causadas pelo conteúdo real de treinamento do usuário são de responsabilidade do próprio usuário.

Para os engenheiros, podemos ver claramente o impacto de grandes modelos de idiomas, como o ChatGPT, e, portanto, realizamos pesquisas sobre a melhoria da eficiência de P&D da IA - treinamos vários métodos usados para estudar a eficiência de P&D da llama lora e Chatglm Lora.

Este projeto é nosso resultado de pesquisa, incluindo algumas introduções em vídeo, modelos treinados, código de treinamento, dados de treinamento e alguns registros durante o processo de treinamento.

Veja o lançamento para o treinamento de Lora.

Caderno de treinamento:

LLAMA ALPACA LORA
Tunging de bate -papo Lora

Vídeo on -line da série LLAMA:

"Geração assistida por código"
Geração de código de teste
"Geração detalhada de requisitos"
"Texto para SQL"

Vídeo online da série ChatGlm:

"Concorrência de Lora: Chatglm vs Llama, que é mais capaz de escrever documentos de requisitos?》

Índice:

"Pesquisa de melhoria de eficiência em P&D da AI: Treinamento do faça você mesmo Lora"
1. Introdução
  1. Roteiro
  2. Patrocinadores
Design de resumo: padronização do processo
1. Eficiência de P&D
2. Malha de unidade
Preparação de dados
1. Tarefa de isenção de responsabilidade + geração de histórias de usuário
  1. Etapa 1. Gere tarefas de usuário
  2. Etapa 2. Decomponha tarefas de usuário em histórias de usuário
2. Geração assistida por código
  1. Etapa 1. Prepare os dados
  2. Etapa 2. Gere instruções
  3. Formato de informação da classe
  4. Outros: lógica do código principal
3. Geração de código de teste
  1. Etapa 1. Gere código de teste
  2. Etapa 2. Escreva o código de implementação com o OpenAI DaVinci (opcional)
4. Texto para codificar
5. Repositório de geração de texto
  1. Preparação de dados
  2. Exemplo de saída:
6. Conhecimento de domínio
Treinamento e resultados
1. Treinamento de llama baseado em meta
  1. Treinamento 1: Geração de código de teste
  2. Treinamento 2: Histórias de usuário divididas
  3. Treinamento 3: Assistência de código
  4. SQL para codificar
2. Treinamento ChatGlm Lora baseada na Universidade Tsinghua
  1. Geração de código
  2. Geração de teste
  3. Geração de histórias de usuário

Introdução

A conversão de dados relacionada está disponível em: https://github.com/unit-sesh/minions-data-prepare

PS: Se você precisar de uma melhor geração de código, é recomendável usar: https://huggingface.co/salesforce/codegen-16b-mono

GPU em nuvem

Estamos usando a GPU em nuvem fornecida pelo OpenBayes: https://openbayes.com/console/signup?r=phodal_uvxu

O modelo OpenBayes pode ser usado:

llamba-7b-hf: https://openbayes.com/console/open-tutorials/models/lhney50g1tb/1/overview
ChatGlm-6b: https://openbayes.com/console/open-tutorials/models/d24ppo2itu4/1/overview

Roteiro

Roteiro:

Treinamento: conhecimento de domínio (feito)
Treinamento: Geração de código de teste (feito)
Treinamento: Gere Histórias de Usuário (Concluído)
Treinamento: Geração assistida por código (Concluído)
Treinamento: Transformação SQL (Concluído)
Treinamento: texto para codificar (feito)
trem:……
Treinamento: Gere blocos de código da unidade malha

Patrocinadores

Obrigado: AIOS Club for OpenAi Key, obrigado OpenBayes for Cloud GPU

Design de resumo: padronização do processo

A melhoria da eficiência perceptiva da IA depende da padronização da eficiência de P&D e da divisão de cada etapa o mais cuidadosamente possível.

Eficiência de P&D

Para tornar os resultados do treinamento mais precisos, dividimos as etapas do desenvolvimento de software em detalhes para garantir que cada etapa produza resultados precisos, gerando resultados precisos. Aqui está um exemplo de uma pequena parte do processo detalhado que tivemos em nossa divisão inicial:

split_user_story_tasks
create_agile_user_story
Design_restful_api
Design_plantuml_java_datastructure
implementação_mock_mvc_test
implementação_spring_controller
implementação_controller_test
implementação_spring_service
….

Precisamos dividi -lo em cada etapa o menor possível, alimentando dados em cada etapa refinada para tornar a IA produzir o maior efeito repetidor.

Malha de unidade

Todos

Preparação de dados

Usamos instruções muito simples e fornecemos o máximo possível para facilitar a integração na ferramenta. do seguinte modo:

Conhecimento de domínio. Instrução: Conhecimento de domínio.
Divida a tarefa. Instrução: Tarefas de história do usuário dividido, entrada: Tarefas de história do usuário dividido
Renda de refinamento. Instrução: Crie uma história do usuário ágil para o seguinte tópico, entrada: Informações básicas sobre a função
Geração de código. Instrução: Implemente o método xxx, entrada: informações básicas da classe
Geração de teste. Instrução: Teste de gravação para seguir o código, entrada: Informações básicas da classe
Geração SQL. Instrução: texto para SQL, entrada: Problema
Texto para código Java. Instrução: texto para código Java, entrada: Problema

Funções correspondentes Introdução:

Renda de refinamento. A IA auxilia a transformar requisitos vagos em design de demanda, como a função "Registro", e gera: "Como usuário XXX, preencha o nome de usuário, as informações de senha etc. e, em seguida, os humanos a verificam e melhoram.
Geração de código. A IA auxilia os requisitos detalhados projetam e traduzem o código em Target e, em seguida, os humanos verificarem e melhoram.
Geração de teste. A IA auxilia a gerar código de teste correspondente com base no código gerado e, em seguida, os humanos verificam e melhoram.

A julgar pelos resultados dos testes, à medida que a quantidade de dados aumenta, por exemplo, 20.000 casos de uso de código são mais "inteligentes" do que 10.000 casos de uso de código.

Tarefa de isenção de responsabilidade + geração de histórias de usuário

Ideias básicas:

Combinando áreas comuns (como sites on -line), peça emprestado aberto para gerar tarefas de usuário (como login, listas de navegação, etc.)
Gerar histórias de usuários com base em histórias de usuários.
Treinamento Alpaca Lora.

Como mostrado abaixo:

Etapa 1. Gere tarefas de usuário

Ligue para o OpenAI para criar tarefas de usuário por categoria. Prompt da seguinte forma:

Design a User Story Mapping for ${domain} application based on your understanding. Here are the requirements:

1 . Your user story map should include only user tasks to demonstrate how users will interact with the application.
2 . Our user story map should be based on your understanding of the ${domain} application and its users, and should be
   designed to address their needs and pain points.
3 . You may use any tools or formats you choose to create your user story map, but it should be easily shareable and
   understandable by stakeholders.
4 . Your expression should be more concise and clear.
5 . Your return should be like as follows:

###

User Tasks:

1 . ...

###

Saída de amostra:

 User Tasks:
1. Browse and search for animations and comics
2. View details of animations and comics
3. Create an account
4. Log in to the account
5. Add animations and comics to favorites
6. Download animations and comics
7. Share animations and comics with friends
8. Rate and review animations and comics
9. Create and upload animations and comics
10. Participate in online forums and discussions

Etapa 2. Decomponha tarefas de usuário em histórias de usuário

Ligue para o OpenAI para criar histórias de usuário com base nas tarefas do usuário. Prompt da seguinte forma:

为下面的需求编写用户故事：${domain} 应用的 ${story_name} 功能。 要求如下：

1 . 必须要考虑尽可能考虑各种异常场景，添加更多的 AC。
2 . 你的返回模板如下所示：

###

用户故事：可以选择宝贝出行服务
作为 莉莉妈
我想 在滴滴打车的手机客户端里选择宝贝出行服务
以便于 我能够带宝宝打车出行的时候打到有儿童座椅的车

AC 1:  莉莉妈可以选择宝贝出行服务
假设 xxx
当 xxx
于是 xxx

###

Saída de amostra:

用户故事：可以创建和上传动画和漫画
作为一个 Animation and Comics 应用的用户
我想要创建和上传动画和漫画
以便于我可以分享我的作品给其他用户

AC 1: 用户可以创建和上传动画和漫画
假设 用户已经登录到 Animation and Comics 应用
当 用户点击创建和上传动画和漫画按钮
于是 用户可以创建和上传动画和漫画

Geração assistida por código

Ideias básicas:

Elemento copiloto

Etapa 1. Prepare os dados

Faça o download do projeto no Github (precisa incluir casos de teste)
Atravessando o arquivo Java em src/main .
Gerar informações básicas para cada classe:

 PostService(PostRepository, UserRepository, ImageService)
- fields: postRepository:PostRepository, userRepository:UserRepository, userPosts:Set<Post>, imageService:ImageService
- methods: findAll(): List<Post>, addNewPost(Post): Post, saveImageToPost(String, MultipartFile, Post): int

Etapa 2. Gere instruções

Formato JSON esperado:

Instrução: Implemente o método $ {MethodName}
Entrada: $ {classinformation}
saída: $ {code}

Exemplo:

 {"instruction":"Implement the method action","input":"com.thoughtworks.go.config.rules.AbstractDirective(DirectiveType, DirectiveType, String, String, String)n- fields: action:String, type:String, resource:String, configErrors:ConfigErrors, directiveType:DirectiveTypen- methods: validate(ValidationContext): void, isInvalid(String, List<String>): boolean, matchesAction(String): boolean, matchesType(Class<? extends Validatable>): boolean, matchesResource(String): boolean, errors(): ConfigErrors, addError(String, String): void, equals(Object): boolean, action(): String, type(): String, resource(): String, hashCode(): int, hasErrors(): boolean, getDirectiveType(): DirectiveType","output":"public abstract class AbstractDirective implements Directive {nn    @ConfigAttribute(value = "action", optional = false)n    protected String action;nn    @ConfigAttribute(value = "type", optional = false)n    protected String type;nn    @ConfigValuen    private String resource;nn    private final ConfigErrors configErrors = new ConfigErrors();nn    private DirectiveType directiveType;nn    public AbstractDirective(DirectiveType allow) {n        this.directiveType = allow;n    }nn    public AbstractDirective(DirectiveType allow, String action, String type, String resource) {n        this.directiveType = allow;n        this.action = action;n        this.type = type;n        this.resource = resource;n    }nn    @Overriden    public String action() {n        return this.action;n    }n}n"}

Formato de informação da classe

Especificação de formato:

包名.类名(类的构造类型)
- fields：成员变量集合（变量名:类型）
- methods：方法抽象集合（方法名(参数类型): 输出类型）

resultado:

 com.thoughtworks.go.config.rules.AbstractDirective(DirectiveType, DirectiveType, String, String, String)
- fields: action:String, type:String, resource:String, configErrors:ConfigErrors, directiveType:DirectiveType
- methods: validate(ValidationContext): void, isInvalid(String, List<String>): boolean, matchesAction(String): boolean, matchesType(Class<? extends Validatable>): boolean, matchesResource(String): boolean, errors(): ConfigErrors, addError(String, String): void, equals(Object): boolean, action(): String, type(): String, resource(): String, hashCode(): int, hasErrors(): boolean, getDirectiveType(): DirectiveType

Outros: lógica do código principal

 val javaProcessor = JavaProcessor (file.readText())
val shotClass = javaProcessor.toShortClass() ? : return @forEach

javaProcessor
   .removePackage()
   .removeAllImport()
   .removeLicenseInfoBeforeImport()

javaProcessor.splitMethods().forEach { (key, value) ->
   CodegenPrompt (
       instruction = " Implement the method $key " ,
       input = shotClass.toString(),
       output = value
   ). let { prompt ->
       val output = Json .encodeToString(prompt)
       File ( " $targetPath${key} .json " ).writeText(output)
   }
}

Geração de código de teste

Idéias básicas

Idéias de análise gramatical:

Método 1 - Melhorado com base nos dados do OpenAI em caso de tempo limitado. No entanto, os casos de teste escritos pelo OpenAI não são necessariamente confiáveis; portanto, deixe -o gerar código comercial.
Método 2 - No caso de bastante tempo, é uma solução mais razoável analisar a AST para mesclar as primeiras e as segundas etapas. Afinal, a API OpenAI é muito cara.

Etapa 1. Gere código de teste

Faça o download do projeto no Github (precisa incluir casos de teste)
Crie um mapa de arquivos Java em src/main para cada projeto. Se o arquivo de teste correspondente existir ao mesmo tempo, ele será puxado para o conjunto de dados.
E gerar informações básicas para cada classe correspondente (para reduzir o uso do token aberto):

 org.unitmesh.processor.TestClass(String, Int)
- fields: field1:String, field2:Int
- methods: method1(String, Int): String, method2(): Int

Divida cada arquivo de teste de acordo com o caso de teste (ou seja, método @test) e divida -o em n (ou seja, teste1 e test2 são dois dados diferentes)

 class TestProcessorTest {
    @ Test
    void test1 () {
    }
    
    @ Test
    void test2 () {
    }
}

Finalmente, os dados gerados são os seguintes:

{"Classinfo": "com.thoughtworks.go.security.aesencrypter (aescipprovider) n- campos: codificador: base64.encoder, decodificador: base64.decoder, cipherprovider: acipherprovider, ivprovers: ivprovider n-n-providador: aSciprovider, ivprovervador: IVProvider Candecrypt (String): booleano, Encrypt (String): String, Decrypt (String): String, CreateSecretKeyspec (): SecretKeyspec "," TestMethod ":" Classe pública aesencryptTerTest { n n Private aesencryptter aeSEngTtertTer; CriptoException { n string encrypt = aesencryptter.encrypt ("p@ssw0rd"); n assertThat (Encrypt) .startswith ("aes"); n assertThat (n n n.

Etapa 2. Escreva o código de implementação com o OpenAI DaVinci (opcional)

Para um código detalhado, consulte: teste para código.py

Converta os dados acima para JSONL e se fundir em Propt.
Deixe DaVinci completar as perguntas preenchidas em branco.

O último exemplo gerado Propt é o seguinte:

You are a programmer and implementation a method with TDD. Here are the requirements:

1 . According follows class information and tests code to write a method.
2 . Try you best to thinking corner case.
3 . You only return the code, no explain.

class information:

###  

io.github.robwin.swagger.test.AbstractContractValidator()

- methods: findExpectedPaths(Swagger, SwaggerAssertionConfig): Map<String,Path>, getPathsIncludingBasePath(Swagger):
  Map<String,Path>, getPathsWithPrefix(Swagger, String): Map<String,Path>, isBlankOrSlash(String): boolean

###

test code:

###  

/ **

* Tests AbstractContractValidator.
  * /
  @ RunWith (Enclosed.class)
  public class AbstractContractValidatorTest {

  / **
    * Tests getPathsIncludingBasePath().
      * /
      public static class GetPathsIncludingBasePath {

      @ Test
      public void shouldReturnPathsPrefixedIfBasePathSet() {
      // given
      Swagger swagger = buildSwaggerFrom("/swagger.json");
      // when
      Map<String, Path> paths = new DummyValidator().getPathsIncludingBasePath(swagger);
      // then
      paths.entrySet().forEach(e -> assertThat(e.getKey(), startsWith(swagger.getBasePath())));
      }
      }

  / **
    * Tests findExpectedPaths().
      * /
      public static class FindExpectedPaths {
      }

  private static class DummyValidator extends AbstractContractValidator {
  }
  }

###

Texto para codificar

Use conjuntos de dados existentes, incluindo:

Text-to-SQL-conjunto de dados para converter linguagem natural em instruções SQL
Text-to-Code-conjunto de dados para converter linguagem natural em código

No entanto, esses dois conjuntos de códigos não são de alta qualidade, mas estão basicamente disponíveis.

Repositório de geração de texto

Preparação de dados

Analisa o código do projeto Kotlin e extrai todas as classes e métodos.
Estabeleça a correspondência entre o método do repositório e o tipo.
Gere informações básicas sobre o método do repositório.
Ligue para o OpenAI para gerar dados

O formato é o seguinte:

 instruction:
我想查找特定月份（monthly_id）下在某个日期（date）之前的所有费用（expense），以方便了解特定月份内的开销情况。
input:
data class ExpenseEntity(....)

output:
@Query("SELECT * FROM expense WHERE monthly_id = :recurringExpenseId AND date < :beforeDate")
suspend fun getAllExpensesForRecurringExpenseBeforeDate(recurringExpenseId: Long, beforeDate: LocalDate): List<ExpenseEntity>

Exemplo de saída:

 evaluate("text to kotlin repository with class", "我想查询指定年龄的用户（User）的博客数量。n ###data class User(var age: Int, 
val blogId: Int) data class Post(val title: String)###", 0.1, 0.75, 40, 4, 512)

@Query("SELECT COUNT(*) FROM User WHERE age = :age")
abstract fun getBlogCount(age: Int): Long

Conhecimento de domínio

Treinamento 1: PDF

Ideias básicas:

Converter arquivos pdf em texto
Divida o texto em duas partes na forma do instruction , e input output nula.

Exemplo:

 instruction: 介绍一下财通财通宝的基金管理人、基金托管人在履行各自职责的过程中，违反《基金法》?

（一）基金管理人、基金托管人在履行各自职责的过程中，违反《基金法》等法律法规的规定或者基金合同约定， 给基金财产或者基金份额持有人造成损害的，
应当分别对各自的行为依法承担赔偿责任；因共同行为给基金财产或者基金份额持有人造成损害的，应当承担连带赔偿责任，对 损失的赔偿，仅限于直接损失。
但是发生下列情况，当事人可以免责：  1.基金管理人及基金托管人按照中国证监会的规定或当时有效的法律法规的作为或不作为而造成的损失等； 
 2.基金管理人由于按照基金合同规定的投资原则而行使或不行使其投资权而造成的损失等；  3.不可抗力。

Treinamento e resultados

Treinamento de llama baseado em meta

trem:

Método 1: Use diretamente: alpaca-lora.ipynb
Método 2: Use diretamente: OpenBayes Container (PS: Use meu link de convite dedicado para registrar o OpenBayes, cada parte recebe 60 minutos de tempo de uso do RTX 3090, suporta acumulação, permanentemente válida: https://openbayes.com/console/signup?r=phodal_uvxu)))

Tempo de treinamento:

3400+ histórias de usuários, cerca de 25 minutos
8000+ Código de teste, cerca de 1 hora
10000+ Geração assistida pelo código, cerca de 1,5 horas
20000+ Código Assistido Geração, cerca de 3 horas
40000+ Geração assistida pelo código, cerca de 6 horas

Antecedentes relacionados:

Modelo Básico: Meta Open Open Llama Series Modelo: LLAMA-7B-HF
Stanford Alpaca: https://github.com/tatsu-lab/stanford_alpaca
Alpaca lora: https://github.com/tloen/alpaca-lora

Como nosso objetivo não é ajustar o modelo e gerar um modelo geral, mas treinar Lora para um propósito específico. Portanto, não ingressamos nos dados em Stanford Alpaca, portanto o tempo necessário é mais curto. Por exemplo, o código de teste de mais de 8000 anos leva apenas 1 hora e as mais de 3400 histórias de usuários levam apenas 25 minutos.

Treinamento 1: Geração de código de teste

Os resultados do treinamento (LORA) estão disponíveis em: https://github.com/unit-sesh/unit-minions/releases/tag/v0.0.1

 print(evaluate("write test", """
public Set<String> listFilesUsingJavaIO(String dir) {
    return Stream.of(new File(dir).listFiles())
      .filter(file -> !file.isDirectory())
      .map(File::getName)
      .collect(Collectors.toSet());
}
""", 0.1, 0.75, 40, 4, 512))

## Output:

public class ListFilesUsingJavaIOTest {
    @Test
    public void shouldListFilesUsingJavaIO() {
        Set<String> files = ListFilesUsingJavaIO.listFilesUsingJavaIO(new File("dir"));
        assertThat(files, containsInAnyOrder("file1", "file2", "file3"));
    }
}

Treinamento 2: Histórias de usuário divididas

Os resultados do treinamento (LORA) estão disponíveis em: https://github.com/unit-sesh/unit-minions/releases/tag/v0.0.2

Perceber:

Se o conjunto de dados for muito pequeno, defina val_set_size, por exemplo: --val_set_size 500
Se o conjunto de dados for muito pequeno, defina val_set_size, por exemplo: --val_set_size 500
Se o conjunto de dados for muito pequeno, defina val_set_size, por exemplo: --val_set_size 500

Saída de amostra :

 print(evaluate("create Agile user story for following topic: ", "购买电影票", 0.1, 0.75, 40, 4, 512))

用户故事：可以购买电影票
作为一个电影票购买者
我想在购买电影票应用中购买电影票
以便于我可以购买电影票
AC 1: 电影票购买者可以在购买电影票应用中购买电影票
假设 电影票购买者已经登录购买电影票应用
当 电影票购买者点击“购买电影票”按钮
于是 电影票购买者可以在购买电影票应用中购买电影票
AC 2: 电影票购买者可以在购买电影票应用中查看购买记录
假设 电影票购买者已经登录购买电影票应用
当 电影票购买者点击“查看购买记录”按钮
于是 电影票购买者可以在购买电影票应用中查看购买记录
AC 3: 电影票购买者可以在购买电影票应用中查看购买记录
假设 电影票购买者已经登录购买电影票应用
当 电影票购买者点击“查看购买记录”按��

Treinamento 3: Assistência de código

Os resultados do treinamento (LORA) estão disponíveis em: https://github.com/unit-sesh/unit-minions/releases/tag/v0.0.3

Saída de amostra :

 print(evaluate("Implement the method rmFiles", "FileUtils:", 0.1, 0.75, 40, 4, 512))

public class FileUtils {

    private FileUtils() {
    }

    public static void rmFiles(String path) {
        File dir = new File(path);
        File[] files = dir.listFiles();
        if (files != null) {
            for (File file : files) {
                if (file.isFile()) {
                    file.delete();
                } else if (file.isDirectory()) {
                    FileUtils.rmFiles(file.getAbsolutePath());
                }
            }
        }
    }
}

SQL para codificar

Script de conversão: código/texto para sql.py

Diretamente de: conjuntos de dados/sql/sql-train.jsonl

Saída de amostra :

 evaluate("text to sql", "谁是最美丽的人", 0.1, 0.75, 40, 4, 512)
evaluate("text to sql", "小明今年几岁", 0.1, 0.75, 40, 4, 512)
evaluate("text to sql", "What hand guard system is used with a gas piston commando?", 0.1, 0.75, 40, 4, 512)

Treinamento ChatGlm Lora baseada na Universidade Tsinghua

trem:

Use diretamente: chatglm-tuning.ipynb

Geração de código

Geração de teste

Geração de histórias de usuário

Exemplo 1:

 evaluate("Instruction: 创建用户故事nInput: 电影网站: 查看订单详情 nAnswer:")

Instruction: 创建用户故事
Input: 电影网站: 查看订单详情 
Answer:

用户故事:可以查看订单详情
作为一个电影网站的用户
我想查看订单详情
以便于我可以了解订单的详细信息,如订单号、订单状态、订单内容等。

AC 1: 用户可以查看订单详情
假设 用户已经登录
当 用户点击查看订单详情按钮
于是 用户可以查看订单详情,包括订单号、订单状态、订单内容等。

AC 2: 用户可以查看订单详情
假设 用户没有登录
当 用户点击查看订单详情按钮
于是 用户被要求先登录,然后才能查看订单详情,包括订单号、订单状态、订单内容等。

Exemplo 2:

 evaluate("Instruction: 创建用户故事nInput: 团购网站:用户注册nAnswer:")

Instruction: 创建用户故事
Input: 团购网站:用户注册
Answer:
团购网站的用户注册故事:

作为一个团购网站的用户

我想注册一个团购网站的用户账号

以便于我可以使用团购服务,如购买商品、服务等。

AC 1: 团购网站的用户注册账号
假设 用户输入了注册信息
当 用户提交注册信息
于是 用户可以成功注册一个团购网站的用户账号

AC 2: 团购网站的用户注册账号
假设 用户输入了错误的注册信息
当 用户提交注册信息
于是 用户可以被提示输入正确的注册信息,并重新提交注册信息

Expandir