Download alreadyme ai research - alreadyme ai research

alreadyme ai research

Código-Fonte de IA

1.0.0

Baixar

Já é

Gerar readme.md com o GPT-3 de aprendizado

Introdução

A pesquisa já-AI-AI é um projeto essencial para gerar README.md a partir de códigos de origem em qualquer repositório. O modelo AI lê algumas partes dos códigos de origem e escreve um documento README.md correspondente. Atualmente, a equipe já está fornecendo um serviço sobre esse recurso e você pode encontrar nossos resultados nesta página.

Este repositório contém vários subprojetos. Você pode ver as descrições detalhadas nos diretórios.

Preparação de dados : o fonte codifica para a preparação de um conjunto de dados de trem.
Modelo-Finetuning : Como ajustar modelos de linguagem em larga escala com eficiência.
Geração da frase : maneira eficiente e escalável de gerar frases para porção de modelos.

Como funciona?

Como os modelos em larga escala como o GPT-3 mostraram, o aprendizado de poucos tiros é a chave mais importante para a construção do modelo de linguagem generalizada. Eles podem entender o que deveriam escrever de acordo com os exemplos de prompt e poucos anos anteriores. Usando esses recursos, eles podem fazer quase qualquer coisa sem ajuste fino. Eles podem resumir as notícias, responder às perguntas e até conversar!

O OpenAI Codex introduziu um novo modelo Langauge em larga escala para linguagens de programação por GPT-3 de ajuste fino. Agora, podemos esperar o desempenho generalizado (aprendizado de poucos tiros) nas linguagens de programação. Por exemplo, crie um documento do código -fonte, escreva um novo código da descrição (e é assim que o copilot funciona) e traduz do Python para o Java.

Usamos o Bloom, que é para ciência aberta e acesso aberto do modelo de linguagem em larga escala. A Bloom suporta multilíngue, que não são apenas linguagens naturais, mas também as linguagens de programação. Projetamos modelos rápidos e encontramos a melhor versão deles.

 &&&&&&
$ head -n 30 model-finetuning/src/data.py
from __future__ import annotations

from dataclasses import dataclass

import torch
[...]

&&&&&&
$ head -n 37 model-finetuning/src/train.py
from __future__ import annotations

import argparse
import os
[...]

&&&&&&
$ git config --get remote.origin.url
https://github.com/readme-generator/alreadyme-ai-research.git

&&&&&&
$ cat README.md
[...]

Todos os exemplos serão separados por &&&&&& . Projetamos para fazer Bloom para executar (ou simular) o comando Linux Bash. A Bloom lerá algumas partes dos códigos de origem do prompt fornecido e gerará um arquivo README.md adequado.

Para mais detalhes, consulte o nosso subprojeto de modelo-finerunamento .

Licença

A pesquisa já-AI-AI é lançada sob a licença Apache 2.0. A licença pode ser encontrada aqui.

Citações

 @misc { https://doi.org/10.48550/arxiv.2005.14165 ,
	title        = { Language Models are Few-Shot Learners } ,
	author       = { Brown, Tom B. and Mann, Benjamin and Ryder, Nick and Subbiah, Melanie and Kaplan, Jared and Dhariwal, Prafulla and Neelakantan, Arvind and Shyam, Pranav and Sastry, Girish and Askell, Amanda and Agarwal, Sandhini and Herbert-Voss, Ariel and Krueger, Gretchen and Henighan, Tom and Child, Rewon and Ramesh, Aditya and Ziegler, Daniel M. and Wu, Jeffrey and Winter, Clemens and Hesse, Christopher and Chen, Mark and Sigler, Eric and Litwin, Mateusz and Gray, Scott and Chess, Benjamin and Clark, Jack and Berner, Christopher and McCandlish, Sam and Radford, Alec and Sutskever, Ilya and Amodei, Dario } ,
	year         = 2020 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2005.14165 } ,
	url          = { https://arxiv.org/abs/2005.14165 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { https://doi.org/10.48550/arxiv.2107.03374 ,
	title        = { Evaluating Large Language Models Trained on Code } ,
	author       = {Chen, Mark and Tworek, Jerry and Jun, Heewoo and Yuan, Qiming and Pinto, Henrique Ponde de Oliveira and Kaplan, Jared and Edwards, Harri and Burda, Yuri and Joseph, Nicholas and Brockman, Greg and Ray, Alex and Puri, Raul and Krueger, Gretchen and Petrov, Michael and Khlaaf, Heidy and Sastry, Girish and Mishkin, Pamela and Chan, Brooke and Gray, Scott and Ryder, Nick and Pavlov, Mikhail and Power, Alethea and Kaiser, Lukasz and Bavarian, Mohammad and Winter, Clemens and Tillet, Philippe and Such, Felipe Petroski and Cummings, Dave and Plappert, Matthias and Chantzis, Fotios and Barnes, Elizabeth and Herbert-Voss, Ariel and Guss, William Hebgen and Nichol, Alex and Paino, Alex and Tezak, Nikolas and Tang, Jie and Babuschkin, Igor and Balaji, Suchir and Jain, Shantanu and Saunders, William and Hesse, Christopher and Carr, Andrew N. and Leike, Jan and Achiam, Josh and Misra, Vedant and Morikawa, Evan and Radford, Alec and Knight, Matthew and Brundage, Miles and Murati, Mira and Mayer, Katie and Welinder, Peter and McGrew, Bob and Amodei, Dario and McCandlish, Sam and Sutskever, Ilya and Zaremba, Wojciech},
	year         = 2021 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2107.03374 } ,
	url          = { https://arxiv.org/abs/2107.03374 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Machine Learning (cs.LG), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { https://doi.org/10.48550/arxiv.2106.09685 ,
	title        = { LoRA: Low-Rank Adaptation of Large Language Models } ,
	author       = { Hu, Edward J. and Shen, Yelong and Wallis, Phillip and Allen-Zhu, Zeyuan and Li, Yuanzhi and Wang, Shean and Wang, Lu and Chen, Weizhu } ,
	year         = 2021 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2106.09685 } ,
	url          = { https://arxiv.org/abs/2106.09685 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Computation and Language (cs.CL), Artificial Intelligence (cs.AI), Machine Learning (cs.LG), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { bigscience_2022 ,
	title        = { Bigscience large open-science openaccess multilingual language model. } ,
	author       = { BigScience } ,
	year         = 2022 ,
	journal      = { bigscience/bloom · Hugging Face } ,
	url          = { https://huggingface.co/bigscience/bloom }
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-08
tamanho 34.65KB
Vindo de Github

Aplicativos Relacionados

hydrax abyss research

2024-11-07
Na frente dele

2024-07-08
Aplicativo especialista em pesquisa de cores

2024-04-01
Criador de IA

2023-04-23
Jaspe IA

2023-04-12
IA alienígena

2022-07-29

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos