alreadyme ai research Download - alreadyme ai research Source Source Code Скачать

alreadyme ai research

AI Исходный код

1.0.0

Скачать

Alreadyme.md AI Research

Создать readme.md с помощью GPT-3.

Введение

Alreadyme-AI-Research -это основной проект для генерации README.md из исходных кодов в любом репозитории. Модель ИИ считывает некоторые части исходных кодов и записывает соответствующий документ README.md . Команда alreadyme.md в настоящее время предоставляет услугу об этой функции, и вы можете найти наши результаты на этой странице.

Этот репозиторий содержит несколько подпроектов. Вы можете увидеть подробные описания в каталогах.

Проверка данных : исходные коды для подготовки набора данных поезда.
Модельная финиация : как эффективно настраивать крупномасштабные языковые модели.
Генерация предложения : эффективный и масштабируемый способ генерирования предложений для модельной службы.

Как это работает?

Как показали крупномасштабные модели, такие как GPT-3, обучение с несколькими выстрелами является наиболее важным ключом для создания модели обобщенной языка. Они могут понять, что им нужно писать в соответствии с предыдущим подсказом и несколькими примерами. Используя эти функции, они могут делать практически все без точной настройки. Они могут суммировать новости, ответить на вопросы и даже вести разговор!

Codex Openai представила новую крупномасштабную модель Langauge для языков программирования с помощью тонкой настройки GPT-3. Теперь мы можем ожидать обобщенную производительность (несколько выстрелов) на языках программирования. Например, создайте Docstring из исходного кода, напишите новый код из описания (и именно так работает Copilot) и переведйте с Python в Java.

Мы используем Bloom, который предназначен для открытой науки и открытого доступа к крупномасштабной языковой модели. Блум поддерживает многоязычные, которые являются не только естественными языками, но и языками программирования. Мы разработали быстрые шаблоны и нашли лучшую версию из них.

 &&&&&&
$ head -n 30 model-finetuning/src/data.py
from __future__ import annotations

from dataclasses import dataclass

import torch
[...]

&&&&&&
$ head -n 37 model-finetuning/src/train.py
from __future__ import annotations

import argparse
import os
[...]

&&&&&&
$ git config --get remote.origin.url
https://github.com/readme-generator/alreadyme-ai-research.git

&&&&&&
$ cat README.md
[...]

Все примеры будут разделены &&&&&& . Мы разработали, чтобы заставить Bloom выполнить (или имитировать) команду Linux Bash. Bloom будет читать некоторые части исходных кодов из данной подсказки и генерировать правильный файл README.md .

Для получения более подробной информации, ознакомьтесь с нашим подпроектом моделей .

Лицензия

Alreadyme-AI-Research выпускается по лицензии Apache 2.0. Лицензия можно найти здесь.

Цитаты

 @misc { https://doi.org/10.48550/arxiv.2005.14165 ,
	title        = { Language Models are Few-Shot Learners } ,
	author       = { Brown, Tom B. and Mann, Benjamin and Ryder, Nick and Subbiah, Melanie and Kaplan, Jared and Dhariwal, Prafulla and Neelakantan, Arvind and Shyam, Pranav and Sastry, Girish and Askell, Amanda and Agarwal, Sandhini and Herbert-Voss, Ariel and Krueger, Gretchen and Henighan, Tom and Child, Rewon and Ramesh, Aditya and Ziegler, Daniel M. and Wu, Jeffrey and Winter, Clemens and Hesse, Christopher and Chen, Mark and Sigler, Eric and Litwin, Mateusz and Gray, Scott and Chess, Benjamin and Clark, Jack and Berner, Christopher and McCandlish, Sam and Radford, Alec and Sutskever, Ilya and Amodei, Dario } ,
	year         = 2020 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2005.14165 } ,
	url          = { https://arxiv.org/abs/2005.14165 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { https://doi.org/10.48550/arxiv.2107.03374 ,
	title        = { Evaluating Large Language Models Trained on Code } ,
	author       = {Chen, Mark and Tworek, Jerry and Jun, Heewoo and Yuan, Qiming and Pinto, Henrique Ponde de Oliveira and Kaplan, Jared and Edwards, Harri and Burda, Yuri and Joseph, Nicholas and Brockman, Greg and Ray, Alex and Puri, Raul and Krueger, Gretchen and Petrov, Michael and Khlaaf, Heidy and Sastry, Girish and Mishkin, Pamela and Chan, Brooke and Gray, Scott and Ryder, Nick and Pavlov, Mikhail and Power, Alethea and Kaiser, Lukasz and Bavarian, Mohammad and Winter, Clemens and Tillet, Philippe and Such, Felipe Petroski and Cummings, Dave and Plappert, Matthias and Chantzis, Fotios and Barnes, Elizabeth and Herbert-Voss, Ariel and Guss, William Hebgen and Nichol, Alex and Paino, Alex and Tezak, Nikolas and Tang, Jie and Babuschkin, Igor and Balaji, Suchir and Jain, Shantanu and Saunders, William and Hesse, Christopher and Carr, Andrew N. and Leike, Jan and Achiam, Josh and Misra, Vedant and Morikawa, Evan and Radford, Alec and Knight, Matthew and Brundage, Miles and Murati, Mira and Mayer, Katie and Welinder, Peter and McGrew, Bob and Amodei, Dario and McCandlish, Sam and Sutskever, Ilya and Zaremba, Wojciech},
	year         = 2021 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2107.03374 } ,
	url          = { https://arxiv.org/abs/2107.03374 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Machine Learning (cs.LG), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { https://doi.org/10.48550/arxiv.2106.09685 ,
	title        = { LoRA: Low-Rank Adaptation of Large Language Models } ,
	author       = { Hu, Edward J. and Shen, Yelong and Wallis, Phillip and Allen-Zhu, Zeyuan and Li, Yuanzhi and Wang, Shean and Wang, Lu and Chen, Weizhu } ,
	year         = 2021 ,
	publisher    = { arXiv } ,
	doi          = { 10.48550/ARXIV.2106.09685 } ,
	url          = { https://arxiv.org/abs/2106.09685 } ,
	copyright    = { arXiv.org perpetual, non-exclusive license } ,
	keywords     = { Computation and Language (cs.CL), Artificial Intelligence (cs.AI), Machine Learning (cs.LG), FOS: Computer and information sciences, FOS: Computer and information sciences }
}

 @misc { bigscience_2022 ,
	title        = { Bigscience large open-science openaccess multilingual language model. } ,
	author       = { BigScience } ,
	year         = 2022 ,
	journal      = { bigscience/bloom · Hugging Face } ,
	url          = { https://huggingface.co/bigscience/bloom }
}