Download de nanoChatGPT - download de código -fonte nanoChatGPT

nanoChatGPT

Código-Fonte de IA

1.0.0

Baixar

nanochatgpt

um nanogpt nos barebones, mas fino em dados de conversação

Todas as atualizações em atualizações.md
Link colab
Para visualizar seus capabilitos, vá para o Colab Link, basta executar o git clone , pip install e prepare.py e depois executar chat.py com --init_from=huggingface

Características

Conjunto de dados médio (~ 700 MB), cheio de uma variedade de conversas e um pouco de aritmética
Modelo e conjuntos de dados Avalível no Huggingface
(na melhor das hipóteses), pode falar com você sobre uma variedade de tópicos e alternar suavemente entre tópicos
GPT-2-Medium 353 milhões de parâmetros
Inferência muito rápida na GPU
Usuário para Bot Chat
Chat.py tem funções semelhantes ao OpenAI API Stop, remove todo o conteúdo após uma determinada palavra
Definindo o contexto para iniciar a conversa, fazendo uma nova personalidade para o chatbot
!python chat.py --init_from=huggingface --context=""

Como funciona?

Este é um garfo de nanogpt, mas treinado no formato de dados de um chatbot como o chatgpt, com o formato inspirado no oasst-pythia-12b

 <human> ... <endOfText>
<Bot> ... <endOfText>
<human> ... <endOfText>
<Bot> ... <endOfText>
<human> ... <endOfText>
<Bot> ... <endOfText>

Problemas / Todos

Matemática e raciocínio lógico
- Embora principalmente do escopo desse modelo, isso é algo para modelos futuros, as duas principais opções são detectar matemática e executar código de back-end ou treinar o modelo com a aplicação da cadeia de matemática, o que provavelmente é mais viável, para raciocínio lógico, posso tentar incorporar conjuntos de dados como garage-bAInd/Open-Platypus , etc. etc.
Sem memória/recall
- Embora provavelmente fora de escopo para esse modelo, isso é algo para modelos futuros, com muitos modelos, você pode perguntar do que estava falando ou resumir a conversa acima. Quando isso é tentado com este modelo:
```
 Human: Dogecoin is cool 
Bot: indeed, very shibe
Human: what were we just talking about?
Bot: me and a friend gave up on mining, but now I can
```
  Como podemos ver, continua com uma frase de mineração, confirmando que ele entendeu o contexto (informações do GPT2), mas não tem a capacidade de recordar. Suspeito que isso tenha a ver com os dados dos modelos e que, se eu alimentasse dados de TI, como Dados de Chamada e Resumo de Contexto de Curto

Qualquer pessoa que possa contribuir para o repositório, faça isso, todas e quaisquer contribuições são bem -vindas, basta adicionar um pouco ao conjunto de dados e expandir o conjunto de dados de TI seria incrível.

Limitações

Não fiz os despejos/corpus de dados que compõem esses dados e não podem explicar nenhum vieses, pois o conjunto de dados se baseia nas conversas de pessoas reais que podem ou não ter vieses. O modelo é destinado a fins de pesquisa acadêmica e não é para nenhum cenário de risco importante ou de alto risco. Não siga seu conselho

O que está nos dados

Personachat Corpus (não para uso comercial)
Twitter despeja corpus
Ubuntu Dialog Corpus
Conversas de chatbot arena (não para uso comercial)
Bate -papo empático do parlai (não para uso comercial)
Hackernews despeja corpus
Babylm Challenge Data de fala (inseguro, mas provavelmente não para uso comercial)
Conjunto de dados aritmético da eleuthier ai
Uma pequena parte do Oasst-1

Para fins comerciais, basta pegar os arquivos input1.txt através input36.txt

citações

 @misc{zheng2023judging,
      title={Judging LLM-as-a-judge with MT-Bench and Chatbot Arena}, 
      author={Lianmin Zheng and Wei-Lin Chiang and Ying Sheng and Siyuan Zhuang and Zhanghao Wu and Yonghao Zhuang and Zi Lin and Zhuohan Li and Dacheng Li and Eric. P Xing and Hao Zhang and Joseph E. Gonzalez and Ion Stoica},
      year={2023},
      eprint={2306.05685},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

Expandir

Informações adicionais