Use um arquivo txt para abrigar seu conjunto de dados. Um recurso para exportar seu TXT para um arquivo JSONL será adicionado em breve.
A criação de conjuntos de dados de geração de PNL e textos é extremamente impactante e tem o potencial de permitir que os pesquisadores treinem modelos que possam gerar automaticamente o texto. No entanto, a criação de conjuntos de dados personalizados é um processo teoso e lento.
A ajuda do conjunto de dados de texto é uma ferramenta útil que pode ajudar na criação de conjuntos de dados Finetuning para modelos de geração de texto como o GPT-3 manualmente! Isso pode tornar o texto gerado pelo seu modelo após o Finetuning para ser mais personalizado, detalhado ou melhor formatado. Diga não a lidar com os menus através de configurações de tecla de atalho!
Este plug -in pode ser usado para gerar rapidamente dados de treinamento para modelos de PNL e geração de texto. Isso aceleraria a pesquisa nessas áreas, além de facilitar a treina desses modelos.
O plug-in de ajuda do conjunto de dados de texto é uma ferramenta útil que pode ajudar na criação de conjuntos de dados Finetuning para modelos de geração de texto como o GPT-3 manualmente. Isso pode tornar o texto gerado pelo seu modelo após o Finetuning para ser mais personalizado, detalhado ou melhor formatado. Diga não a lidar com os menus através de configurações de tecla de atalho!
Atualizar seu próprio modelo de geração de texto no conjunto de dados coletados enquanto trabalha no seu segundo cérebro permite que seu modelo atenda melhor às necessidades do seu segundo cérebro. Este plug -in se encaixa em qualquer fluxo de trabalho de criação ou edição devido à natureza dos comandos na obsidiana. Espero que você use este plugin tanto quanto eu!
O modelo de geração de texto permite a criação de texto mais natural e expressivo.
Um ótimo recurso para os princípios de ajuste fino da Microsoft
A função principal deste plug -in é facilitada pelo uso do modo VIM, mas deve funcionar em ambos os casos. Atualmente, existem dois comandos oferecidos: (Cada um desses comandos possui uma tecla de atendimento à acumulação configurável das teclas de hot teclas)
Quando você envia o prompt para o conjunto de dados, se já houver um prompt para lá, o plug -in não fará nada.
Quando você envia a conclusão para o conjunto de dados e já existe um aviso, a seleção de texto é enviada ao conjunto de dados como uma conclusão para esse prompt.
Quando você envia a conclusão para o conjunto de dados e não há um prompt, a seleção de texto é inserida no conjunto de dados com um prompt vazio com antecedido à seleção de texto.
Um exemplo disso
{ "prompt" : " " , "completion" : " Hello can I help you? " }outro exemplo
{ "prompt" : " " , "completion" : " Hi, How can I help you today " }Envie a seleção para enviar para o seu arquivo de conjunto de dados, como prompt, envie a seleção para enviar para o seu arquivo de conjunto de dados como conclusão
Exemplo de conjunto de dados de Finetuning
{ "prompt" : " Company: BHFF insurance n Product: allround insurance n Ad:One stop shop for all your insurance needs! n Supported: " , "completion" : " yes " }
{ "prompt" : " Company: Loft conversion specialists n Product: - n Ad:Straight teeth in weeks! n Supported: " , "completion" : " no " }<vault>/.obsidian/plugins/.obsidian pode estar oculta. No MacOS, você poderá pressionar Command+Shift+Dot para mostrar a pasta no Finder.Existem quatro configurações principais que são configuráveis no painel de configurações do plug -in, mas os valores padrão são configurados para o formato popular para conjuntos de dados para modelos de geração de texto chamados JSONL.
| Nome da configuração | Descrição | Padrão |
|---|---|---|
| Prefixo para prompts | Esta é a string que é antecipada ao prompt quando enviado ao conjunto de dados | {"prompt": |
| Sufixo para prompts | Esta é a string que é anexada ao prompt quando enviado ao conjunto de dados | , |
| Prefixo para conclusão | Esta é a string que é presa à conclusão quando enviada ao conjunto de dados | "completion": |
| Sufixo para conclusão | Esta é a string que é anexada à conclusão quando enviada ao conjunto de dados | }n |
Ajuda no desenvolvimento
Criando uma nova versão:
git tag -a 1.0.1 -m " 1.0.1 "
git push origin 1.0.1Inspirado pela eficiência e apelo de ajustar o seu próprio modelo de idioma, este plug-in permite criar conjuntos de dados a partir de suas anotações na forma de prompts e respostas. Formata automaticamente o texto para a especificação do OpenAI para modelos de Finetuning como o GPT3.
Este plug -in compartilha as simularidades do plug -in TextTransportter fabricado por Tfthacker
Feito com ❤️ por Conner Ohnesorge