使用TXT文件来容纳您的数据集。将很快添加将TXT导出到JSONL文件的功能。
NLP和文本生成数据集的创建具有极大的影响力,并且有可能使研究人员能够训练可以自动生成文本的模型。但是,自定义数据集的创建是一个典型而缓慢的过程。
文本数据集辅助工具是一个有用的工具,可以帮助创建fineTuning数据集,用于手工的文本生成模型!这可以使您的模型产生的文本在Fineting之后产生,以更具个性化,详细或更好的格式。通过热键配置来处理菜单,拒绝了!
该插件可用于快速为NLP和文本生成模型生成培训数据。这将加快在这些领域的研究,并使从业者更容易训练这些模型。
文本数据集辅助插件是一个有用的工具,可以帮助创建fineTuning数据集,用于手动使用GPT-3(例如GPT-3)。这可以使您的模型产生的文本在Fineting之后产生,以更具个性化,详细或更好的格式。通过热键配置来处理菜单,拒绝了!
在第二个大脑中工作的同时,在收集的数据集上更新自己的文本生成模型可以使您的模型更好地满足您的第二大脑需求。由于黑曜石中命令的性质,该插件符合任何创建或编辑工作流程。希望您和我一样使用此插件!
修补文本生成模型可以创建更自然和表现力的文本。
Microsoft的微观原理的绝佳资源
通过使用VIM模式使该插件的核心功能变得更加容易,但在任何一种情况下都应起作用。目前提供了两个命令:(这些命令中的每个命令都有一个可从Hotkeys配置的Acommpanying Hotkey)
如果您已经有提示,则将提示发送到数据集时,该插件什么都不做。
当您将完成发送到数据集时,已经有一个提示符,将文本选择发送到数据集作为该提示的完成。
当您将完成发送到数据集且没有提示时,将文本选择插入数据集中,而将空的提示符添加到文本选择中。
一个例子
{ "prompt" : " " , "completion" : " Hello can I help you? " }另一个例子
{ "prompt" : " " , "completion" : " Hi, How can I help you today " }将选择发送到您的数据集文件时,请提示发送选择以发送到数据集文件作为完成
列出数据集的示例
{ "prompt" : " Company: BHFF insurance n Product: allround insurance n Ad:One stop shop for all your insurance needs! n Supported: " , "completion" : " yes " }
{ "prompt" : " Company: Loft conversion specialists n Product: - n Ad:Straight teeth in weeks! n Supported: " , "completion" : " no " }<vault>/.obsidian/plugins/插件/.obsidian文件夹可能被隐藏。在MacOS上,您应该能够按Command+Shift+Dot以显示Finder中的文件夹。在插件的设置面板中可以配置四个主要设置,但是为文本生成模型的数据集设置了默认值,称为JSONL。
| 设置名称 | 描述 | 默认 |
|---|---|---|
| 提示的前缀 | 这是发送到数据集时将其备用到提示的字符串 | {"prompt": |
| 提示的后缀 | 这是发送到数据集时附加到提示的字符串 | , |
| 完成的前缀 | 这是发送到数据集后完成的字符串 | "completion": |
| 后缀完成 | 这是发送到数据集时将其附加到完成的字符串 | }n |
在发展中的帮助
创建一个新版本:
git tag -a 1.0.1 -m " 1.0.1 "
git push origin 1.0.1受您自己的语言模型的效率和吸引力的启发,该插件允许您以提示和响应的形式从笔记中构建数据集。自动将文本格式化为OpenAI的规格,以供GPT3(例如GPT3)等填充模型。
该插件共享与TFThacker制作的Text Transporter插件的模拟
由Conner Ohnesorge制成的❤️