该项目自动选择给定用例的最佳模型,提示或推理参数的过程,从而使您可以迭代其组合并视觉检查结果。
它假设Ollama已安装并在localhost或远程服务器中提供终点。
这是一个对3种不同型号进行测试的简单提示的实验,看起来像:

(有关此工具辅助的评估过程的更深入的查看,请检查https://dezoito.github.io/2023/12/12/27/rust-ollast-ollama-grid-search.html)。
检查项目的发布页面,或在侧边栏上。
从技术上讲,术语“网格搜索”是指在一系列不同的模型HyperParams上进行迭代以优化模型性能,但这通常意味着诸如batch_size , learning_rate或number_of_epochs之类的参数,在训练中更常用。
但是这里的概念相似:
让我们定义模型的选择,提示和一些参数组合:

每个参数值将对每个选定模型中的每个参数值提交一次,生成一组响应。
同样,您可以通过选择不同的模型来执行A/B测试,并比较相同的提示/参数组合的结果,或在相似配置下测试不同的提示:

比较同一模型的不同提示的结果
您可以保存和管理您的提示(我们想使提示与Open WebUI兼容)

您可以通过键入“/”(也受开放webUI的启发)来自动完成提示:

您可以列出,检查或下载您的实验:

对于明显的错误和拼写错误,请继续提交PR。
如果您想提出一项新功能,更改现有功能或提出更复杂的内容,请在完成公关工作之前打开讨论问题。
确保您已经安装了生锈。
克隆存储库(或叉子)
git clone https://github.com/dezoito/ollama-grid-search.git
cd ollama-grid-search安装前端依赖项。
cd < project root >
# I'm using bun to manage dependencies,
# but feel free to use yarn or npm
bun install确保在检查代码时配置rust-analyzer以运行Clippy 。
如果您正在运行VS代码,请将其添加到您的settings.json文件
{
...
"rust-analyzer.check.command" : " clippy " ,
}(或者,更好的是,只需使用与代码中提供的设置文件)
在开发模式下运行应用程序
cd < project root > /
bun tauri dev去喝杯咖啡,因为这可能需要一段时间。
以下作品和论文引用了这个存储库:
Inouye,D&Lindo,L和Lee,R&Allen,E;计算机科学与工程高级论文:在Lora超参数上进行自动调节圣克拉拉大学,2024 https://scholarcommons.scu.edu/cgi/cgi/cgi/viewcontent.cgi?article=1271&context=cseng_seng_senior = cSeng_Senior = cseng_seniorior = cSeng_Seniorior = cSeng_Seniorior =
非常感谢@fabianlars, @peperroni21和@tomreidnz。