
微调•合成数据生成•数据集协作•文档
| CI | |
| 包裹 | |
| 元 | |
| 应用 |
窑桌面应用程序是完全免费的。在MacOS,Windows和Linux上可用。
在此演示中,我在短短18分钟内创建了9个微调型号(包括Llama 3.x,Mixtral和GPT-4O-Mini),以不到6美元的总成本取得了出色的成果。请参阅详细信息。
窑炉非常直观,因此我们建议启动桌面应用程序并潜入潜水。但是,如果您有任何疑问或想了解更多信息,我们的文档将在这里提供帮助。
对于开发人员,请参阅我们的窑图图书馆文档。其中包括如何将数据集加载到窑中,或在您自己的代码词/笔记本电脑中使用窑炉数据集。
我们的开源Python库使您可以将窑炉数据集集成到自己的工作流程中,构建微调,在笔记本中使用窑炉,构建自定义工具等等!阅读文档以获取示例。
pip install kiln-ai始终有新的模型和技术。窑炉可以轻松尝试各种方法,并在不编写代码的情况下单击几下进行比较。这些可能会导致更高的质量和提高的性能。
我们目前支持:
将来,我们计划添加更强大的无代码选项,例如Evals和Rag。对于经验丰富的数据科学家,您可以使用窑数据集和我们的Python库来创建这些技术。
在构建AI产品时,通常会有一位主题专家知道您要解决的问题,并且分配了不同的技术团队来建立模型。窑桥将差距作为协作工具。
主题专家可以使用我们的直观桌面应用程序来生成结构化的数据集和评级,而无需编码或使用技术工具。无需命令行或GPU。
数据科学家可以使用主题专家创建的数据集,使用UI或深入研究我们的Python库。
质量保证和PM可以更快地轻松识别问题,并帮助生成在模型层上解决问题所需的数据集内容。
数据集文件格式旨在与git一起使用,以进行强大的协作和归因。许多人可以并行贡献。使用UUID避免碰撞,并且在数据集文件中捕获归因。您甚至可以在共享驱动器上共享一个数据集,让完全非技术团队成员在不知道Git的情况下贡献数据和EVALS。
产品自然没有“数据集”,但是窑炉可以帮助您创建一个。每次您使用窑炉时,我们都会捕获所需的投入,输出,人类评级,反馈和维修,以构建用于产品中的高质量模型。您使用的越多,您拥有的数据就越多。
通过为模型提供更多质量内容(和错误)示例,随着数据集的增长,您的模型质量会自动改善。
如果发现产品目标或发现新错误(几乎总是如此),则可以轻松地迭代数据集以解决问题。
有关如何设置开发环境并为窑炉做出贡献的信息,请参见贡献。
版权2024-切斯特菲尔德实验室公司