
微調•合成數據生成•數據集協作•文檔
| CI | |
| 包裹 | |
| 元 | |
| 應用 |
窯桌面應用程序是完全免費的。在MacOS,Windows和Linux上可用。
在此演示中,我在短短18分鐘內創建了9個微調型號(包括Llama 3.x,Mixtral和GPT-4O-Mini),以不到6美元的總成本取得了出色的成果。請參閱詳細信息。
窯爐非常直觀,因此我們建議啟動桌面應用程序並潛入潛水。但是,如果您有任何疑問或想了解更多信息,我們的文檔將在這裡提供幫助。
對於開發人員,請參閱我們的窯圖圖書館文檔。其中包括如何將數據集加載到窯中,或在您自己的代碼詞/筆記本電腦中使用窯爐數據集。
我們的開源Python庫使您可以將窯爐數據集集成到自己的工作流程中,構建微調,在筆記本中使用窯爐,構建自定義工具等等!閱讀文檔以獲取示例。
pip install kiln-ai始終有新的模型和技術。窯爐可以輕鬆嘗試各種方法,並在不編寫代碼的情況下單擊幾下進行比較。這些可能會導致更高的質量和提高的性能。
我們目前支持:
將來,我們計劃添加更強大的無代碼選項,例如Evals和Rag。對於經驗豐富的數據科學家,您可以使用窯數據集和我們的Python庫來創建這些技術。
在構建AI產品時,通常會有一位主題專家知道您要解決的問題,並且分配了不同的技術團隊來建立模型。窯橋將差距作為協作工具。
主題專家可以使用我們的直觀桌面應用程序來生成結構化的數據集和評級,而無需編碼或使用技術工具。無需命令行或GPU。
數據科學家可以使用主題專家創建的數據集,使用UI或深入研究我們的Python庫。
質量保證和PM可以更快地輕鬆識別問題,並幫助生成在模型層上解決問題所需的數據集內容。
數據集文件格式旨在與git一起使用,以進行強大的協作和歸因。許多人可以並行貢獻。使用UUID避免碰撞,並且在數據集文件中捕獲歸因。您甚至可以在共享驅動器上共享一個數據集,讓完全非技術團隊成員在不知道Git的情況下貢獻數據和EVALS。
產品自然沒有“數據集”,但是窯爐可以幫助您創建一個。每次您使用窯爐時,我們都會捕獲所需的投入,輸出,人類評級,反饋和維修,以構建用於產品中的高質量模型。您使用的越多,您擁有的數據就越多。
通過為模型提供更多質量內容(和錯誤)示例,隨著數據集的增長,您的模型質量會自動改善。
如果發現產品目標或發現新錯誤(幾乎總是如此),則可以輕鬆地迭代數據集以解決問題。
有關如何設置開發環境並為窯爐做出貢獻的信息,請參見貢獻。
版權2024-切斯特菲爾德實驗室公司