
미세 조정 • 합성 데이터 생성 • 데이터 세트 협업 • 문서
| CI | |
| 패키지 | |
| 메타 | |
| 앱 |
가마 데스크탑 앱은 완전히 무료입니다. MacOS, Windows 및 Linux에서 사용할 수 있습니다.
이 데모에서는 단 18 분만에 9 개의 미세 조정 모델 (Llama 3.x, Mixtral 및 GPT-4O-Mini 포함)을 만들어 총 $ 6 미만으로 훌륭한 결과를 얻습니다. 세부 사항을 참조하십시오.
Kiln은 매우 직관적이므로 데스크탑 앱을 출시하고 다이빙하는 것이 좋습니다. 그러나 질문이 있거나 더 배우고 싶다면 문서가 도움이됩니다.
개발자는 Kiln Python 라이브러리 문서를 참조하십시오. 여기에는 데이터 세트를 가마에로드하거나 자체 코드베이스/노트북에 가마 데이터 세트를 사용하는 방법이 포함됩니다.
Open-Source Python Library는 Kiln 데이터 세트를 자신의 워크 플로우에 통합하고, 미세 음악을 만들고, 노트북에서 Kiln을 사용하고, 사용자 정의 도구를 구축하는 등을 제공 할 수 있습니다! 예제는 문서를 읽으십시오.
pip install kiln-ai항상 새로운 모델과 기술이 떠오르고 있습니다. Kiln을 사용하면 다양한 접근 방식을 쉽게 시도하고 코드를 작성하지 않고 몇 번의 클릭으로 비교할 수 있습니다. 이로 인해 품질이 높아지고 성능이 향상 될 수 있습니다.
우리는 현재 지원합니다 :
앞으로는 Evals 및 Rag와 같은 강력한 강력한 노 코드 옵션을 추가 할 계획입니다. 숙련 된 데이터 과학자의 경우 오늘날 KILN 데이터 세트와 파이썬 라이브러리를 사용하여 이러한 기술을 만들 수 있습니다.
AI 제품을 구축 할 때 일반적으로 해결하려는 문제를 알고있는 주제 전문가와 모델을 구축하기 위해 할당 된 다른 기술 팀이 있습니다. Kiln은 그 차이를 협업 도구로 다리십시오.
주제 전문가는 직관적 인 데스크톱 앱을 사용하여 코딩하거나 기술 도구를 사용하지 않고 구조화 된 데이터 세트 및 등급을 생성 할 수 있습니다. 명령 줄이나 GPU가 필요하지 않습니다.
데이터 과학자는 주제 전문가가 생성 한 데이터 세트, UI를 사용하거나 파이썬 라이브러리를 사용하여 Dive를 소비 할 수 있습니다.
QA와 PM은 더 빨리 문제를 쉽게 식별하고 모델 계층에서 문제를 해결하는 데 필요한 데이터 세트 컨텐츠를 생성하는 데 도움이 될 수 있습니다.
데이터 세트 파일 형식은 강력한 협업 및 속성을 위해 GIT와 함께 사용하도록 설계되었습니다. 많은 사람들이 동시에 기여할 수 있습니다. 충돌은 UUID를 사용하여 피하고 데이터 세트 파일 내부에서 귀속이 캡처됩니다. 공유 드라이브에서 데이터 세트를 공유 할 수도있어 완전히 비 기술적 인 팀 구성원이 GIT를 모르고 데이터와 EVAL에 기여할 수 있습니다.
제품에는 자연스럽게 "데이터 세트"가 없지만 Kiln은 제품을 만드는 데 도움이됩니다. KILN을 사용할 때마다 제품에 사용하기 위해 고품질 모델을 구축하는 데 필요한 입력, 출력, 사람 등급, 피드백 및 수리를 캡처합니다. 더 많이 사용할수록 더 많은 데이터가 있습니다.
모델에 품질 컨텐츠 (및 실수)의 더 많은 예를 제공함으로써 데이터 세트가 증가함에 따라 모델 품질이 자동으로 향상됩니다.
제품 목표가 전환되거나 새로운 버그가 발견되면 (거의 항상 그렇듯이) 데이터 세트를 쉽게 반복하여 문제를 해결할 수 있습니다.
개발 환경을 설정하고 Kiln에 기여하는 방법에 대한 정보는 Contributing.md를 참조하십시오.
저작권 2024 -Chesterfield Laboratories Inc.