- versión en español de este documento
โมเดล AI ขนาดเล็ก/พิเศษเป็นส่วนประกอบที่จำเป็น-หรือทางเลือก-สำหรับ "Big AI" อย่างไรก็ตามโครงสร้างพื้นฐานสำหรับ AI ขนาดเล็กมีแนวโน้มที่จะท่วมท้นดังนั้นการสร้างด้วย AI ที่มีความเชี่ยวชาญอาจเป็นเรื่องยากใช้เวลานานและมีราคาแพง การวนซ้ำด้วยโมเดลที่แตกต่างกันและโดยเฉพาะอย่างยิ่งกับการผสมผสานที่แตกต่างกันของโมเดลเหล่านี้จึงสามารถแสดงผลไม่ได้
นั่นคือเหตุผลที่เราอยู่ที่นี่ ยินดีต้อนรับสู่ Krixik ที่ซึ่งคุณสามารถทดลองใช้ต้นแบบได้อย่างง่ายดายและรวดเร็วและสร้างขึ้นด้วยโมเดล AI ขนาดเล็ก/พิเศษที่เรียงลำดับหรือเป็นพิเศษผ่าน API ที่ปลอดภัย รุ่นที่คุณใช้ประโยชน์จาก Krixik สามารถเป็นโอเพนซอร์สหรือคุณได้รับการฝึกฝน/ปรับแต่งโดยคุณ
ปัจจุบัน Krixik อยู่ในเบต้าดังนั้นการเข้าถึงไคลเอนต์ Krixik Python จึงเป็นไปตามคำขอเท่านั้น
หากคุณต้องการเข้าร่วมเป็นผู้ทดสอบเบต้าโปรดกรอกแบบฟอร์ม Google สั้น ๆ นี้
เรียกใช้คำสั่งต่อไปนี้เพื่อติดตั้งไคลเอนต์ Krixik Python:
pip install krixik
หมายเหตุ: ต้องใช้ Python เวอร์ชัน 3.8 หรือสูงกว่า
ในการเริ่มต้นเซสชันไคลเอนต์ Krixik ของคุณคุณจะต้องใช้ความลับ api_key และ api_url ที่ไม่ซ้ำกันของคุณ ผู้ทดสอบเบต้าจะได้รับความลับจาก Krixik Admin
แทนที่จะจัดการความลับของคุณโดยตรงเราขอแนะนำให้จัดเก็บไว้ในไฟล์ .env และโหลดผ่าน Python-Dotenv
เมื่อคุณมีความลับของคุณแล้วให้เริ่มต้นเซสชันดังนี้:
from krixik import krixik
krixik . init ( api_key = MY_API_KEY ,
api_url = MY_API_URL ) ... ที่ MY_API_KEY และ MY_API_URL เป็นความลับในบัญชีของคุณ
หากคุณใส่ความลับที่ผิดพลาดโปรดติดต่อเราโดยตรง
มาสร้างไปป์ไลน์การถอดความง่าย ๆ ซึ่งประกอบด้วยโมดูล transcribe เดียว เราสามารถสร้างท่อด้วยรหัสบรรทัดเดียว:
# create a simple transcription pipeline
pipeline = krixik . create_pipeline ( name = 'my_transcribe-pipeline-1' ,
module_chain = [ "transcribe" ])ท่อพร้อมแล้ว! ตอนนี้คุณสามารถประมวลผลไฟล์เสียงผ่านเพื่อสร้างการถอดเสียงของไฟล์เหล่านั้น
pipeline . process ( local_file_path = './path/to/my/mp3' ) เอาต์พุตของไปป์ไลน์นี้จะเป็นบันทึกการบันทึกเวลาของไฟล์เสียงอินพุตของคุณ file_id สำหรับไฟล์ที่ประมวลผลและ request_id สำหรับกระบวนการเอง
สมมติว่าคุณต้องการดำเนินการค้นหาความหมาย (aka vector) ใน transcribe ถอดความโมดูลเอาท์พุท
คุณจะต้องทำสิ่งต่อไปนี้หลังจากการถอดความ:
การสร้างและทดสอบตามลำดับขั้นตอนนี้จะใช้เวลานาน - จัดเตรียมไว้ในบริการการผลิตที่ปลอดภัยยิ่งขึ้น และนั่นคือไม่พยายามทำให้กระบวนการทั้งหมดไม่มีเซิร์ฟเวอร์
อย่างไรก็ตามด้วย Krixik คุณสามารถรวมฟังก์ชั่นนี้เข้ากับไปป์ไลน์ก่อนหน้าของคุณได้อย่างรวดเร็วเพียงแค่เพิ่มโมดูลสองสามโมดูล ไวยากรณ์ยังคงอยู่ข้างต้นดังนั้นการทำท่อใหม่ยังคงใช้เวลาหนึ่งบรรทัด:
# create pipeline with the above-alluded-to modules
pipeline = krixik . create_pipeline ( name = 'transcribe_vsearch' ,
module_chain = [ "transcribe" ,
"json-to-txt" ,
"parser" ,
"text-embedder" ,
"vector-db" ])มาประมวลผลไฟล์ผ่านไปป์ไลน์ใหม่ของคุณ
pipeline . process ( local_file_path = './path/to/my/mp3' ) ตอนนี้มีไฟล์อย่างน้อยหนึ่งไฟล์ในไปป์ไลน์คุณสามารถใช้ file_id ของไฟล์ - ซึ่งถูกส่งคืนในตอนท้ายของกระบวนการข้างต้น - เพื่อทำการค้นหาความหมายบนการถอดเสียงที่เกี่ยวข้องด้วยวิธี semantic_search :
pipeline . semantic_search ( query = "The text you wish to semantically search for goes here" ,
file_ids = [ 'the_file_id_from_above' ])แค่ไหน! ตอนนี้คุณได้คัดลอกไฟล์ประมวลผลการถอดเสียงทำการค้นหาความหมาย (เวกเตอร์) ค้นหาและสามารถนำไปป์ไลน์กลับมาใช้ใหม่สำหรับไฟล์และข้อความค้นหาได้มากเท่าที่คุณต้องการ ... ทั้งหมดในไม่กี่นาทีและมีรหัสสองสามบรรทัด
หากคุณต้องการติดตามพร้อมกับตัวอย่างข้างต้นหรือด้วยคะแนนตัวอย่างอื่น ๆ ที่เราจัดทำในเอกสารจากนั้นเพียงแค่ดึง repo เอกสาร Krixik ทั้งหมด
การทำเช่นนี้จะช่วยให้คุณมีทุกไฟล์ที่คุณต้องการและรหัสจะได้รับการกำหนดค่าให้ทำงานในโครงสร้างไดเรกทอรีนั้นแล้ว
ช่วงของตัวอย่างที่เราบันทึกไว้สำหรับคุณรวมท่อไปที่:
นี่เป็นเพียงส่วนปลายของภูเขาน้ำแข็ง ขณะนี้มีท่ออื่น ๆ อีกมากมาย (ดูที่นี่สำหรับตัวอย่างเพิ่มเติม) และห้องสมุดโมดูล/โมเดล Krixik จะขยายตัวอย่างต่อเนื่อง - อาจรวมโมดูลและโมเดลของการส่งของคุณเอง
ข้างต้นเป็นเพียงการมองที่พลังของ Krixik นอกเหนือจากการกำหนดพารามิเตอร์ที่เป็นไปได้ทั้งหมด (ซึ่งเราไม่ได้สัมผัส) กล่องเครื่องมือ Krixik เป็นคอลเล็กชั่นโมดูลและโมเดลที่เพิ่มขึ้นเรื่อย ๆ สำหรับคุณที่จะสร้างด้วย
หากคุณต้องการเรียนรู้เพิ่มเติมโปรดไปที่เอกสาร Krixik ที่เราเข้าไปดูรายละเอียดเกี่ยวกับ:
ตื่นเต้นกับการจบการศึกษาจาก Krixik จากเบต้า? เราเป็นอย่างนั้น! เรามั่นใจว่าผลิตภัณฑ์นี้จะเตะตูดจำนวนมากและเราอยากให้คุณขึ้นเครื่องเมื่อทำ
หากคุณต้องการที่จะอยู่ในวงเกี่ยวกับการเปิดตัวและเรื่องอื่น ๆ (เราสัญญาว่าจะไม่สแปม) โปรดสมัครสมาชิกกับการติดต่อทางจดหมายจากเราเป็นครั้งคราวที่นี่
ขอบคุณสำหรับการอ่านและยินดีต้อนรับสู่ Krixik!