embedding_studio ดาวน์โหลด - embedding_studio ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

embedding_studio

ซอร์สโค้ดอื่น ๆ

v0.0.1

ดาวน์โหลด

เว็บไซต์•เอกสารประกอบ•ความท้าทายและโซลูชัน•ใช้กรณี

Embedding Studio เป็นเฟรมเวิร์กโอเพนซอร์ซนวัตกรรมที่ออกแบบมาเพื่อแปลงรูปแบบการฝังแบบรวมและฐานข้อมูลเวกเตอร์ให้เป็นเครื่องมือค้นหาที่ครอบคลุม ด้วยฟังก์ชั่นในตัวสำหรับคอลเลกชัน Clickstream การปรับปรุงประสบการณ์การค้นหาอย่างต่อเนื่องและการปรับตัวอัตโนมัติของรูปแบบการฝังมันจึงเป็นโซลูชันนอกกรอบสำหรับเครื่องมือค้นหาเต็มวงจร

การสนับสนุนชุมชน

การฝังสตูดิโอเติบโตด้วยความกระตือรือร้นของทีมของเรา ดาวของคุณในพื้นที่เก็บข้อมูล ช่วยให้เราพัฒนาต่อไป
เข้าร่วมกับเราในการบรรลุเป้าหมายของเรา:

คุณสมบัติ

เปลี่ยนฐานข้อมูลเวกเตอร์ของคุณให้เป็นเครื่องมือค้นหาเต็มวงจร
️รวบรวมคำติชมของผู้ใช้เช่น ClickStream
(*) ปรับปรุงประสบการณ์การค้นหาทันทีโดยไม่ต้องรอเวลารอ
(*) ตรวจสอบคุณภาพการค้นหาของคุณ
ปรับปรุงโมเดลการฝังของคุณผ่านขั้นตอนการปรับจูนการวัดซ้ำ ๆ ซ้ำ ๆ
- (*) ใช้รูปแบบการฝังรุ่นใหม่สำหรับการอนุมาน
(*) การปรับแต่งการฝังข้อมูลแคตตาล็อกของคุณก่อน
- (*) ใช้และปรับปรุงตัวแยกวิเคราะห์แบบสอบถามแบบไม่มีการยิงเพื่อผสมฐานข้อมูลที่มีโครงสร้างของคุณเข้ากับการค้นหาที่ไม่มีโครงสร้าง

(*) - คุณสมบัติในการพัฒนา

Embedding Studio สามารถปรับแต่งได้สูงดังนั้นคุณสามารถนำมาเอง:

แหล่งข้อมูล
ฐานข้อมูลเวกเตอร์
ฐานข้อมูล ClickStream
รูปแบบการฝัง

สตูดิโอฝังตัวเมื่อใดที่เหมาะสมที่สุด?

เพิ่มเติมเกี่ยวกับที่นี่

ธุรกิจที่มีแคตตาล็อกที่กว้างขวางและข้อมูลที่ไม่มีโครงสร้างมากมาย
?? แพลตฟอร์มลูกค้าเป็นศูนย์กลางจัดลำดับความสำคัญของประสบการณ์ส่วนบุคคล
แพลตฟอร์มเนื้อหาแบบไดนามิกที่มีการพัฒนาเนื้อหาและการตั้งค่าของผู้ใช้
- แพลตฟอร์มที่จัดการกับคำค้นหาการค้นหาที่เหมาะสมและมีหลายแง่มุม
การรวมประเภทข้อมูลแบบผสมในกระบวนการค้นหา
แพลตฟอร์มที่กำลังมองหาการเพิ่มประสิทธิภาพอย่างต่อเนื่องผ่านการโต้ตอบของผู้ใช้
- องค์กรที่ใส่ใจงบประมาณกำลังมองหาโซลูชั่นที่ทรงพลัง แต่ราคาไม่แพง

ความท้าทายสามารถแก้ไขได้

ข้อจำกัดความรับผิดชอบ: Embedding Studio ไม่ใช่ฐานข้อมูลเวกเตอร์อื่น แต่เป็นเฟรมเวิร์กที่ช่วยให้คุณเปลี่ยนฐานข้อมูลเวกเตอร์ของคุณเป็นเครื่องมือค้นหาที่มีความแตกต่างทั้งหมด

ไม่มีอะไรนอกจากแคตตาล็อก แต่คุณต้องการการสาธิตอย่างรวดเร็ว
คุณภาพการค้นหาแบบคงที่ แต่คุณต้องการให้ดีขึ้นตามกาลเวลา
การปรับปรุงประสบการณ์ผู้ใช้ใช้เวลานานเกินไปและผู้ใช้ของคุณรู้สึกผิดหวัง
การอัปเดตดัชนีที่ช้าและทรัพยากรหมด
ผสมผสานการค้นหาที่มีโครงสร้างและไม่มีโครงสร้างและคุณไม่รู้วิธีรวมกัน
การค้นหาที่มีโครงสร้างพร้อมแบบสอบถามที่ไม่มีโครงสร้างและคุณต้องการแยกวิเคราะห์อย่างถูกต้อง
รายการสดกำลังหายไป

ข้อมูลเพิ่มเติมเกี่ยวกับความท้าทายและการแก้ปัญหาที่นี่

ภาพรวม

เฟรมเวิร์กของเราช่วยให้คุณปรับแต่งโมเดลของคุณได้อย่างต่อเนื่องตามประสบการณ์ของผู้ใช้ช่วยให้คุณสามารถสร้างผลการค้นหาสำหรับการสืบค้นผู้ใช้ได้เร็วขึ้นและแม่นยำยิ่งขึ้น

$ color {red} { textsf {red:}} $ บนกราฟโซลูชันการค้นหาทั่วไปโดยไม่มีการปรับปรุงเช่นการค้นหาข้อความแบบเต็ม (FTS), การค้นหาเพื่อนบ้านที่ใกล้ที่สุด (NNS) และอื่น ๆ ถูกทำเครื่องหมายเป็นสีแดง หากไม่มีการใช้เครื่องมือเพิ่มเติมคุณภาพการค้นหาจะไม่เปลี่ยนแปลงตลอดเวลา

$ color {Orange} { textsf {Orange:}} $ โซลูชันเป็นภาพที่สะสมข้อเสนอแนะบางอย่าง (คลิก, รีวิว, การลงคะแนน, การอภิปราย, ฯลฯ ) จากนั้นเริ่มต้นการฝึกอบรมแบบเต็มรูปแบบ ปัญหาหลักของโซลูชันเหล่านี้คือการฝึกอบรมแบบจำลองแบบเต็มรูปแบบเป็นขั้นตอนที่ใช้เวลานานและมีราคาแพงดังนั้นจึงขาดการปรับปฏิกิริยา (ตัวอย่างเช่นเมื่อผลิตภัณฑ์มีความต้องการเพิ่มขึ้นอย่างกะทันหันและระบบการค้นหายังไม่ได้ปรับให้เข้ากับมัน)

$ color {#6666ff} { textsf {indigo:}} $ เราเสนอวิธีแก้ปัญหาที่ช่วยให้การรวบรวมความคิดเห็นของผู้ใช้และฝึกอบรมแบบจำลองใหม่อย่างรวดเร็วเกี่ยวกับความแตกต่างระหว่างเวอร์ชันเก่าและใหม่ สิ่งนี้ช่วยให้เส้นโค้งคุณภาพการค้นหาที่นุ่มนวลและเกี่ยวข้องมากขึ้นสำหรับระบบของคุณ

การฝังแผนภูมิสตูดิโอ

เอกสาร

ดูเอกสารอย่างเป็นทางการของเรา

เริ่มต้น

สวัสดีโลกที่ไม่มีโครงสร้าง!

หากต้องการลองใช้ Embedding Studio คุณสามารถเปิดตัวโครงการสาธิตที่กำหนดค่าล่วงหน้าได้ เราได้จัดทำชุดข้อมูลที่เก็บไว้ในถังสาธารณะ S3 ตัวจำลองสำหรับการคลิกผู้ใช้และสคริปต์พื้นฐานสำหรับการปรับแต่งโมเดล ด้วยการปรับให้เข้ากับความต้องการของคุณคุณสามารถเริ่มการปรับแต่งสำหรับรุ่นของคุณ

ตรวจสอบให้แน่ใจว่าคุณมีคำสั่ง docker compose version ในระบบของคุณ:

Docker Compose version v2.23.3

คุณยังสามารถลองใช้คำสั่งเวอร์ชัน Docker-compose ก้าวไปข้างหน้าเราจะใช้คำสั่งเวอร์ชัน Docker Compose รุ่นใหม่ แต่คำสั่งเวอร์ชันที่ใช้งาน Docker อาจทำงานได้สำเร็จในระบบของคุณ

ประการแรกนำบริการสตูดิโอฝังทั้งหมดขึ้นมาโดยดำเนินการคำสั่งต่อไปนี้:

docker compose up -d

เมื่อบริการทั้งหมดขึ้นคุณสามารถเริ่มใช้ Embedding Studio มาจำลองเซสชันการค้นหาผู้ใช้กันเถอะ เราจะเรียกใช้สคริปต์ที่สร้างไว้ล่วงหน้าซึ่งจะเรียกใช้ Embedding Studio API และเลียนแบบพฤติกรรมผู้ใช้:

docker compose --profile demo_stage_clickstream up -d

หลังจากการดำเนินการสคริปต์คุณสามารถเริ่มต้นการปรับแต่งแบบจำลองได้ ดำเนินการคำสั่งต่อไปนี้:

docker compose --profile demo_stage_finetuning up -d

สิ่งนี้จะเข้าคิวงานที่ดำเนินการโดยคนงานปรับแต่ง ในการดึงงานทั้งหมดในคิวการปรับแต่งให้ส่งคำขอรับไปยังจุดสิ้นสุด /api/v1/fine-tuning/task :

curl -X GET http://localhost:5000/api/v1/fine-tuning/task

คำตอบจะเป็นเช่น:

[
  {
    "fine_tuning_method" : " Default Fine Tuning Method " ,
    "status" : " processing " ,
    "created_at" : " 2023-12-21T14:30:25.823000 " ,
    "updated_at" : " 2023-12-21T14:32:16.673000 " ,
    "batch_id" : " 65844a671089823652b83d43 " ,
    "id" : " 65844c019fa7cf0957d04758 "
  }
]

เมื่อคุณมี ID งานแล้วคุณสามารถตรวจสอบความคืบหน้าการปรับแต่งได้โดยตรงโดยส่งคำขอ GET ไปยังจุดสิ้นสุด /api/v1/fine-tuning/task/{task_id} :

curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758

ผลลัพธ์จะคล้ายกับสิ่งที่คุณได้รับเมื่อสอบถามงานทั้งหมด สำหรับวิธีที่สะดวกยิ่งขึ้นในการติดตามความคืบหน้าคุณสามารถใช้ mlflow ได้ที่ http: // localhost: 5001

นอกจากนี้ยังมีประโยชน์ในการตรวจสอบบันทึกของ fine_tuning_worker เพื่อให้แน่ใจว่าทุกอย่างทำงานได้อย่างถูกต้อง ในการทำเช่นนี้แสดงรายการบริการทั้งหมดโดยใช้คำสั่ง:

docker logs embedding_studio-fine_tuning_worker-1

หากทุกอย่างเสร็จสมบูรณ์คุณจะเห็นบันทึกที่คล้ายกับ:

Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00,  0.17it/s, v_num = 8]
[2023-12-21 14:59:05,931] [PID 7] [Thread-6] [pytorch_lightning.utilities.rank_zero] [INFO] ` Trainer.fit ` stopped: ` max_epochs=3 ` reached.
Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00,  0.17it/s, v_num = 8]
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Save model (best only, current quality: 8.426392069685529e-05)
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Save model for 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:06,009] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [WARNING] No finished experiments found with model uploaded, except initial
[2023-12-21 14:59:16,432] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Upload is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Saving is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current run 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:16,445] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current run is finished
[2023-12-21 14:59:16,656] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current iteration 2
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current iteration is finished
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.worker] [INFO] Fine tuning of the embedding model was completed successfully !

ยินดีด้วย! คุณได้ปรับปรุงโมเดลให้สำเร็จแล้ว!

ในการดาวน์โหลดรุ่นที่ดีที่สุดคุณสามารถใช้ Embedding Studio API:

curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758

หากทุกอย่างโอเคคุณจะเห็นผลลัพธ์ต่อไปนี้:

{
  "fine_tuning_method" : " Default Fine Tuning Method " , 
  "status" : " done " , 
  "best_model_url" : " http://localhost:5001/get-artifact?path=model%2Fdata%2Fmodel.pth&run_uuid=571304f0c330448aa8cbce831944cfdd " , 
  ...
}

และฟิลด์ best_model_url มีไฟล์ model.pth ที่เข้าถึงได้ HTTP

คุณสามารถดาวน์โหลดไฟล์ *.pth โดยดำเนินการคำสั่งต่อไปนี้:

wget http://localhost:5001/get-artifact ? path=model%2Fdata%2Fmodel.pth & run_uuid=571304f0c330448aa8cbce831944cfdd

การบริจาค

เรายินดีต้อนรับการมีส่วนร่วมในการฝังสตูดิโอ!

ใบอนุญาต

Embedding Studio ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache เวอร์ชัน 2.0 ดูใบอนุญาตสำหรับข้อความใบอนุญาตเต็มรูปแบบ

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.0.1
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-12
ขนาด 10.51MB
มาจาก Github

แอปที่เกี่ยวข้อง

PwR Studio

2024-11-14
studio

2024-11-13
langgraph studio

2024-11-09
DiffSynth Studio

2024-11-08
sam2 studio

2024-11-08
gb studio

2024-11-06

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด