ดาวน์โหลด nnv - ดาวน์โหลดซอร์สโค้ด nnv

nnv

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

NNV (no-named.v)

โลโก้

NNV (no-named.v) เป็นฐานข้อมูลที่ออกแบบมาเพื่อนำไปใช้ตั้งแต่เริ่มต้นจนถึงการผลิต NNV สามารถปรับใช้ในสภาพแวดล้อมขอบและใช้ในการตั้งค่าการผลิตขนาดเล็ก ด้วยวิธีการทางสถาปัตยกรรมที่เป็นนวัตกรรมที่อธิบายไว้ด้านล่างมีการคาดการณ์และพัฒนาขึ้นเพื่อใช้อย่างน่าเชื่อถือในสภาพแวดล้อมการผลิตขนาดใหญ่เช่นกัน

- อัปเดตรีลีส - 2024.12.09

สำหรับประวัติการอัปเดตแบบเต็มให้ดูประวัติอัปเดต

เราวางแผนที่จะสนับสนุน CFLAT ซึ่งสามารถอำนวยความสะดวกในการบริการที่หลากหลายผ่านการดำเนินงานที่ซับซ้อนมากขึ้นซึ่งเปิดใช้งานการค้นหาหลายเวกเตอร์ CFLAT เป็นเพียงชื่อที่ฉันประกาศเกียรติคุณ โปรดรับทราบ!

- เอ็นวายเรย์

งานที่วางแผนไว้เพื่อเพิ่มประสิทธิภาพการทำงานของขอบ : ในระหว่างการพัฒนาหลักในปัจจุบันเราประสบความสำเร็จในการเขียนและอ่านอย่างรวดเร็วด้วยวิธีการแยก เราวางแผนที่จะเพิ่มตรรกะการให้ข้อมูลนี้ลงในขอบเพื่อคาดหวังการปรับปรุงความเร็วบนขอบและเพื่อจัดการกับการปรับปรุงประสิทธิภาพที่มีอยู่

- NNV

การทดสอบ HNSW เสร็จสมบูรณ์ : สำเร็จ 0.87 มิลลิวินาทีในการค้นหาเวกเตอร์ 1 ล้านตัว มันคือ 0.87 มิลลิวินาทีไม่ใช่วินาที (ที่สองคือ 0.00087 วินาที) นี่คือความสำเร็จที่น่ายินดีมาก
ความคืบหน้าเกี่ยวกับ PQ และ BQ : การตรวจสอบอย่างต่อเนื่องของ PQ และ BQ กำลังดำเนินการอยู่
การบูรณาการการหาปริมาณที่มีอยู่ : การวางแผนที่จะดำเนินการรวมการรวมกลุ่ม (งานรายงานล่าช้าเนื่องจากภาระงานหนัก?)

อัปเดตตัวอย่าง

วันที่วางจำหน่ายที่คาดหวังคือ TBD การพัฒนายังคงดำเนินต่อไปและการอัปเดตจะถูกเพิ่มเข้ามาในขณะที่เราก้าวหน้า (มันช้าเพราะฉันทำงานในเวลาว่างนอกเวลาทำงาน) ?

- คุณสมบัติและการปรับปรุงที่วางแผนไว้

เอ็นวายเรย์

การบันทึกขั้นสูง : การบันทึกรายละเอียดจะถูกเพิ่มเพื่อการตรวจสอบย้อนกลับและการดีบักที่ดีขึ้น
การรวมโครงการตาม EDGE : การทำงานอย่างต่อเนื่องกับโครงการที่ใช้ EDGE จะดำเนินต่อไปโดยมีการปรับปรุงตามความคืบหน้าและข้อเสนอแนะ

NNV

ความเข้ากันได้ของโคไซน์ความคล้ายคลึงกัน : PQ (ปริมาณผลิตภัณฑ์) ทำงานเป็นหลักกับระยะทางแบบยุคลิด อย่างไรก็ตามด้วยความคล้ายคลึงกันของโคไซน์จำเป็นต้องใช้ตรรกะการทำให้เป็นมาตรฐานของเวกเตอร์ (เวกเตอร์ปกติสำหรับประสิทธิภาพการให้ผลผลิตระยะทางแบบยุคลิดคล้ายกับความคล้ายคลึงกันของโคไซน์)
การตั้งค่า RPC สำหรับฟังก์ชั่น HNSW : RPC สำหรับ HNSW ได้รับการวางแผนเพื่ออำนวยความสะดวกในการใช้งานระยะไกล
การปรับปรุงการจัดเก็บ : การจัดเก็บในหน่วยความจำที่รวดเร็วและที่เก็บข้อมูลดิสก์ที่เชื่อถือได้จะได้รับการแนะนำ
การสำรองข้อมูลสถานะว่างของระบบ : กระบวนการสำรองข้อมูลอัตโนมัติจะถูกเพิ่มลงในการบันทึกข้อมูลเป็นระยะ ๆ ระหว่างสถานะที่ไม่ได้ใช้งาน
การกู้คืนอัตโนมัติ : คุณลักษณะสำหรับการกู้คืนอัตโนมัติจะถูกนำไปใช้
การกรองขั้นสูง : การสนับสนุนการแสดงออกและการค้นหาช่วงต่างๆจะรวมอยู่ในฟังก์ชั่นตัวกรอง
การเปรียบเทียบประสิทธิภาพ : การเปรียบเทียบที่ครอบคลุมจะดำเนินการเมื่อระบบมีเสถียรภาพ
Load Balancer : ตัวโหลดบาลานซ์จะได้รับการพัฒนาหลังความเสถียรเพื่อจัดการโหลดของระบบได้อย่างมีประสิทธิภาพ

ประกาศสำคัญ

ประสิทธิภาพอาจลดลงชั่วคราวเนื่องจากการพัฒนาอย่างต่อเนื่อง ขอบคุณสำหรับความอดทน!

เรียกใช้จากซอร์สโค้ด

Windows & Linux
git clone https://github.com/sjy-dv/nnv
cd nnv
# start edge
go run cmd/root/main.go -mode=edge
# start core
go run cmd/root/main.go -mode=root


MacOS
** The CPU acceleration (SSE, AVX2, AVX-512) code has caused an error where it does not function on Mac, and it is not a priority to address at this time. **

git clone https://github.com/sjy-dv/nnv
cd nnv
source .env
deploy
make edge-docker

ดัชนี

คุณสมบัติ
สถาปัตยกรรม
- LoadBalancer & DatabaseIntegration
- internaldatasharddesign
- internaldataflow
- การค้นหาหลายเวกเตอร์
- CFLAT ใช้เมื่อใด
- ขอบ
การแก้ไขข้อผิดพลาด

คุณสมบัติ

เมื่อวางแผนโครงการนี้ฉันให้ความคิดมากมาย

เมื่อตั้งค่าสภาพแวดล้อมของคลัสเตอร์มันเป็นเรื่องธรรมดาสำหรับนักพัฒนาส่วนใหญ่ที่จะเลือกอัลกอริทึมแพอย่างที่ฉันเคยทำมาก่อน เหตุผลที่เป็นวิธีการพิสูจน์ที่ใช้โดยโครงการที่ประสบความสำเร็จ

อย่างไรก็ตามฉันเริ่มสงสัย: มันซับซ้อนไปหน่อยเหรอ? แพเพิ่มความพร้อมใช้งานการอ่าน แต่ลดความพร้อมใช้งานการเขียน ดังนั้นฉันจะแก้ปัญหานี้ได้อย่างไรหากมีการเขียนหลายครั้งในระยะยาว?

เมื่อพิจารณาถึงลักษณะของฐานข้อมูลเวกเตอร์ฉันคิดว่าบริการส่วนใหญ่จะมีโครงสร้างรอบงานแบบแบตช์มากกว่าการเขียนแบบเรียลไทม์ แต่นั่นหมายความว่าฉันสามารถข้ามการแก้ไขปัญหาได้หรือไม่? ฉันไม่คิดอย่างนั้น อย่างไรก็ตามการสร้างการตั้งค่าหลายผู้นำที่ด้านบนของแพโดยใช้บางสิ่งเช่นซุบซิบรู้สึกซับซ้อนและยากมาก

ดังนั้น ณ วันนี้ (2024-10-20) ฉันกำลังพิจารณาวิธีการทางสถาปัตยกรรมสองวิธี

สถาปัตยกรรม

สถาปัตยกรรมแบ่งออกเป็นสองวิธี

การรวม LoadBalancer & Database

ก่อนอื่นตัวโหลดบัลแลนเซอร์จะถูกวางไว้ที่ด้านหน้ารองรับทั้งการแตกและการรวมข้อมูล ฐานข้อมูลภายในมีอยู่ในสถานะบริสุทธิ์


แบบจำลอง LB	Shard LB

การจำลองแบบโหลดบัลแลนเซอร์รอให้ฐานข้อมูลทั้งหมดเสร็จสิ้นการเขียนสำเร็จก่อนที่จะส่งหรือย้อนกลับในขณะที่เครื่องบาลานซ์โหลดชิ้นส่วนกระจายโหลดอย่างสม่ำเสมอทั่วทั้งฐานข้อมูลชาร์ดเพื่อให้แน่ใจว่ามีความสามารถในการจัดเก็บที่คล้ายกัน

ความแตกต่างที่สำคัญคือการจำลองแบบสามารถชะลอการทำงานของการเขียน แต่ให้ประสิทธิภาพการอ่านที่เร็วขึ้นในระยะกลางถึงระยะยาวเมื่อเทียบกับเครื่องบาลานซ์โหลด ในทางกลับกันวิธีการของ Shard มีความเร็วในการเขียนที่เร็วขึ้นเพราะมันมุ่งมั่นที่จะใช้กับเศษเล็กเศษน้อยเท่านั้น แต่การอ่านต้องมีการรวบรวมข้อมูลจากเศษทั้งหมดซึ่งช้ากว่าในตอนแรก แต่อาจกลายเป็นเร็วกว่าการจำลองแบบเมื่อชุดข้อมูลเติบโตขึ้น

ดังนั้นสำหรับการจัดการข้อมูลจำนวนมากขอแนะนำให้มีการแนะนำ Shard Balancer มากกว่าเล็กน้อย อย่างไรก็ตามประเด็นหลักของสถาปัตยกรรมทั้งสองคือความเรียบง่ายในการตั้งค่าและการจัดการทำให้ง่ายต่อการจัดการเป็นเซิร์ฟเวอร์แบ็กเอนด์ทั่วไป arch1_structure

Jetstream (NATS) หลายผู้นำ

arch4

วิธีที่สองใช้ jetstream สำหรับการกำหนดค่า

แม้ว่าสิ่งนี้จะง่ายกว่าวิธีการทางสถาปัตยกรรมก่อนหน้านี้จากมุมมองของผู้ใช้การตั้งค่าไม่แตกต่างจากแพอย่างมีนัยสำคัญ

อย่างไรก็ตามความแตกต่างที่สำคัญคือแตกต่างจาก RAFT รองรับการกำหนดค่ามัลติเขียนและมัลติอ่านมากกว่าการเขียนเดี่ยวและมัลติอ่าน

ในวิธีการนี้ฐานข้อมูลได้รับการกำหนดค่าในรูปแบบการจำลองแบบและ Jetstream ใช้เพื่อเปิดใช้งานการกำหนดค่าหลายผู้นำ

arch5 แต่ละฐานข้อมูลมี Jetstream ของตัวเองและ Jetstreams เหล่านี้เข้าร่วมกลุ่มและกลุ่มกลุ่มเดียวกัน ในกรณีนี้เมื่อใดก็ตามที่โหนดทั้งหมดพยายามเผยแพร่การเปลี่ยนแปลงเป็นแถวพวกเขาจะผ่าน Jetstream เดียวกัน หากสองโหนดพยายามแก้ไขข้อมูลเดียวกันในแบบคู่ขนานพวกเขาจะแข่งขันเพื่อเผยแพร่การเปลี่ยนแปลงของพวกเขา ในขณะที่เป็นไปได้ที่จะป้องกันการเปลี่ยนแปลงจากการแพร่กระจายสิ่งนี้อาจนำไปสู่การสูญเสียข้อมูล ตามข้อ จำกัด ของ Raft Quorum ใน Jetstream มีเพียงนักเขียนเพียงคนเดียวเท่านั้นที่สามารถเผยแพร่การเปลี่ยนแปลงได้ ดังนั้นเราจึงออกแบบระบบเพื่อให้นักเขียนคนสุดท้ายชนะ นี่ไม่ใช่ปัญหาสำหรับฐานข้อมูลเวกเตอร์เพราะเมื่อเทียบกับฐานข้อมูลดั้งเดิมโครงสร้างข้อมูลนั้นง่ายกว่า (นี่ไม่ได้หมายความว่าระบบนั้นง่าย แต่มีธุรกรรมและขั้นตอนที่ซับซ้อนน้อยลงเช่นการทำธุรกรรมต่อเนื่อง) นอกจากนี้ยังหลีกเลี่ยงการล็อคทั่วโลกและคอขวดประสิทธิภาพ

สรุป

สรุป:

ข้อ จำกัด แพและโควรัม
RAFT เป็นอัลกอริทึมที่กำหนดว่าเซิร์ฟเวอร์ใดเขียนข้อมูลก่อน ในแพแนวคิดของ องค์ประชุม หมายถึงจำนวนเซิร์ฟเวอร์ขั้นต่ำที่จำเป็นเพื่อยืนยันข้อมูลก่อนที่จะเขียน สิ่งนี้ทำให้มั่นใจได้ว่าแม้ว่าเซิร์ฟเวอร์สองเครื่องจะพยายามเขียนข้อมูลพร้อมกัน แต่แพก็อนุญาตให้เซิร์ฟเวอร์เพียงเครื่องเดียวเท่านั้นที่จะเขียนก่อน
นักเขียนคนสุดท้ายชนะ
แม้ว่าเซิร์ฟเวอร์หนึ่งจะเขียนข้อมูลก่อนเซิร์ฟเวอร์ที่เขียนสุดท้ายในที่สุด "ชนะ" ซึ่งหมายความว่าข้อมูลจากเซิร์ฟเวอร์สุดท้ายที่จะเขียนจะเขียนทับข้อมูลของเซิร์ฟเวอร์ก่อนหน้า
ข้อกังวลเกี่ยวกับการทำธุรกรรม
การทำธุรกรรมแบบอนุกรมหมายถึงการสร้างความมั่นใจว่าการกระทำที่สอดคล้องกันเกิดขึ้นในหลายตาราง ใน NNV เพื่อปรับปรุงประสิทธิภาพการล็อคทั่วโลก (ล็อคเซิร์ฟเวอร์ทั้งหมดก่อนเขียนข้อมูล) จะหลีกเลี่ยง แต่เมื่อเซิร์ฟเวอร์หลายตัวแก้ไขข้อมูลพร้อมกันเซิร์ฟเวอร์สุดท้ายที่จะแก้ไขจะชนะ วิธีการนี้เป็นไปได้เนื่องจากฐานข้อมูลเวกเตอร์นั้นง่ายกว่าฐานข้อมูลดั้งเดิม - พวกเขาไม่ต้องการการทำธุรกรรมที่ซับซ้อนในหลายตารางหรือคอลเลกชัน
ทำไมการออกแบบนี้?
เหตุผลหลักคือประสิทธิภาพ การล็อคเซิร์ฟเวอร์ทั้งหมดก่อนการประมวลผลข้อมูลนั้นปลอดภัย แต่ช้า แต่อนุญาตให้แต่ละเซิร์ฟเวอร์สามารถแก้ไขข้อมูลได้อย่างอิสระและยอมรับการปรับเปลี่ยนล่าสุดเนื่องจากผลลัพธ์สุดท้ายนั้นเร็วขึ้นและมีประสิทธิภาพมากขึ้น

สถาปัตยกรรมเก่า (~ 2024.12.09)

ดูสถาปัตยกรรมเก่า

การออกแบบการให้ข้อมูลภายในสำหรับข้อมูลภายใน

arch10 โดยทั่วไปแล้วระบบเช่นฐานข้อมูลเข้าถึงหน่วยความจำหรือดิสก์เดียวกันทำการดำเนินการอ่านและเขียนซ้ำ ๆ ในกระบวนการนี้วิธีการเช่น HNSW สามารถบรรลุความซับซ้อนของเวลาที่มีประสิทธิภาพเช่น O (log n) อย่างไรก็ตามเทคนิคที่ต้องใช้ความแม่นยำเช่นแบนและ CFLAT โดยทั่วไปจะดำเนินการค้นหาเชิงเส้นด้วยความซับซ้อนของเวลาของ O (n)

ปัญหาเกิดขึ้นเมื่อหลีกเลี่ยงการโต้แย้งข้อมูล เมื่ออ่านหรือเขียนเธรดเช่น goroutines จะแยกทรัพยากรที่เกี่ยวข้องผ่านล็อค โดยเฉพาะ:

การอ่าน : อนุญาตให้เข้าถึงทรัพยากรที่ล็อคได้
การเขียน : การเข้าถึงทรัพยากรที่ถูกล็อคถูก จำกัด การป้องกันการอ่านในระหว่างการดำเนินการเขียน เมื่อแทรกข้อมูลจำนวนมากหรือจัดการการร้องขอการอ่านจำนวนมากที่ต้องใช้การเขียนคอขวดประสิทธิภาพจะค่อยๆปรากฏขึ้น

เพื่อแก้ไขปัญหานี้เราได้ออกแบบระบบเพื่อสร้างเศษในหน่วยความจำอย่างมีประสิทธิภาพและกำหนดข้อมูลให้กับแต่ละชิ้นโดยไม่สูญเสียสาระสำคัญของระบบ แต่ละชิ้นมีกลไกการล็อคที่อนุญาต:

การล็อคที่เร็วขึ้น : เมื่อแทรกข้อมูลจำนวนมากหรือดำเนินการอ่าน การแทรกข้อมูลที่แบ่งพาร์ติชัน : อำนวยความสะดวกในการดำเนินการระบบที่ราบรื่นโดยอนุญาตให้ข้อมูลแทรกเข้าไปในส่วนที่แบ่งออก การออกแบบนี้ช่วยให้มั่นใจได้ว่าระบบสามารถทำงานได้อย่างราบรื่นแม้ภายใต้การแทรกข้อมูลหนักหรือสถานการณ์คำขออ่านสูงซึ่งจะช่วยลดปัญหาคอขวด

การไหลของข้อมูลภายใน

arch11

HNSW (โลกขนาดเล็กที่นำทางได้ตามลำดับชั้น):

การจัดเก็บกราฟ : การสร้างกราฟใหม่ทุกครั้งไม่มีประสิทธิภาพ ดังนั้นกราฟจะถูกเก็บไว้เบา ๆ ในรูปแบบไบนารี
ข้อมูลซ้ำซ้อน : เก็บไว้พร้อมกันในการจัดเก็บคีย์-ค่า (KV) ภายในเพื่อป้องกันการสูญเสียข้อมูลที่ผิดปกติ
การใช้ดิสก์ : อย่างไรก็ตามวิธีการนี้ส่งผลให้เกิดการใช้ดิสก์ค่อนข้างสูงทำให้เป็นตัวเลือกที่ผู้ใช้จะเลือกในระยะยาว

แบน/cflat (คอมโพสิตแบน):

การค้นหาข้อมูล : เนื่องจากการค้นหาข้อมูลเป็นเส้นตรงโดยเนื้อแท้จึงไม่ได้จัดเก็บแยกต่างหาก
การจัดการข้อมูล : สร้างขึ้นโดยใช้วิธีการที่เก็บข้อมูลไว้ใน KV Store แล้วอัปโหลดไปยังหน่วยความจำ

CFLAT (คอมโพสิตแฟลต): การค้นหาหลายเวกเตอร์

CFLAT (คอมโพสิตแฟลต) เป็นวิธีการจัดทำดัชนีที่ค้นหาเวกเตอร์หลายตัวและให้ผลลัพธ์คอมโพสิตตามความสำคัญของเวกเตอร์สองตัว

การใช้การค้นหาเวกเตอร์คอมโพสิตกับอัลกอริทึมกราฟเช่น HNSW นั้นเป็นสิ่งที่ท้าทายเพราะต้องใช้หน่วยความจำจำนวนมากและไม่สอดคล้องกับโครงสร้างพื้นที่ใกล้เคียงซึ่งจำเป็นต้องใช้กราฟหลายกราฟ แม้ว่าความซับซ้อนของเวลาสำหรับการค้นหายังคงมาบรรจบกันกับ O (2 log n) ≈ O (log n) ความซับซ้อนของอวกาศนั้นแย่มาก

ปัญหาเหล่านี้กลายเป็นปัญหามากขึ้นเมื่อปริมาณข้อมูลเพิ่มขึ้น นอกจากนี้วิธีการรวมและประเมินผลตามคีย์คอมโพสิตภายในโครงสร้างกราฟจะไม่สนใจ TOPK และเพิ่มขนาดฮีปอย่างมีนัยสำคัญสำหรับการค้นหาครั้งเดียว

ดังนั้นเราจึงเลือกที่จะดำเนินการตามแฟลต แม้ว่าความซับซ้อนของเวลาคือ O (n) (โดยไม่มีการลดลงอย่างต่อเนื่อง) ความซับซ้อนของพื้นที่ยังคงเหมือนเดิมและมีประสิทธิภาพสูงสำหรับการรวมและการประเมินผลตามคีย์คอมโพสิต

CFLAT ใช้เมื่อใด

Magine เรากำลังพัฒนาบริการสำหรับ บริษัท การจับคู่ที่ช่วยให้ผู้ใช้ค้นหาพันธมิตรในอุดมคติของพวกเขาตามเกณฑ์การป้อนข้อมูล เราจะพิจารณาปัจจัยต่าง ๆ เช่นบุคลิกภาพและคุณลักษณะอื่น ๆ อย่างไรก็ตามการใช้เวกเตอร์เดียวหมายถึงการรวมปัจจัยเหล่านี้เป็นหนึ่งประโยคสำหรับการค้นหาซึ่งจะเพิ่มโอกาสในการบิดเบือนความแม่นยำอย่างมาก

ตัวอย่างเช่น: arch12 ลักษณะที่ต้องการ: {บุคลิกภาพ: เด็ดขาดประเภทอุดมคติ: สูงและผอม} ในสถานการณ์นี้ผู้ใช้ชอบลักษณะบุคลิกภาพที่ทำให้คนในอุดมคติคนน่าจะชื่นชมพวกเขาโดยมุ่งเน้นไปที่การค้นหาพันธมิตรตามคุณลักษณะภายนอก

อย่างไรก็ตามพิจารณากรณีอื่น:

ลักษณะที่ต้องการ: {บุคลิกภาพ: ง่าย ๆ ประเภทอุดมคติ: เด็ดขาด} ที่นี่ใครบางคนที่ต้องการบุคลิกที่ง่าย ๆ ที่จับคู่กับประเภทในอุดมคติที่เด็ดขาดอาจส่งผลให้เกิดการแข่งขันที่ไม่ถูกต้องเช่นการจับคู่กับบุคคลที่แตกต่างกันในวิธีที่ไม่สอดคล้องกับการตั้งค่าที่แท้จริงของผู้ใช้

arch13 ในกรณีเช่นนี้ CFLAT (คอมโพสิตแฟลต) จะคำนวณคะแนนโดยการประเมินความคล้ายคลึงกันในบุคลิกภาพและความคล้ายคลึงกันในประเภทอุดมคติ ผู้ใช้สามารถกำหนดระดับความสำคัญให้กับแต่ละแอตทริบิวต์ช่วยให้คะแนนที่สูงขึ้นจะได้รับในแง่มุมที่มีความคล้ายคลึงกันมากขึ้นตามลำดับความสำคัญที่ผู้ใช้กำหนด

NNV-edge คืออะไร?

Edge หมายถึงความสามารถในการส่งและรับข้อมูลบนอุปกรณ์ใกล้เคียงโดยไม่ต้องสื่อสารกับเซิร์ฟเวอร์กลาง อย่างไรก็ตามในทางปฏิบัติ "Edge" ในซอฟต์แวร์บางครั้งอาจแตกต่างจากแนวคิดนี้เนื่องจากมักจะถูกปรับใช้ในสภาพแวดล้อมที่มีน้ำหนักเบาและ จำกัด ทรัพยากรเมื่อเทียบกับเซิร์ฟเวอร์กลาง

NNV-edge ได้รับการออกแบบให้ทำงานอย่างรวดเร็วในชุดข้อมูลเวกเตอร์ขนาดเล็ก (มากถึง 1 ล้านเวกเตอร์) ในลักษณะที่มีน้ำหนักเบาถ่ายโอนงานอัตโนมัติจาก NNV ดั้งเดิมกลับไปยังผู้ใช้เพื่อควบคุมมากขึ้น

อัลกอริทึมขั้นสูงเช่น HNSW, FAISS และการรบกวนนั้นยอดเยี่ยม แต่คุณไม่คิดว่าพวกเขาอาจจะหนักสำหรับรายละเอียดขนาดเล็กหรือไม่? และการแยกอัลกอริทึมในขณะที่โครงการเช่น Milvus, Weaviate และ Qdrant ถูกสร้างขึ้นโดย Minds ที่ยอดเยี่ยมพวกเขาไม่ได้ใช้ทรัพยากรมากเกินไปที่จะทำงานร่วมกับซอฟต์แวร์อื่น ๆ บนอุปกรณ์ขนาดเล็กพกพาหรือไม่? arch9 นั่นคือสิ่งที่ NNV-edge เข้ามา

ถ้าคุณแจกจ่ายหลายขอบ ด้วยการใช้ NNV-Edge กับ Load Balancer ที่กล่าวถึงก่อนหน้านี้คุณสามารถสร้างการตั้งค่าขั้นสูงที่ให้ข้อมูลในหลายขอบและรวมมันอย่างราบรื่น!

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-05-28
ขนาด 15.34MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด