ดาวน์โหลด chromem go - chromem go Source Source Download

chromem go

ซอร์สโค้ดอื่น ๆ

v0.7.0 (2024-09-01)

ดาวน์โหลด

โครเมมโก

ฐานข้อมูลเวกเตอร์แบบฝังตัวสำหรับไปกับอินเตอร์เฟสที่มีลักษณะคล้ายโครมาและการพึ่งพาของบุคคลที่สามเป็นศูนย์ ในหน่วยความจำด้วยการคงอยู่เสริม

เนื่องจาก chromem-go ถูกฝังได้จึงช่วยให้คุณสามารถเพิ่มการเพิ่มการดึง (RAG) และคุณสมบัติที่ใช้ฝังตัวที่คล้ายกันลงในแอพ GO ของคุณ โดยไม่ต้องเรียกใช้ฐานข้อมูลแยกต่างหาก เช่นเมื่อใช้ sqlite แทน postgreSQL/mysql/etc

มัน ไม่ใช่ ห้องสมุดที่จะเชื่อมต่อกับ Chroma และไม่ได้ทำการปรับแต่งใหม่ใน GO มันเป็นฐานข้อมูลด้วยตัวเอง

โฟกัสไม่ใช่ขนาด (เอกสารหลายล้านรายการ) หรือจำนวนคุณสมบัติ แต่ความเรียบง่ายและประสิทธิภาพสำหรับกรณีการใช้งานที่พบบ่อยที่สุด ใน CPU แล็ปท็อปในช่วงกลางปี 2020 คุณสามารถสอบถามเอกสารได้ 1,000 ฉบับใน 0.3 ms และ 100,000 เอกสารใน 40 ms โดยมีการจัดสรรหน่วยความจำน้อยและเล็กมาก ดูเกณฑ์มาตรฐานสำหรับรายละเอียด

โครงการอยู่ในช่วงเบต้าภายใต้การก่อสร้างที่หนักและอาจแนะนำการเปลี่ยนแปลงที่เกิดขึ้นก่อนการเผยแพร่ก่อน v1.0.0 การเปลี่ยนแปลงทั้งหมดมีการบันทึกไว้ใน CHANGELOG

สารบัญ

ใช้เคส
ส่วนต่อประสาน
คุณสมบัติ + แผนงาน
การติดตั้ง
การใช้งาน
เกณฑ์มาตรฐาน
การพัฒนา
แรงจูงใจ
โครงการที่เกี่ยวข้อง

ใช้เคส

ด้วยฐานข้อมูลเวกเตอร์คุณสามารถทำสิ่งต่าง ๆ ได้:

Retrieval Augmented Generation (RAG), การตอบคำถาม (คำถาม & คำตอบ)
การค้นหาข้อความและรหัส
ระบบแนะนำ
การจำแนกประเภท
การจัดกลุ่ม

มาดูเคสใช้ผ้าขี้ริ้วโดยละเอียดเพิ่มเติม:

ผ้าขี้ริ้ว

ความรู้เกี่ยวกับแบบจำลองภาษาขนาดใหญ่ (LLMS) - แม้แต่คนที่มีพารามิเตอร์ 30 พันล้าน, 70 พันล้านพารามิเตอร์และอื่น ๆ - มี จำกัด พวกเขาไม่รู้อะไรเลยเกี่ยวกับสิ่งที่เกิดขึ้นหลังจากการฝึกซ้อมสิ้นสุดลงพวกเขาไม่รู้อะไรเกี่ยวกับข้อมูลที่พวกเขาไม่ได้รับการฝึกฝน (เช่นอินทราเน็ตของ บริษัท ของคุณตัวติดตามจิรา / บั๊กวิกิหรือฐานความรู้อื่น ๆ ) และแม้แต่ข้อมูลที่พวกเขา รู้ ว่าพวกเขามักจะไม่สามารถทำ ซ้ำได้

การปรับแต่ง LLM สามารถช่วยได้เล็กน้อย แต่มันมีความหมายมากกว่าที่จะปรับปรุงการให้เหตุผล LLMS เกี่ยวกับหัวข้อเฉพาะหรือทำซ้ำรูปแบบของข้อความหรือรหัสที่เขียน การปรับแต่ง ไม่ได้ เพิ่มความรู้ 1: 1 ลงในโมเดล รายละเอียดจะหายไปหรือปะปนกัน และการตัดความรู้ (เกี่ยวกับสิ่งที่เกิดขึ้นหลังจากการปรับแต่ง) ไม่ได้รับการแก้ไขเช่นกัน

=> ฐานข้อมูลเวกเตอร์สามารถทำหน้าที่เป็นความรู้ที่ทันสมัยและแม่นยำสำหรับ LLMS:

คุณจัดเก็บเอกสารที่เกี่ยวข้องที่คุณต้องการให้ LLM รู้ในฐานข้อมูล
ฐานข้อมูลเก็บ ข้อมูลการฝังไว้ ข้างเอกสารซึ่งคุณสามารถให้หรือสามารถสร้างได้โดย "โมเดลการฝัง" ที่เฉพาะเจาะจงเช่น OpenAI ของ OpenAI text-embedding-3-small
- chromem-go สามารถทำสิ่งนี้ให้คุณและรองรับผู้ให้บริการฝังตัวหลายรายและโมเดลนอกกรอบ
หลังจากนั้นเมื่อคุณต้องการพูดคุยกับ LLM คุณจะส่งคำถามไปยัง DB Vector ก่อนเพื่อค้นหาเนื้อหา ที่คล้ายกัน / ที่เกี่ยวข้อง สิ่งนี้เรียกว่า "การค้นหาเพื่อนบ้านที่ใกล้ที่สุด"
ในคำถามที่ LLM คุณให้เนื้อหานี้พร้อมกับคำถามของคุณ
LLM สามารถคำนึงถึงเนื้อหาที่แม่นยำนี้ได้เมื่อพิจารณาเมื่อตอบ

ตรวจสอบรหัสตัวอย่างเพื่อดูการดำเนินการ!

ส่วนต่อประสาน

แรงบันดาลใจดั้งเดิมของเราคืออินเทอร์เฟซ Chroma ซึ่ง Core API มีต่อไปนี้ (นำมาจาก readme ของพวกเขา):

อินเตอร์เฟส Chroma Core

 import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb . Client ()

# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client . create_collection ( "all-my-documents" )

# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection . add (
    documents = [ "This is document1" , "This is document2" ], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas = [{ "source" : "notion" }, { "source" : "google-docs" }], # filter on these!
    ids = [ "doc1" , "doc2" ], # unique for each doc
)

# Query/search 2 most similar results. You can also .get by id
results = collection . query (
    query_texts = [ "This is a query document" ],
    n_results = 2 ,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

ห้องสมุด GO ของเราเปิดเผยอินเทอร์เฟซเดียวกัน:

Chromem-go เทียบเท่า

 package main

import "github.com/philippgille/chromem-go"

func main () {
    // Set up chromem-go in-memory, for easy prototyping. Can add persistence easily!
    // We call it DB instead of client because there's no client-server separation. The DB is embedded.
    db := chromem . NewDB ()

    // Create collection. GetCollection, GetOrCreateCollection, DeleteCollection also available!
    collection , _ := db . CreateCollection ( "all-my-documents" , nil , nil )

    // Add docs to the collection. Update and delete will be added in the future.
    // Can be multi-threaded with AddConcurrently()!
    // We're showing the Chroma-like method here, but more Go-idiomatic methods are also available!
    _ = collection . Add ( ctx ,
        [] string { "doc1" , "doc2" }, // unique ID for each doc
        nil , // We handle embedding automatically. You can skip that and add your own embeddings as well.
        [] map [ string ] string {{ "source" : "notion" }, { "source" : "google-docs" }}, // Filter on these!
        [] string { "This is document1" , "This is document2" },
    )

    // Query/search 2 most similar results. You can also get by ID.
    results , _ := collection . Query ( ctx ,
        "This is a query document" ,
        2 ,
        map [ string ] string { "metadata_field" : "is_equal_to_this" }, // optional filter
        map [ string ] string { "$contains" : "search_string" },         // optional filter
    )
}

เริ่มแรก chromem-go เริ่มต้นด้วยวิธีการหลักสี่วิธี แต่เราเพิ่มมากขึ้นเมื่อเวลาผ่านไป เราตั้งใจไม่ต้องการครอบคลุม 100% ของพื้นผิว API ของ Chroma
เรากำลังให้วิธีการทางเลือกบางอย่างที่เป็นไปได้มากกว่า

สำหรับอินเทอร์เฟซแบบเต็มรูป

คุณสมบัติ

แผนงาน

ผลงาน:
- ใช้ SIMD สำหรับการคำนวณผลิตภัณฑ์ DOT บน CPU ที่รองรับ (Draft PR: #48)
- เพิ่มบิตแมปคำรามเพื่อเพิ่มความเร็วในการกรองข้อความเต็มรูปแบบ
การฝังผู้สร้าง:
- เพิ่ม EmbeddingFunc ที่ดาวน์โหลดและเชลล์ออกไปยัง llamafile
การค้นหาความคล้ายคลึงกัน:
- การค้นหาเพื่อนบ้านที่ใกล้ที่สุดโดยประมาณด้วยดัชนี (Ann)
  - โลกใบเล็ก ๆ แห่งการเดินเรือ (HNSW)
  - ไฟล์คว่ำแบน (ivfflat)
ตัวกรอง:
- ผู้ประกอบการ ( $and , $or ฯลฯ )
พื้นที่จัดเก็บ:
- JSON เป็นรูปแบบการเข้ารหัสที่สอง
- Log-Ahead Log (WAL) เป็นรูปแบบไฟล์ที่สอง
- พื้นที่เก็บข้อมูลระยะไกลเสริม (S3, PostgreSQL, ... )
ชนิดข้อมูล:
- ภาพ
- วิดีโอ

การติดตั้ง

go get github.com/philippgille/chromem-go@latest

การใช้งาน

ดู Godoc สำหรับการอ้างอิง: https://pkg.go.dev/github.com/philippgille/chromem-go

สำหรับตัวอย่างที่ใช้งานได้เต็มรูปแบบโดยใช้ฐานข้อมูลเวกเตอร์สำหรับการสร้าง Augmented Generation (RAG) และการค้นหาเชิงความหมายและการใช้ OpenAI หรือใช้งานรุ่น Embeddings และ LLM (ใน Ollama) ดูรหัสตัวอย่าง

เร็ว

สิ่งนี้นำมาจากตัวอย่าง "น้อยที่สุด":

 package main

import (
 "context"
 "fmt"
 "runtime"

 "github.com/philippgille/chromem-go"
)

func main () {
  ctx := context . Background ()

  db := chromem . NewDB ()

  c , err := db . CreateCollection ( "knowledge-base" , nil , nil )
  if err != nil {
    panic ( err )
  }

  err = c . AddDocuments ( ctx , []chromem. Document {
    {
      ID :      "1" ,
      Content : "The sky is blue because of Rayleigh scattering." ,
    },
    {
      ID :      "2" ,
      Content : "Leaves are green because chlorophyll absorbs red and blue light." ,
    },
  }, runtime . NumCPU ())
  if err != nil {
    panic ( err )
  }

  res , err := c . Query ( ctx , "Why is the sky blue?" , 1 , nil , nil )
  if err != nil {
    panic ( err )
  }

  fmt . Printf ( "ID: %v n Similarity: %v n Content: %v n " , res [ 0 ]. ID , res [ 0 ]. Similarity , res [ 0 ]. Content )
}

เอาท์พุท:

 ID: 1
Similarity: 0.6833369
Content: The sky is blue because of Rayleigh scattering.

เกณฑ์มาตรฐาน

เปรียบเทียบกับ 2024-03-17 ด้วย:

คอมพิวเตอร์: Framework Laptop 13 (รุ่นแรก, 2021)
CPU: 11th Gen Intel Core I5-1135G7 (2020)
หน่วยความจำ: 32 GB
OS: Fedora Linux 39
- เคอร์เนล: 6.7

$ go test -benchmem -run=^$ -bench .
goos: linux
goarch: amd64
pkg: github.com/philippgille/chromem-go
cpu: 11th Gen Intel(R) Core(TM) i5-1135G7 @ 2.40GHz
BenchmarkCollection_Query_NoContent_100-8          13164      90276 ns/op     5176 B/op       95 allocs/op
BenchmarkCollection_Query_NoContent_1000-8          2142     520261 ns/op    13558 B/op      141 allocs/op
BenchmarkCollection_Query_NoContent_5000-8           561    2150354 ns/op    47096 B/op      173 allocs/op
BenchmarkCollection_Query_NoContent_25000-8          120    9890177 ns/op   211783 B/op      208 allocs/op
BenchmarkCollection_Query_NoContent_100000-8          30   39574238 ns/op   810370 B/op      232 allocs/op
BenchmarkCollection_Query_100-8                    13225      91058 ns/op     5177 B/op       95 allocs/op
BenchmarkCollection_Query_1000-8                    2226     519693 ns/op    13552 B/op      140 allocs/op
BenchmarkCollection_Query_5000-8                     550    2128121 ns/op    47108 B/op      173 allocs/op
BenchmarkCollection_Query_25000-8                    100   10063260 ns/op   211705 B/op      205 allocs/op
BenchmarkCollection_Query_100000-8                    30   39404005 ns/op   810295 B/op      229 allocs/op
PASS
ok   github.com/philippgille/chromem-go 28.402s

การพัฒนา

Build: go build ./...
ทดสอบ: go test -v -race -count 1 ./...
มาตรฐาน:
- go test -benchmem -run=^$ -bench . (เพิ่ม > bench.out หรือคล้ายกับการเขียนไปยังไฟล์)
- ด้วยการทำโปรไฟล์: go test -benchmem -run ^$ -cpuprofile cpu.out -bench .
  - (โปรไฟล์: -cpuprofile , -memprofile , -blockprofile , -mutexprofile )
เปรียบเทียบเกณฑ์มาตรฐาน:
1. ติดตั้ง benchstat : go install golang.org/x/perf/cmd/benchstat@latest
2. เปรียบเทียบผลการวัดสองอย่าง: benchstat before.out after.out

แรงจูงใจ

ในเดือนธันวาคม 2566 เมื่อฉันต้องการเล่นกับการเพิ่มการดึง (RAG) ในโปรแกรม GO ฉันมองหาฐานข้อมูลเวกเตอร์ที่สามารถฝังตัวในโปรแกรม GO ได้เช่นเดียวกับที่คุณจะฝัง SQLite เพื่อไม่ต้องติดตั้ง DB และการบำรุงรักษาแยกต่างหาก ฉันประหลาดใจเมื่อฉันไม่พบอะไรเลยเนื่องจากความอุดมสมบูรณ์ของร้านค้าคีย์-ค่าฝังในระบบนิเวศ

ในขณะที่ฐานข้อมูลเวกเตอร์ยอดนิยมส่วนใหญ่เช่น Pinecone, Qdrant, Milvus, Chroma, Weaviate และอื่น ๆ ไม่สามารถฝังได้ทั้งหมดหรือเฉพาะใน Python หรือ JavaScript/typescript

จากนั้นฉันพบโพสต์บล็อกของ @Eliben และรหัสตัวอย่างซึ่งแสดงให้เห็นว่าด้วยรหัส GO น้อยมากคุณสามารถสร้าง POC พื้นฐานของฐานข้อมูลเวกเตอร์

นั่นคือเมื่อฉันตัดสินใจที่จะสร้างฐานข้อมูลเวกเตอร์ของตัวเองฝังอยู่ใน GO ซึ่งได้รับแรงบันดาลใจจากอินเทอร์เฟซ Chromadb Chromadb โดดเด่นสำหรับการฝัง (ใน Python) และโดยการแสดง API หลักใน 4 คำสั่งบน readme ของพวกเขาและบนหน้า Landing Page ของเว็บไซต์ของพวกเขา

โครงการที่เกี่ยวข้อง

ตะโกนไปที่ @eliben ซึ่งมีโพสต์บล็อกและรหัสตัวอย่างเป็นแรงบันดาลใจให้ฉันเริ่มโครงการนี้!
Chroma: ดูที่ Pinecone, Qdrant, Milvus, Weaviate และอื่น ๆ Chroma โดดเด่นด้วยการแสดง API หลักใน 4 คำสั่งบน readme ของพวกเขาและบนหน้า Landing Page ของเว็บไซต์ของพวกเขา นอกจากนี้ยังให้ความสำคัญกับความสามารถในการฝัง (ใน Python) มากที่สุด
ฐานข้อมูลเวกเตอร์ที่ใช้ไคลเอนต์เซิร์ฟเวอร์ขนาดใหญ่เต็มรูปแบบสำหรับสเกลและประสิทธิภาพสูงสุด:
- Pinecone: แหล่งที่มาปิด
- Qdrant: เขียนด้วยสนิมไม่สามารถฝังได้ใน GO
- Milvus: เขียนใน Go and C ++ แต่ไม่สามารถฝังได้ ณ เดือนธันวาคม 2023
- Weaviate: เขียนใน GO แต่ไม่สามารถฝังได้ในวันที่มีนาคม 2024 (เฉพาะใน Python และ JavaScript/typeScript และนั่นคือการทดลอง)
ฐานข้อมูล SQL, NOSQL และคีย์-ค่าเพิ่มบางส่วนเพิ่มการสนับสนุนสำหรับการจัดเก็บเวกเตอร์และ (บางส่วน) การสืบค้นตามความคล้ายคลึงกัน:
- PGVECTOR EXTENSION สำหรับ PostgreSQL: โมเดลไคลเอนต์-เซิร์ฟเวอร์
- Redis (1, 2): รุ่นลูกค้า-เซิร์ฟเวอร์
- ส่วนขยาย SQLITE-VSS สำหรับ SQLITE: ฝังตัว แต่การเชื่อมโยงต้องใช้ CGO มีห้องสมุด GO ฟรี CGO สำหรับ SQLite แต่ก็ไม่มีส่วนขยายการค้นหาเวกเตอร์
- Duckdb มีฟังก์ชั่นในการคำนวณความคล้ายคลึงกันของโคไซน์ (1): ฝังตัว แต่การเชื่อมโยงไปใช้ CGO
- แพลตฟอร์มคลาวด์ของ MongoDB นำเสนอผลิตภัณฑ์การค้นหาเวกเตอร์ (1): รุ่นไคลเอนต์-เซิร์ฟเวอร์
ไลบรารีบางแห่งสำหรับการค้นหาความคล้ายคลึงกันของเวกเตอร์:
- FAISS: เขียนใน C ++; บุคคลที่สามไปผูกมัดใช้ CGO
- รบกวน: เขียนใน C ++; Go Bindings ใช้ CGO (1)
- USEARCH: เขียนใน C ++; ไปการผูกใช้ CGO
ห้องสมุด orchestration บางแห่งได้รับแรงบันดาลใจจากห้องสมุด Python Langchain แต่ไม่มีเวกเตอร์ฝังตัวที่ฝังอยู่ในขั้นพื้นฐานหรือเพียง
- Langchain Go
- ลิ้น
- golc

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.7.0 (2024-09-01)
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-05-27
ขนาด 134.89KB
มาจาก Github

แอปที่เกี่ยวข้อง

vscode go

2024-11-10
go getter

2024-11-05
immich go

2024-11-04
anycable go

2024-11-04
ไปไป พลังแม่เหล็ก

2024-02-12
ไปนะฮับ

2023-03-24

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด