Descarga EmbedAnything - Descargar el código fuente EmbedAnything

EmbedAnything

Otro código fuente

0.4.16

Descargar

Inferencia, ingestión e indexación: ¿sobrealimentado por el óxido?
Explore los documentos »

Ver demostración · Bancos · Adaptadores de transmisión de vectores. Buscar en el espacio de audio

Incrushything es una tubería minimalista, altamente desempeñada, de rayo, liviana, multisorce, multimodal y de incrustación local incorporada con óxido. Ya sea que esté trabajando con texto, imágenes, audio, PDF, sitios web u otros medios, la inclinación optimiza el proceso de generación de incrustaciones de varias fuentes y transmitirlos sin problemas (indexador de memoria eficiente) a una base de datos vectorial. Admite incrustaciones densas, escasas, ONNX y de interacción tardía, ofreciendo flexibilidad para una amplia gama de casos de uso.

Tabla de contenido

Sobre el proyecto
- Construido con óxido
- ¿Por qué vela?
Empezando
- Instalación
Uso
Hoja de ruta
Que contribuye
Cómo agregar modelo personalizado y tamaño de fragmento

Características clave

Incrustación local : trabaja con modelos locales de incrustación como Bert y Jina
Modelos ONNX : funciona con modelos ONNX para Bert y Colpali
Colpali : Soporte para colpalí en la versión GPU
Flade : soporte para inspecciones de escasos para híbridos
Modelos de incrustación en la nube:: admite OpenAI y Cohere.
Multimodalidad : funciona con fuentes de texto como PDFS, TXT, MD, Imágenes JPG y Audio, .WAV
Rust : todo el procesamiento de archivos se realiza en óxido para la velocidad y la eficiencia
Vela : también hemos cuidado con la aceleración del hardware, con la vela.
Interfaz Python: empaquetada como una biblioteca de Python para una integración perfecta en sus proyectos existentes.
Transmisión vectorial: Crear y transmitir continuamente si tiene un recurso bajo.

¿Qué es la transmisión de vectores?

La transmisión de vectores le permite procesar y generar integridades para los archivos y transmitirlos, por lo que si tiene 10 GB de archivo, puede generar continuamente incrustaciones por fragmento por fragmento, que puede segmentar semánticamente y almacenarlos en la base de datos de vectores de su elección, por lo tanto, elimina el almacenamiento de incrustaciones de los bultos en RAM a la vez. El proceso de incrustación ocurre separadamente del proceso principal, para mantener habilitado el alto rendimiento por Rust MPSC.

? Por qué incrustar algo

➡️ Ejecución de Faster.
➡️ Gestión de la Memoria: el óxido hace cumplir la gestión de la memoria simultáneamente, evitando fugas de memoria y bloqueos que pueden afectar a otros idiomas
➡️True multithreading
➡️ Running Language Models o Incrustando modelos locales y eficientemente
➡️Candle permite inferencias en las GPU habilitadas para CUDA de inmediato.
➡️ Deciden el uso de la memoria de la incrustación.

Modelos compatibles

Apoyamos cualquier modelo de cara de abrazo en la vela. Y también apoyamos el tiempo de ejecución de ONNX para Bert y Colpali.

Cómo agregar el modelo personalizado en la vela: from_preetrainse_hf

 model = EmbeddingModel . from_pretrained_hf (
    WhichModel . Bert , model_id = "model link from huggingface"
)
config = TextEmbedConfig ( chunk_size = 200 , batch_size = 32 )
data = embed_anything . embed_file ( "file_address" , embedder = model , config = config )

Modelo	Enlace personalizado
Jina	Jinai/Jina-Embeddings-V2-Base-en
	Jinai/Jina-Embeddings-V2-Small-en
Bert	TRANSFORMADORES DE ARENDIDOS/ALLO MINILM-L6-V2
	Transformadores de oración/All-Minilm-L12-V2
	TRANSFORMADORES DE ARENDIDOS/PARAFRASE-MINILM-L6-V2
Acortar	OPERAI/Clip-Vit-Base-Patch32
Susurro	La mayoría de Operai Whisper desde Huggingface apoyó.

Modelos Flade:

 model = EmbeddingModel.from_pretrained_hf(
    WhichModel.SparseBert, "prithivida/Splade_PP_en_v1"
)

Onnx-Runtime: from_preetrainse_onnx

Bert

 model = EmbeddingModel.from_pretrained_onnx(
  WhichModel.Bert, model_id="onnx_model_link"
)

Colpalí

 model: ColpaliModel = ColpaliModel.from_pretrained_onnx("starlight-ai/colpali-v1.2-merged-onnx", None)

Para fragmentos semánticos

 model = EmbeddingModel . from_pretrained_hf (
    WhichModel . Bert , model_id = "sentence-transformers/all-MiniLM-L12-v2"
)

# with semantic encoder
semantic_encoder = EmbeddingModel . from_pretrained_hf ( WhichModel . Jina , model_id = "jinaai/jina-embeddings-v2-small-en" )
config = TextEmbedConfig ( chunk_size = 256 , batch_size = 32 , splitting_strategy = "semantic" , semantic_encoder = semantic_encoder )

?empezando

Instalación

pip install embed-anything

Para GPU y usando modelos especiales como Colpali

pip install embed-anything-gpu

Uso

➡️ Uso para 0.3 y posterior versión

Para usar la incrustación local: apoyamos a Bert y Jina

 model = EmbeddingModel . from_pretrained_local (
    WhichModel . Bert , model_id = "Hugging_face_link"
)
data = embed_anything . embed_file ( "test_files/test.pdf" , embedder = model )

Para incrustación multimodal: admitimos clip

Directorio de requisitos con imágenes que desea buscar, por ejemplo, tenemos test_files con imágenes de gatos, perros, etc.

 import embed_anything
from embed_anything import EmbedData
model = embed_anything . EmbeddingModel . from_pretrained_local (
    embed_anything . WhichModel . Clip ,
    model_id = "openai/clip-vit-base-patch16" ,
    # revision="refs/pr/15",
)
data : list [ EmbedData ] = embed_anything . embed_directory ( "test_files" , embedder = model )
embeddings = np . array ([ data . embedding for data in data ])
query = [ "Photo of a monkey?" ]
query_embedding = np . array (
    embed_anything . embed_query ( query , embedder = model )[ 0 ]. embedding
)
similarities = np . dot ( embeddings , query_embedding )
max_index = np . argmax ( similarities )
Image . open ( data [ max_index ]. text ). show ()

Incrustación de audio usando Whisper

Requisitos: archivos .WAV de audio.

 import embed_anything
from embed_anything import (
    AudioDecoderModel ,
    EmbeddingModel ,
    embed_audio_file ,
    TextEmbedConfig ,
)
# choose any whisper or distilwhisper model from https://huggingface.co/distil-whisper or https://huggingface.co/collections/openai/whisper-release-6501bba2cf999715fd953013
audio_decoder = AudioDecoderModel . from_pretrained_hf (
    "openai/whisper-tiny.en" , revision = "main" , model_type = "tiny-en" , quantized = False
)
embedder = EmbeddingModel . from_pretrained_hf (
    embed_anything . WhichModel . Bert ,
    model_id = "sentence-transformers/all-MiniLM-L6-v2" ,
    revision = "main" ,
)
config = TextEmbedConfig ( chunk_size = 200 , batch_size = 32 )
data = embed_anything . embed_audio_file (
    "test_files/audio/samples_hp0.wav" ,
    audio_decoder = audio_decoder ,
    embedder = embedder ,
    text_embed_config = config ,
)
print ( data [ 0 ]. metadata )

? Contribuyendo a la incrustación

En primer lugar, gracias por tomarse el tiempo para contribuir a este proyecto. Realmente apreciamos sus contribuciones, ya sean informes de errores, sugerencias de características o solicitudes de extracción. Su tiempo y esfuerzo son muy valorados en este proyecto.

Este documento proporciona pautas y mejores prácticas para ayudarlo a contribuir de manera efectiva. Estos están destinados a servir como directrices, no reglas estrictas. Le recomendamos que use su mejor juicio y se sienta cómodo proponiendo cambios en este documento a través de una solicitud de extracción.

Hoja de ruta

Comienzo rápido

Pautas

? ️ Hoja de ruta

Logros

Uno de los objetivos de la incrustación es permitir que los ingenieros de IA usen fácilmente los modelos de incrustación de arte en archivos y documentos típicos. Ya se han logrado mucho aquí y estos son los formatos que apoyamos en este momento y se deben hacer algunos más.

? ️ Modalidades y fuente

Estamos emocionados de compartir que hemos ampliado nuestra plataforma para admitir múltiples modalidades, que incluyen:

¡Esto le brinda la flexibilidad de trabajar con varios tipos de datos en un solo lugar!

? Producto

Hemos lanzado algunas actualizaciones importantes en la versión 0.3 para mejorar tanto la funcionalidad como el rendimiento. Esto es lo nuevo:

Following semántico: estrategia de fragmentación optimizada para mejor flujos de trabajo de generación de recuperación (trapo) de recuperación (RAG).
Transmisión para una indexación eficiente: hemos introducido la transmisión para la indexación de la memoria eficiente en las bases de datos de vectores. ¿Quieres saber más? Consulte nuestro artículo sobre esta función aquí: https://www.analyticsvidhya.com/blog/2024/09/vector-streaming/
Aplicaciones de disparo cero: explore nuestras demostraciones de aplicación cero de disparo para ver el poder de estas actualizaciones en acción.
Funciones intuitivas: la versión 0.3 incluye un refactor completo para funciones más intuitivas, lo que hace que la plataforma sea más fácil de usar.
Transmisión por fragmento: en lugar de transmisión de archivos por archivo, ahora admitimos la transmisión por fragmento, lo que permite un procesamiento de datos más flexible y eficiente.

Vea el último lanzamiento: y vea cómo estas características pueden sobrealimentar su oleoducto Generativeai!

Muy pronto

Actuación

Hemos recibido bastantes preguntas sobre por qué estamos usando Vandle, así que aquí hay una explicación rápida:

Una de las razones principales es que la vela no requiere modelos de formato ONNX específicos, lo que significa que puede funcionar sin problemas con cualquier modelo de cara abrazada. Esta flexibilidad ha sido un factor clave para nosotros. Sin embargo, también reconocemos que hemos estado comprometiendo un poco a la velocidad a favor de esa flexibilidad.

¿Qué sigue? Para abordar esto, estamos emocionados de anunciar que estamos presentando Candle-onnx junto con nuestro marco anterior en Hugging-Face,

➡️ Soporte para modelos GGUF

Rendimiento significativamente más rápido
¡Estén atentos para estas emocionantes actualizaciones!

Incrustaciones:

Tuvimos multimodalidad desde el primer día para nuestra infraestructura. Ya lo hemos incluido para sitios web, imágenes y audios, pero queremos expandirlo aún más.

☑️ Graph Increding - Construya profundidad de incrustaciones profundas primero y palabra a vec
☑️ Video incrustando
☑️ Yolo Clip

Expansión a otros adaptadores vectoriales

Actualmente admitimos una amplia gama de bases de datos vectoriales para transmitir integrados, que incluyen:

Elástico: gracias al increíble y activo equipo elástico por la contribución
Tejido
Piña

¡Pero no nos estamos deteniendo allí! Estamos trabajando activamente para expandir esta lista.

¿Quieres contribuir? Si desea agregar soporte para su base de datos vectorial favorita, ¡nos encantaría tener su ayuda! Consulte nuestra contribución. MD para obtener pautas, o no dude en comunicarse directamente con [email protected]. ¡Construyamos algo increíble juntos!

Expandir

Información adicional

Versión 0.4.16
Tipo Otro código fuente
Fecha de actualización 2025-05-27
tamaño 26.34MB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo