Pineconeutils adalah modul Python yang dirancang untuk menangani dan memproses data untuk menanamkan dan pengindeksan menggunakan Pinecone, Cohere, dan Openai Services. Modul utilitas ini memudahkan untuk memuat, memotong, menyiapkan, dan meningkatkan data ke dalam indeks pinecone, membuatnya ideal untuk aplikasi yang melibatkan embedding teks dan pengambilan sistem (RAG).
.txt , .docx , dan .pdf .Untuk memasang Pineconeutils, Anda dapat menggunakan PIP:
pip install pineconeutilsBerikut adalah contoh singkat tentang cara menggunakan Pineconeutils:
Pertama, pastikan Anda memiliki kunci API yang diperlukan dan informasi pengaturan:
pinecone_api_key = " your_pinecone_api_key "
cohere_api_key = " your_cohere_api_key "
openai_api_key = " your_openai_api_key "
index_name = " your_index_name "
namespace_id = " your_namespace_id "Muat data dari format file yang didukung:
from pineconeutils import PineconeUtils
# Create instance of PineconeUtils
pinecone = PineconeUtils(pinecone_api_key=pinecone_api_key, openai_api_key=openai_api_key,cohere_api_key =cohere_api_key, index_name=index_name, namespace_id=namespace_id)
path = " path_to_your_file.docx "
data = pinecone.load_data(path)
print( " Loaded Data: " , data)chunks = pinecone.chunk_data(data, chunk_size=100, chunk_overlap=10)
print( " Data Chunks: " , chunks)
prepared_data = pinecone.prepare_data(chunks, model= " text-embedding-ada-002 " , service= " openai " )chunks = pinecone.chunk_data(data, chunk_size=100, chunk_overlap=10)
print( " Data Chunks: " , chunks)
prepared_data = pinecone.prepare_data(chunks, model= " embed-english-v3.0 " , service= " cohere " ,input_type= " search_document " )Untuk informasi lebih lanjut tentang kohere embeddings: cohere embeddings
successful = pinecone.upsert_data(prepared_data)
print( " Data upsertion was " , " successful " if successful else " unsuccessful " )Untuk berkontribusi pada pengembangan Pineconeutils, Anda dapat mengkloning repositori dan mengirimkan permintaan tarik.
Jika Anda menghadapi masalah atau memiliki pertanyaan, silakan ajukan masalah pada repositori GitHub.
Proyek ini dilisensikan di bawah lisensi MIT - lihat file lisensi untuk detailnya.