網站•文檔•挑戰和解決方案•用例
Embedding Studio是一個創新的開源框架,旨在無縫將組合的嵌入模型和矢量數據庫轉換為全面的搜索引擎。通過內置功能,可用於ClickStream集合,持續改進搜索體驗以及自動改編嵌入模型,它為全週期搜索引擎提供了開箱即用的解決方案。
| 社區支持 |
| 嵌入工作室隨著我們團隊的熱情而增長。您在存儲庫上的明星有助於我們繼續發展。 加入我們實現我們的目標: |
(*) - 開發中的功能
嵌入工作室是可以自定義的,因此您可以自定義:
在這裡有更多關於它的信息。
免責聲明:嵌入工作室並不是另一個矢量數據庫,它是一個框架,可以將矢量數據庫轉換為具有所有細微差別的搜索引擎。
有關挑戰和解決方案的更多信息
我們的框架使您能夠根據用戶體驗不斷地微調模型,從而使您更快,更準確地形成搜索結果。

查看我們的正式文檔。
要嘗試嵌入工作室,您可以啟動預先配置的演示項目。我們已經準備了一個存儲在公共S3存儲桶中的數據集,用戶點擊的模擬器以及用於微調模型的基本腳本。通過將其調整為您的要求,您可以為模型啟動微調。
確保您在系統上使用docker compose version命令:
Docker Compose version v2.23.3您也可以嘗試Docker-Compose版本命令。向前邁進,我們將使用較新的Docker Compose版本命令,但是Docker-Compose版本命令也可以在您的系統上成功使用。
首先,通過執行以下命令來提出所有嵌入工作室服務:
docker compose up -d一旦所有服務啟動,您就可以開始使用Embedding Studio。讓我們模擬用戶搜索會話。我們將運行一個預構建的腳本,該腳本將調用嵌入式工作室API並效仿用戶行為:
docker compose --profile demo_stage_clickstream up -d腳本執行後,您可以啟動模型進行微調。執行以下命令:
docker compose --profile demo_stage_finetuning up -d這將排隊由微調工人處理的任務。要在微調隊列中獲取所有任務,請將GET請求發送到端點/api/v1/fine-tuning/task :
curl -X GET http://localhost:5000/api/v1/fine-tuning/task答案將是:
[
{
"fine_tuning_method" : " Default Fine Tuning Method " ,
"status" : " processing " ,
"created_at" : " 2023-12-21T14:30:25.823000 " ,
"updated_at" : " 2023-12-21T14:32:16.673000 " ,
"batch_id" : " 65844a671089823652b83d43 " ,
"id" : " 65844c019fa7cf0957d04758 "
}
]擁有任務ID後,您可以通過將get請求發送到端點/api/v1/fine-tuning/task/{task_id} :
curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758結果將類似於查詢所有任務時收到的內容。對於更方便的跟踪進度方法,您可以在http:// localhost:5001使用MLFLOW。
檢查fine_tuning_worker的日誌以確保一切正常運行,這也是有益的。為此,請使用命令列出所有服務:
docker logs embedding_studio-fine_tuning_worker-1如果一切成功完成,您會看到類似的日誌:
Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00, 0.17it/s, v_num = 8]
[2023-12-21 14:59:05,931] [PID 7] [Thread-6] [pytorch_lightning.utilities.rank_zero] [INFO] ` Trainer.fit ` stopped: ` max_epochs=3 ` reached.
Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00, 0.17it/s, v_num = 8]
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Save model (best only, current quality: 8.426392069685529e-05)
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Save model for 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:06,009] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [WARNING] No finished experiments found with model uploaded, except initial
[2023-12-21 14:59:16,432] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Upload is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Saving is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current run 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:16,445] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current run is finished
[2023-12-21 14:59:16,656] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current iteration 2
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current iteration is finished
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.worker] [INFO] Fine tuning of the embedding model was completed successfully !恭喜!您已經成功改進了模型!
要下載最佳型號,您可以使用Embedding Studio API:
curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758如果一切正常,您將看到以下輸出:
{
"fine_tuning_method" : " Default Fine Tuning Method " ,
"status" : " done " ,
"best_model_url" : " http://localhost:5001/get-artifact?path=model%2Fdata%2Fmodel.pth&run_uuid=571304f0c330448aa8cbce831944cfdd " ,
...
}和best_model_url字段包含HTTP訪問model.pth 。
您可以通過執行以下命令下載 *.pth文件:
wget http://localhost:5001/get-artifact ? path=model%2Fdata%2Fmodel.pth & run_uuid=571304f0c330448aa8cbce831944cfdd我們歡迎嵌入工作室的貢獻!
嵌入Studio已獲得Apache許可證版本2.0的許可。有關完整許可文本,請參見許可證。