Text2ImageDescription下載Text2ImageDescription源代碼下載

中文(繁体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首頁>編程相關>其他源碼

Text2ImageDescription

其他源碼

1.0.0

下載

text2ImagedEscription

該項目有2個主要部分：

圖像檢索：給定文本查詢，從數據集中檢索與查詢相關的圖像。
圖像描述生成：給定文本查詢，為圖像生成與查詢最相關的描述。

圖像檢索

該項目的圖像檢索部分使用預先訓練的OpenAI剪輯模型（https://github.com/openai/clip）從與給定文本查詢相關的數據集中檢索圖像。用於此項目的數據集是Pascal VOC 2012數據集。該數據集包含大約3500張圖像（火車 +驗證）。剪輯模型用於編碼文本查詢和數據集中的圖像。文本查詢與圖像之間的相似性是使用餘弦相似性計算的。然後根據相似性得分對圖像進行排名，並返回頂部K圖像。

圖像描述生成

圖像描述生成項目的一部分使用預先訓練的Mistral-7b（https://huggingface.co/thebloke/mistral-7b-instruct-v0.1-gguf）模型來生成給出輸入查詢的描述。

用法

要運行該項目，請按照以下步驟操作：

克隆存儲庫
運行筆記本code.ipynb

表現

資源：12 GB GPU（NVIDIA T4）
圖像搜索：〜50毫秒。
描述生成：流媒體在大約2.5秒內開始，達到每秒40個令牌的速率。

結果

查看演示視頻以查看text2ImagedEscription在行動中：

demo.mp4

執照

該項目是根據MIT許可證獲得許可的 - 有關詳細信息，請參見許可證文件。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-05-26
大小 883.61KB
來自於 Github

相關應用

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部