openai caching proxy worker下載 - openai caching proxy worker源代碼下載

openai caching proxy worker

其他源碼

1.0.0

下載

筆記

截至2024年10月，OpenAI現在正式支持大多數型號的提示：https：//openai.com/index/api-prompt-caching/。建議您改用OpenAI的官方實施。

OpenAi-Coching-Proxy-Worker

OpenAI API的基本緩存代理，可作為CloudFlare工人部署。

這可以通過返回重複請求的緩存響應來幫助您降低OpenAI成本（並獲得更快的結果）。

代理服務器以每次要求為基礎指定緩存TTL，因此您可以根據自己的需求進行配置。例如， text-davinci-003型號為10倍，是text-curie-001的成本，因此您可以選擇為Davinci的更長的緩存結果。

客戶端兼容性：

OpenAI/OpenAi節點：完整兼容性，僅需幾行配置即可使用
OpenAI/Openai-Python：部分兼容性，支持緩存，但沒有TTL選項，因此您需要一個緩存驅逐策略
Alexrudall/Ruby-Openai：部分兼容性，支持緩存，但沒有TTL選項，因此您需要一個緩存驅逐策略

它只有緩存帶有JSON請求主體的POST請求，因為這些請求往往是最慢的，並且是唯一要花錢的請求（目前）。

設定

克隆回購併安裝依賴項。

您將需要註冊兩個服務（兩者都有免費層）：

Cloudflare：我們的工人將被託管。
UPSTASH：我們用Upstash的Redis-over-HTTP服務來存儲緩存的OpenAI響應。

最後，根據wrangler.toml中的說明來設置您的Redis秘密。

根據您的使用情況，您可以嘗試用CloudFlare KV代替Redis，這最終是一致的，但可能會提供更好的閱讀延遲。檢查wrangler.toml的設置說明。

用法

從http：// localhost：8787啟動代理服務器：

 yarn start

然後，在您擁有OpenAI/OpenAi節點配置的單獨項目中，通過新的basePath傳遞，以便通過您的代理髮送請求，而不是直接發送到OpenAi：

const { Configuration, OpenAIApi } = require("openai");

const configuration = new Configuration({
  apiKey: process.env.OPENAI_API_KEY,
+ // Point this to your local instance or Cloudflare deployment:
+ basePath: 'http://localhost:8787/proxy',
});
const openai = new OpenAIApi(configuration);

然後，您可以嘗試一些示例請求。由於尚未為此保存緩存的響應，因此第一個將被代理到OpenAI，但是第二個重複/重複請求將返回緩存結果。

 const options = { model : 'text-ada-001' , prompt : 'write a poem about computers' } ;

// This first request will be proxied as-is to OpenAI API, since a cached
// response does not yet exist for it:
const completion = await openai . createCompletion ( options ) ;
console . log ( 'completion:' , completion ) ;

// This second request uses the same options, so it returns nearly instantly from
// local cache and does not make a request to OpenAI:
const completionCached = await openai . createCompletion ( options ) ;
console . log ( 'completionCached:' , completionCached ) ;

指定緩存TTL

如果您不想無限期地緩存結果，或者您沒有在REDIS實例上設置驅逐策略，則可以使用X-Proxy-TTL標頭在幾秒鐘內指定TTL。

const configuration = new Configuration({
  ...
+ baseOptions: {
+   // In this example, we specify a cache TTL of 24 hours before it expires:
+   headers: { 'X-Proxy-TTL': 60 * 60 * 24 }
+ }
});

刷新緩存

如果您需要強制刷新緩存，則可以使用標題X-Proxy-Refresh 。這將從Openai獲得新的響應，並緩存此新響應。

const configuration = new Configuration({
  ...
+ baseOptions: {
+   headers: { 'X-Proxy-Refresh': 'true' }
+ }
});

示例客戶使用情況

有關如何與OpenAI客戶訪問此代理的完整示例，請參見/examples/目錄。

這同時包括Node.js，Python和Ruby客戶端使用示例。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-03-07
大小 112.57KB
來自於 Github

相關應用

proxy manager app

2024-11-15
docker mc proxy

2024-11-12
temporal worker controller

2024-11-06
openai realtime console

2024-11-05
oauth2 proxy

2024-11-02
蜘蛛代理應用程式

2023-08-17

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部