Скачать uni api - загрузка исходного кода uni api

Uni-Api

Английский | китайский

Введение

Для личного использования один/новый API слишком сложный со многими коммерческими функциями, которые не нужны люди. Если вам не нужно сложный интерфейс Frontend и предпочитаете поддержку большего количества моделей, вы можете попробовать Uni-API. Это проект, который объединяет управление API -моделей крупной языковой модели, позволяя вам вызывать множественные сервисы бэкэнд через единый унифицированный интерфейс API, преобразуя их все в формат OpenAI и поддерживая балансировку нагрузки. В настоящее время поддерживаемые бэкэнд -услуги включают в себя: OpenAI, Anpropic, Gemini, Vertex, Cohere, Groq, Cloudflare, OpenRouter и многое другое.

Функции

Нет фронтального, чистого файла конфигурации для настройки каналов API. Вы можете запустить свою собственную станцию API, просто написав файл, а документация имеет подробное руководство по конфигурации, удобное для начинающих.
Унифицированное управление множественными бэкэнд -услугами, вспомогательных поставщиков, таких как OpenAI, DeepSeek, OpenRouter и другие API в формате OpenAI. Поддерживает Generation Image Generation Openai Dalle-3.
Одновременно поддерживает антропные, Близнецы, вершины AI, Cohere, Groq, Cloudflare. Вершина одновременно поддерживает API Клода и Близнецов.
Поддержите OpenAI, антропический, Близнецы, Vertex Native Tool Используйте вызовы функций.
Поддержка OpenAI, антроп, Близнецы, API распознавания изображений Vertex.
Поддержите четыре типа балансировки нагрузки.
1. Поддерживает балансировку взвешенной нагрузки на уровне канала, позволяя распределять запросы в соответствии с различными весами канала. Он не включен по умолчанию и требует настройки весов канала.
2. Поддержка региональной балансировки нагрузки Vertex и высокой параллелистики, которые могут увеличить параллелизм Близнецов и Клода до (количество API -интерфейсов * числа регионов). Автоматически включена без дополнительной конфигурации.
3. За исключением балансировки нагрузки на уровне вершины на уровне вершины, все API поддерживают последовательную балансировку на уровне канала, улучшая захватывающий опыт перевода. Он не включен по умолчанию и требует настройки SCHEDULING_ALGORITHM как round_robin .
4. Поддержка автоматического API на уровне клавиш на уровне круглосуточного нагрузки для нескольких клавиш API в одном канале.
Поддержка автоматической повторной попытки, когда отклик канала API не стерж, автоматически повторно повторно повторно повторно повторяет канал API.
Поддержка охлаждения канала: когда отклик канала API не стерж, канал будет автоматически исключаться и охлаждаться в течение определенного периода времени, а запросы на канал будут остановлены. После окончания периода охлаждения модель автоматически будет восстановлена до тех пор, пока она снова не выйдет из строя, после чего она снова будет охлаждена.
Поддержите мелкозернистые настроек тайм-аута модели, позволяя различной длительности тайм-аута для каждой модели.
Поддержка мелкозернистого контроля разрешений. Поддержка с использованием подстановочных знаков для установки конкретных моделей, доступных для каналов ключей API.
Ограничение скорости поддержки, вы можете установить максимальное количество запросов в минуту в качестве целого числа, такого как 2/мин, 2 раза в минуту, 5 в час, 5 раз в час, 10 в день, 10 раз в день, 10/месяц, 10 раз в месяц, 10 в год, 10 раз в год. По умолчанию 60/мин.
Поддерживает несколько стандартных интерфейсов Format Openai: /v1/chat/completions , /v1/images/generations , /v1/audio/transcriptions , /v1/moderations , /v1/models .
Поддержка морального обзора Openai Moderation, который может провести моральные обзоры сообщений пользователей. Если будут найдены неподходящие сообщения, будет возвращено сообщение об ошибке. Это снижает риск того, что поставщики запрещают задержку API.

Метод использования

Чтобы запустить Uni-API, необходимо использовать файл конфигурации. Есть два способа начать с файла конфигурации:

Первый метод состоит в том, чтобы использовать переменную среды CONFIG_URL для заполнения URL-адреса файла конфигурации, который будет автоматически загружаться при запуске Uni-API.
Второй метод заключается в монтировании файла конфигурации с именем api.yaml в контейнер.

Метод 1: Установите файл конфигурации `api.yaml` , чтобы запустить Uni-API

Вы должны заранее заполнить файл конфигурации, чтобы запустить uni-api , и вы должны использовать файл конфигурации с именем api.yaml для запуска uni-api , вы можете настроить несколько моделей, каждая модель может настроить несколько сервисов бэкэнд и поддержать балансировку нагрузки. Ниже приведен пример минимального файла конфигурации api.yaml , который можно запустить:

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required, automatically uses base_url and api to get all available models through the /v1/models endpoint.
  # Multiple providers can be configured here, each provider can configure multiple API Keys, and each API Key can configure multiple models.
api_keys :
  - api : sk-Pkj60Yf8JFWxfgRmXQFWyGtWUddGZnmi3KlvowmRWpWpQxx # API Key, user request uni-api requires API key, required
  # This API Key can use all models, that is, it can use all models in all channels set under providers, without needing to add available channels one by one.

Подробная расширенная конфигурация api.yaml :

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required
    model : # Optional, if model is not configured, all available models will be automatically obtained through base_url and api via the /v1/models endpoint.
      - gpt-4o # Usable model name, required
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
      - dall-e-3

  - provider : anthropic
    base_url : https://api.anthropic.com/v1/messages
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - sk-ant-api03-bNnAOJyA-xQw_twAA
      - sk-ant-api02-bNnxxxx
    model :
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
    tools : true # Whether to support tools, such as generating code, generating documents, etc., default is true, optional

  - provider : gemini
    base_url : https://generativelanguage.googleapis.com/v1beta # base_url supports v1beta/v1, only for Gemini model use, required
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - AIzaSyAN2k6IRdgw123
      - AIzaSyAN2k6IRdgw456
      - AIzaSyAN2k6IRdgw789
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash-exp-0827 : gemini-1.5-flash # After renaming, the original model name gemini-1.5-flash-exp-0827 cannot be used, if you want to use the original name, you can add the original name in the model, just add the line below to use the original name
      - gemini-1.5-flash-exp-0827 # Add this line, both gemini-1.5-flash-exp-0827 and gemini-1.5-flash can be requested
    tools : true
    preferences :
      api_key_rate_limit : 15/min # Each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # api_key_rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      api_key_cooldown_period : 60 # Each API Key will be cooled down for 60 seconds after encountering a 429 error. Optional, the default is 0 seconds. When set to 0, the cooling mechanism is not enabled. When there are multiple API keys, the cooling mechanism will take effect.
      api_key_schedule_algorithm : round_robin # Set the request order of multiple API Keys, optional. The default is round_robin, and the optional values are: round_robin, random. It will take effect when there are multiple API keys. round_robin is polling load balancing, and random is random load balancing.
      model_timeout : # Model timeout, in seconds, default 100 seconds, optional
        gemini-1.5-pro : 10 # Model gemini-1.5-pro timeout is 10 seconds
        gemini-1.5-flash : 10 # Model gemini-1.5-flash timeout is 10 seconds
        default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the timeout is also 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
      proxy : socks5://[username]:[password]@[ip]:[port] # Proxy address, optional. Supports socks5 and http proxies, default is not used.

  - provider : vertex
    project_id : gen-lang-client-xxxxxxxxxxxxxx # Description: Your Google Cloud project ID. Format: String, usually composed of lowercase letters, numbers, and hyphens. How to obtain: You can find your project ID in the project selector of the Google Cloud Console.
    private_key : " -----BEGIN PRIVATE KEY----- n xxxxx n -----END PRIVATE " # Description: Private key for Google Cloud Vertex AI service account. Format: A JSON formatted string containing the private key information of the service account. How to obtain: Create a service account in Google Cloud Console, generate a JSON formatted key file, and then set its content as the value of this environment variable.
    client_email : [email protected] # Description: Email address of the Google Cloud Vertex AI service account. Format: Usually a string like "[email protected]". How to obtain: Generated when creating a service account, or you can view the service account details in the "IAM and Admin" section of the Google Cloud Console.
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash
      - gemini-1.5-pro : gemini-1.5-pro-search # Only supports using the gemini-1.5-pro-search model to request uni-api when using the Vertex Gemini API, to automatically use the Google official search tool.
      - claude-3-5-sonnet@20240620 : claude-3-5-sonnet
      - claude-3-opus@20240229 : claude-3-opus
      - claude-3-sonnet@20240229 : claude-3-sonnet
      - claude-3-haiku@20240307 : claude-3-haiku
    tools : true
    notes : https://xxxxx.com/ # You can put the provider's website, notes, official documentation, optional

  - provider : cloudflare
    api : f42b3xxxxxxxxxxq4aoGAh # Cloudflare API Key, required
    cf_account_id : 8ec0xxxxxxxxxxxxe721 # Cloudflare Account ID, required
    model :
      - ' @cf/meta/llama-3.1-8b-instruct ' : llama-3.1-8b # Rename model, @cf/meta/llama-3.1-8b-instruct is the provider's original model name, must be enclosed in quotes, otherwise yaml syntax error, llama-3.1-8b is the renamed name, you can use a simple name to replace the original complex name, optional
      - ' @cf/meta/llama-3.1-8b-instruct ' # Must be enclosed in quotes, otherwise yaml syntax error

  - provider : other-provider
    base_url : https://api.xxx.com/v1/messages
    api : sk-bNnAOJyA-xQw_twAA
    model :
      - causallm-35b-beta2ep-q6k : causallm-35b
      - anthropic/claude-3-5-sonnet
    tools : false
    engine : openrouter # Force the use of a specific message format, currently supports gpt, claude, gemini, openrouter native format, optional

api_keys :
  - api : sk-KjjI60Yf0JFWxfgRmXqFWyGtWUd9GZnmi3KlvowmRWpWpQRo # API Key, required for users to use this service
    model : # Models that can be used by this API Key, required. Default channel-level polling load balancing is enabled, and each request model is requested in sequence according to the model configuration. It is not related to the original channel order in providers. Therefore, you can set different request sequences for each API key.
      - gpt-4o # Usable model name, can use all gpt-4o models provided by providers
      - claude-3-5-sonnet # Usable model name, can use all claude-3-5-sonnet models provided by providers
      - gemini/* # Usable model name, can only use all models provided by providers named gemini, where gemini is the provider name, * represents all models
    role : admin

  - api : sk-pkhf60Yf0JGyJxgRmXqFQyTgWUd9GZnmi3KlvowmRWpWqrhy
    model :
      - anthropic/claude-3-5-sonnet # Usable model name, can only use the claude-3-5-sonnet model provided by the provider named anthropic. Models with the same name from other providers cannot be used. This syntax will not match the model named anthropic/claude-3-5-sonnet provided by other-provider.
      - <anthropic/claude-3-5-sonnet> # By adding angle brackets on both sides of the model name, it will not search for the claude-3-5-sonnet model under the channel named anthropic, but will take the entire anthropic/claude-3-5-sonnet as the model name. This syntax can match the model named anthropic/claude-3-5-sonnet provided by other-provider. But it will not match the claude-3-5-sonnet model under anthropic.
      - openai-test/text-moderation-latest # When message moderation is enabled, the text-moderation-latest model under the channel named openai-test can be used for moderation.
      - sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo/* # Support using other API keys as channels
    preferences :
      SCHEDULING_ALGORITHM : fixed_priority # When SCHEDULING_ALGORITHM is fixed_priority, use fixed priority scheduling, always execute the channel of the first model with a request. Default is enabled, SCHEDULING_ALGORITHM default value is fixed_priority. SCHEDULING_ALGORITHM optional values are: fixed_priority, round_robin, weighted_round_robin, lottery, random.
      # When SCHEDULING_ALGORITHM is random, use random polling load balancing, randomly request the channel of the model with a request.
      # When SCHEDULING_ALGORITHM is round_robin, use polling load balancing, request the channel of the model used by the user in order.
      AUTO_RETRY : true # Whether to automatically retry, automatically retry the next provider, true for automatic retry, false for no automatic retry, default is true. Also supports setting a number, indicating the number of retries.
      rate_limit : 15/min # Supports rate limiting, each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      ENABLE_MODERATION : true # Whether to enable message moderation, true for enable, false for disable, default is false, when enabled, it will moderate the user's message, if inappropriate messages are found, an error message will be returned.

  # Channel-level weighted load balancing configuration example
  - api : sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo
    model :
      - gcp1/* : 5 # The number after the colon is the weight, weight only supports positive integers.
      - gcp2/* : 3 # The size of the number represents the weight, the larger the number, the greater the probability of the request.
      - gcp3/* : 2 # In this example, there are a total of 10 weights for all channels, and 10 requests will have 5 requests for the gcp1/* model, 2 requests for the gcp2/* model, and 3 requests for the gcp3/* model.

    preferences :
      SCHEDULING_ALGORITHM : weighted_round_robin # Only when SCHEDULING_ALGORITHM is weighted_round_robin and the above channel has weights, it will request according to the weighted order. Use weighted polling load balancing, request the channel of the model with a request according to the weight order. When SCHEDULING_ALGORITHM is lottery, use lottery polling load balancing, request the channel of the model with a request according to the weight randomly. Channels without weights automatically fall back to round_robin polling load balancing.
      AUTO_RETRY : true

preferences : # Global configuration
  model_timeout : # Model timeout, in seconds, default 100 seconds, optional
    gpt-4o : 10 # Model gpt-4o timeout is 10 seconds, gpt-4o is the model name, when requesting models like gpt-4o-2024-08-06, the timeout is also 10 seconds
    claude-3-5-sonnet : 10 # Model claude-3-5-sonnet timeout is 10 seconds, when requesting models like claude-3-5-sonnet-20240620, the timeout is also 10 seconds
    default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the default timeout is 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
    o1-mini : 30 # Model o1-mini timeout is 30 seconds, when requesting models starting with o1-mini, the timeout is 30 seconds
    o1-preview : 100 # Model o1-preview timeout is 100 seconds, when requesting models starting with o1-preview, the timeout is 100 seconds
  cooldown_period : 300 # Channel cooldown time, in seconds, default 300 seconds, optional. When a model request fails, the channel will be automatically excluded and cooled down for a period of time, and will not request the channel again. After the cooldown time ends, the model will be automatically restored until the request fails again, and it will be cooled down again. When cooldown_period is set to 0, the cooling mechanism is not enabled.
  error_triggers : # Error triggers, when the message returned by the model contains any of the strings in the error_triggers, the channel will return an error. Optional
    - The bot's usage is covered by the developer
    - process this request due to overload or policy

Установите файл конфигурации и запустите контейнер Docker Uni-API:

docker run --user root -p 8001:8000 --name uni-api -dit 
-v ./api.yaml:/home/api.yaml 
yym68686/uni-api:latest

Метод второй: запустите Uni-API, используя переменную среды `CONFIG_URL`

После написания файла конфигурации в соответствии с методом первого, загрузите его на облачный диск, получите прямую ссылку файла, а затем используйте переменную среды CONFIG_URL , чтобы запустить контейнер Docker Uni-API:

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml 
yym68686/uni-api:latest

Переменная среды

Config_url: адрес загрузки файла конфигурации, который может быть локальным файлом или удаленным файлом, необязательно
Тайм -аут: тайм -аут запроса, по умолчанию - 100 секунд. Тайм -аут может контролировать время, необходимое для перехода на следующий канал, когда один канал не отвечает. Необязательный
DISABLE_DATABASE: отключить базу данных, по умолчанию неверно, необязательно

Vercel удаленное развертывание

После нажатия кнопки «Развертывание» выше, установите переменную среды CONFIG_URL на прямую ссылку файла конфигурации, DISABLE_DATABASE на true, а затем нажмите «Создать», чтобы создать проект. После развертывания вам необходимо вручную установить функцию максимальной продолжительности до 60 секунд на панели проекта Vercel в разделе «Функции», а затем нажмите в меню развертывания и нажмите «Перераспределение», чтобы перераспределить, что установит тайм -аут на 60 секунд. Если вы не перераспределяете, время ожидания по умолчанию останется на исходных 10 секунд. Обратите внимание, что вы не должны удалять проект Vercel и воссоздать его; Вместо этого нажмите «Перераспределение» в меню «Развертывания» в рамках в настоящее время развернутого проекта Vercel, чтобы вступить в силу максимальную модификацию функции.

Ubuntu развертывание

В выпусках склада найдите последнюю версию соответствующего двоичного файла, например, файл с именем Uni-API-Linux-X86_64-0.0.99.pex. Загрузите двоичный файл на сервере и запустите его:

wget https://github.com/yym68686/uni-api/releases/download/v0.0.99/uni-api-linux-x86_64-0.0.99.pex
chmod +x uni-api-linux-x86_64-0.0.99.pex
./uni-api-linux-x86_64-0.0.99.pex

Удаленное развертывание SERV00 (FreeBSD 14.0)

Сначала войдите на панель, в дополнительных службах Нажмите на вкладку. Запустите свои собственные приложения, чтобы позволить опции запускать свои собственные программы, а затем перейдите в резервирование порта панели, чтобы случайным образом открыть порт.

Если у вас нет собственного доменного имени, перейдите на панель WWW -сайты и удалите предоставленное доменное имя по умолчанию. Затем создайте новый домен с доменом, который вы только что удалили. После нажатия расширенных настроек установите тип веб -сайта в домен Proxy, и порт прокси должен указывать на только что открытый порт. Не выбирайте использовать HTTPS.

Вход в SSH на сервер SERV00 выполните следующую команду:

git clone --depth 1 -b main --quiet https://github.com/yym68686/uni-api.git
cd uni-api
python -m venv uni-api
tmux new -s uni-api
source uni-api/bin/activate
export CFLAGS= " -I/usr/local/include "
export CXXFLAGS= " -I/usr/local/include "
export CC=gcc
export CXX=g++
export MAX_CONCURRENCY=1
export CPUCOUNT=1
export MAKEFLAGS= " -j1 "
CMAKE_BUILD_PARALLEL_LEVEL=1 cpuset -l 0 pip install -vv -r requirements.txt
cpuset -l 0 pip install -r -vv requirements.txt

CTRL+BD, чтобы выйти из TMUX, подождите несколько часов, чтобы завершить установку, и после завершения установки выполните следующую команду:

tmux attach -t uni-api
source uni-api/bin/activate
export CONFIG_URL=http://file_url/api.yaml
export DISABLE_DATABASE=true
# Modify the port, xxx is the port, modify it yourself, corresponding to the port opened in the panel Port reservation
sed -i ' ' ' s/port=8000/port=xxx/ ' main.py
sed -i ' ' ' s/reload=True/reload=False/ ' main.py
python main.py

Используйте Ctrl+BD для выхода из TMUX, позволяя программе работать в фоновом режиме. На этом этапе вы можете использовать Uni-API в других клиентах в чате. Сценарий тестирования сгиба:

curl -X POST https://xxx.serv00.net/v1/chat/completions 
-H ' Content-Type: application/json ' 
-H ' Authorization: Bearer sk-xxx ' 
-d ' {"model": "gpt-4o","messages": [{"role": "user","content": "Hello"}]} '

Справочный документ:

https://docs.serv00.com/python/

https://linux.do/t/topic/201181

https://linux.do/t/topic/218738

Docker Local развертывание

Начните контейнер

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml  # If the local configuration file has already been mounted, there is no need to set CONFIG_URL
-v ./api.yaml:/home/api.yaml  # If CONFIG_URL is already set, there is no need to mount the configuration file
-v ./uniapi_db:/home/data  # If you do not want to save statistical data, there is no need to mount this folder
yym68686/uni-api:latest

Или, если вы хотите использовать Docker Compose, вот пример Docker-Compose.yml:

 services :
  uni-api :
    container_name : uni-api
    image : yym68686/uni-api:latest
    environment :
      - CONFIG_URL=http://file_url/api.yaml # If a local configuration file is already mounted, there is no need to set CONFIG_URL
    ports :
      - 8001:8000
    volumes :
      - ./api.yaml:/home/api.yaml # If CONFIG_URL is already set, there is no need to mount the configuration file
      - ./uniapi_db:/home/data # If you do not want to save statistical data, there is no need to mount this folder

Config_url - это URL -адрес файла удаленной конфигурации, который может быть автоматически загружен. Например, если вам не удобно изменять файл конфигурации на определенной платформе, вы можете загрузить файл конфигурации в службу хостинга и предоставить прямую ссылку на Uni-API для загрузки, который является config_url. Если вы используете локальный монтажный файл конфигурации, нет необходимости устанавливать config_url. Config_url используется, когда не удобно монтировать файл конфигурации.

Запустить контейнер Docker Compose на заднем плане

docker-compose pull
docker-compose up -d

Docker Build

docker build --no-cache -t uni-api:latest -f Dockerfile --platform linux/amd64 .
docker tag uni-api:latest yym68686/uni-api:latest
docker push yym68686/uni-api:latest

Перезапустив изображение Docker One Click

 set -eu
docker pull yym68686/uni-api:latest
docker rm -f uni-api
docker run --user root -p 8001:8000 -dit --name uni-api 
-e CONFIG_URL=http://file_url/api.yaml 
-v ./api.yaml:/home/api.yaml 
-v ./uniapi_db:/home/data 
yym68686/uni-api:latest
docker logs -f uni-api

RESTful Curl Test

curl -X POST http://127.0.0.1:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-H " Authorization: Bearer ${API} " 
-d ' {"model": "gpt-4o","messages": [{"role": "user", "content": "Hello"}],"stream": true} '

Pex Linux упаковка:

VERSION= $( cat VERSION )
pex -D . -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    --platform linux_x86_64-cp-3.10.12-cp310 
    --interpreter-constraint ' ==3.10.* ' 
    --no-strip-pex-env 
    -o uni-api-linux-x86_64- ${VERSION} .pex

упаковка macOS:

VERSION= $( cat VERSION )
pex -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    -o uni-api-macos-arm64- ${VERSION} .pex

Спонсоры

Мы благодарим следующих спонсоров за их поддержку:

@Powerhunter: ¥ 2000
@ioi ： ¥ 50

Как спонсировать нас

Если вы хотите поддержать наш проект, вы можете спонсировать нас следующими способами:

PayPal
USDT-TRC20, USDT-TRC20 Адрес кошелька: TLFbqSv5pDu5he43mVmK1dNx7yBMFeN7d8
WeChat
Алипай

Спасибо за вашу поддержку!

Часто задаваемые вопросы

Почему Error processing request or performing moral check: 404: No matching model found ?

Настройка enable_moderation в false исправят эту проблему. Когда enable_moderation TRUE, API должен иметь возможность использовать модель Text-Moderation-Latest-LateSt, и если вы не предоставили текстовый-моделирование-лучшего в настройках модели поставщика, возникнет ошибка, указывающая на то, что модель не может быть найдена.

Как определить приоритеты запросов на конкретный канал, как установить приоритет канала?

Непосредственно установите порядок канала в API_KEYS. Другие настройки не требуются. Пример файла конфигурации:

 providers :
  - provider : ai1
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

  - provider : ai2
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

api_keys :
  - api : sk-1234
    model :
      - ai2/*
      - ai1/*

Таким образом, сначала запросите AI2, и, если он не удастся, запросите AI1.

Каково поведение различных алгоритмов планирования? Например, Fixed_priority, Weeshed_Round_Robin, лотерея, случайная, Round_robin?

Все алгоритмы планирования должны быть включены путем установки API_KEYS. (API) .Preferences.scheduling_algorithm в файле конфигурации в любом из значений: Fixed_priority, Wheesed_round_robin, лотерея, случайная, Round_robin.

fixed_priority: фиксированное приоритетное планирование. Все запросы всегда выполняются каналом модели, которая сначала имеет запрос пользователя. В случае ошибки он переключится на следующий канал. Это алгоритм планирования по умолчанию.
Weeshed_Round_Robin: Взвешенная балансировка нагрузки с круглой робином, запрашивает каналы с запрашиваемой моделью пользователя в соответствии с установленным порядок веса в файле конфигурации API_KEYS. (API) .Model.
Лотерея: нарисуйте балансировку нагрузки с круглой робином, случайным образом запросите канал модели с запросами пользователя в соответствии с весом, установленным в файле конфигурации API_KEYS. (API) .Model.
Round_robin: балансировка нагрузки с раундом-робином, запрашивает канал, который владеет моделью, запрашиваемой пользователем в соответствии с порядком конфигурации в файле конфигурации API_KEYS. (API) .Model. Вы можете проверить предыдущий вопрос о том, как установить приоритет каналов.

Как можно правильно заполнить base_url?

За исключением некоторых специальных каналов, показанных в расширенной конфигурации, все поставщики формата Openai должны полностью заполнить BASE_URL, что означает, что BASE_URL должен закончиться/V1/чат/завершением. Если вы используете модели GitHub, BASE_URL должен быть заполнен как https://models.inference.ai.azure.com/chat/completions, а не URL -адрес Azure.

Как работает время аута модели? Каков приоритет настройки тайм-аута на уровне канала и настройки времени ожидания глобальной модели?

Настройка тайм-аута на уровне канала имеет более высокий приоритет, чем настройка времени ожидания глобальной модели. Приоритетный заказ: Настройка тайм-аута модели на уровне канала> Настройка тайм-аута по умолчанию на уровне канала> Настройка тайм-аута глобальной модели> Глобальная настройка тайм-аута по умолчанию> Тайм-аут переменной среды.

Регулируя время ожидания модели, вы можете избежать ошибки некоторых каналов. Если вы столкнетесь с ошибкой {'error': '500', 'details': 'fetch_response_stream Read Response Timeout'} , попробуйте увеличить время ожидания модели.

Как работает API_KEY_RATE_LIMIT? Как мне установить один и тот же предел скорости для нескольких моделей?

Если вы хотите установить тот же предел частоты для четырех моделей Gemini-1.5-Pro-Latest, Gemini-1.5-Pro, Gemini-1.5-Pro-001, Gemini-1.5-Pro-002 одновременно вы можете установить его так:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min

Это будет соответствовать всем моделям, содержащим строку Gemini-1.5-Pro. Предел частоты для этих четырех моделей, Gemini-1,5-про-латест, Gemini-1.5-Pro, Gemini-1,5-Pro-001, Gemini-1,5-Pro-002, будет установлен на 1000/мин. Логика для настройки поля API_KEY_RATE_LIMIT заключается в следующем, вот пример файла конфигурации:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min
  gemini-1.5-pro-002 : 500/min

В настоящее время, если есть запрос с использованием модели Gemini-1.5-Pro-002.

Во-первых, Uni-API попытается точно соответствовать модели в API_KEY_RATE_LIMIT. Если ограничение скорости для Близнецов-1,5-пропл. Если запрашиваемая модель в настоящее время не является Gemini-1.5-Pro-002, а Gemini-1.5-Pro-Latest, поскольку API_KEY_RATE_LIMIT не имеет предела скорости для Gemini-1.5-Pro-Lates быть установленным на 1000/мин.

Звездная история

Расширять

uni api

Uni-Api

Введение

Функции

Метод использования

Метод 1: Установите файл конфигурации `api.yaml` , чтобы запустить Uni-API

Метод второй: запустите Uni-API, используя переменную среды `CONFIG_URL`

Переменная среды

Vercel удаленное развертывание

Ubuntu развертывание

Удаленное развертывание SERV00 (FreeBSD 14.0)

Docker Local развертывание

Спонсоры

Как спонсировать нас

Часто задаваемые вопросы

Звездная история

evolution api

Европа Юниор

Университет заклинателей

Университет

Сломанный универ

Танковый универ

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

uni api

Uni-Api

Введение

Функции

Метод использования

Метод 1: Установите файл конфигурации api.yaml , чтобы запустить Uni-API

Метод второй: запустите Uni-API, используя переменную среды CONFIG_URL

Переменная среды

Vercel удаленное развертывание

Ubuntu развертывание

Удаленное развертывание SERV00 (FreeBSD 14.0)

Docker Local развертывание

Спонсоры

Как спонсировать нас

Часто задаваемые вопросы

Звездная история

Метод 1: Установите файл конфигурации `api.yaml` , чтобы запустить Uni-API

Метод второй: запустите Uni-API, используя переменную среды `CONFIG_URL`