Téléchargement de uni api - Téléchargement du code source uni api

uni-API

Anglais | Chinois

Introduction

Pour un usage personnel, un / New-API est trop complexe avec de nombreuses fonctionnalités commerciales dont les individus n'ont pas besoin. Si vous ne voulez pas d'une interface frontale compliquée et préférez la prise en charge de plus de modèles, vous pouvez essayer Uni-API. Il s'agit d'un projet qui unifie la gestion des API du modèle de grande langue, vous permettant d'appeler plusieurs services backend via une seule interface API unifiée, de les convertir au format OpenAI et de prendre en charge l'équilibrage de charge. Les services backend actuellement pris en charge incluent: OpenAI, anthropic, gemini, vertex, cohere, grog, cloudflare, openRouter, etc.

Caractéristiques

Pas de fichier de configuration pur frontal pour configurer les canaux API. Vous pouvez exécuter votre propre station API simplement en écrivant un fichier, et la documentation a un guide de configuration détaillé, adapté aux débutants.
Gestion unifiée de plusieurs services backend, de soutien aux fournisseurs tels que OpenAI, Deepseek, OpenRouter et d'autres API au format OpenAI. Prend en charge Openai Dalle-3 Génération d'images.
Soutient simultanément Anthropic, Gemini, Vertex Ai, Cohere, Groq, CloudFlare. Vertex soutient simultanément l'API Claude et Gemini.
Prise en charge des appels de fonction Openai, Anthropic, Gemini, Vertex Native Tool Utilisez des appels de fonction.
Prise en charge de l'API de reconnaissance d'image native Openai, Anthropic, Gemini, Vertex.
Soutenez quatre types d'équilibrage de charge.
1. Prend en charge l'équilibrage de la charge pondéré au niveau du canal, permettant à des demandes d'être distribuées en fonction de différents poids de canal. Il n'est pas activé par défaut et nécessite la configuration des poids des canaux.
2. Soutenir l'équilibrage de la charge régionale du sommet et une concurrence élevée, ce qui peut augmenter la concurrence des Gémeaux et des Claude jusqu'à (nombre d'API * Nombre de régions). Activer automatiquement sans configuration supplémentaire.
3. À l'exception de l'équilibrage de charge au niveau de la région du sommet, tous les API prennent en charge l'équilibrage de charge séquentiel au niveau du canal, améliorant l'expérience de traduction immersive. Il n'est pas activé par défaut et nécessite la configuration SCHEDULING_ALGORITHM en tant que round_robin .
4. Prise en charge de l'équilibrage automatique de charge de la charge de la touche API au niveau de la clé pour plusieurs touches API dans un seul canal.
Prise en charge de la nouvelle tentative automatique, lorsqu'une réponse du canal API échoue, réessayez automatiquement le canal API suivant.
Refroidissement du canal de support: Lorsqu'une réponse du canal API échoue, le canal sera automatiquement exclu et refroidi pendant une période de temps, et les demandes du canal seront arrêtées. Après la fin de la période de refroidissement, le modèle sera automatiquement restauré jusqu'à ce qu'il échoue à nouveau, à quel point il sera à nouveau refroidi.
Prise en charge des paramètres de délai d'expiration du modèle à grains fins, permettant différentes durées de délai d'expiration pour chaque modèle.
Prise en charge le contrôle d'autorisation à grain fin. Prise en charge de l'utilisation des caractères génériques pour définir des modèles spécifiques disponibles pour les canaux clés de l'API.
Limitation du taux de soutien, vous pouvez définir le nombre maximal de demandes par minute en tant qu'ender, tels que 2 / min, 2 fois par minute, 5 / heure, 5 fois par heure, 10 / jour, 10 fois par jour, 10 / mois, 10 fois par mois, 10 / an, 10 fois par an. La valeur par défaut est 60 / min.
Prend en charge plusieurs interfaces de format OpenAI standard: /v1/chat/completions , /v1/images/generations , /v1/audio/transcriptions , /v1/moderations , /v1/models .
Prise en charge de l'examen moral de la modération Openai, qui peut effectuer des avis moraux des messages utilisateur. Si des messages inappropriés sont trouvés, un message d'erreur sera renvoyé. Cela réduit le risque de l'interdiction de l'API backend par les prestataires.

Méthode d'utilisation

Pour démarrer Uni-API, un fichier de configuration doit être utilisé. Il existe deux façons de commencer par un fichier de configuration:

La première méthode consiste à utiliser la variable d'environnement CONFIG_URL pour remplir l'URL du fichier de configuration, qui sera automatiquement téléchargée lorsque Uni-API commencera.
La deuxième méthode consiste à monter un fichier de configuration nommé api.yaml dans le conteneur.

Méthode 1: Montez le fichier de configuration `api.yaml` pour démarrer Uni-API

Vous devez remplir le fichier de configuration à l'avance pour démarrer uni-api , et vous devez utiliser un fichier de configuration nommé api.yaml pour démarrer uni-api , vous pouvez configurer plusieurs modèles, chaque modèle peut configurer plusieurs services backend et prendre en charge l'équilibrage de charge. Vous trouverez ci-dessous un exemple du fichier de configuration api.yaml minimum qui peut être exécuté:

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required, automatically uses base_url and api to get all available models through the /v1/models endpoint.
  # Multiple providers can be configured here, each provider can configure multiple API Keys, and each API Key can configure multiple models.
api_keys :
  - api : sk-Pkj60Yf8JFWxfgRmXQFWyGtWUddGZnmi3KlvowmRWpWpQxx # API Key, user request uni-api requires API key, required
  # This API Key can use all models, that is, it can use all models in all channels set under providers, without needing to add available channels one by one.

Configuration avancée détaillée d' api.yaml :

 providers :
  - provider : provider_name # Service provider name, such as openai, anthropic, gemini, openrouter, can be any name, required
    base_url : https://api.your.com/v1/chat/completions # Backend service API address, required
    api : sk-YgS6GTi0b4bEabc4C # Provider's API Key, required
    model : # Optional, if model is not configured, all available models will be automatically obtained through base_url and api via the /v1/models endpoint.
      - gpt-4o # Usable model name, required
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
      - dall-e-3

  - provider : anthropic
    base_url : https://api.anthropic.com/v1/messages
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - sk-ant-api03-bNnAOJyA-xQw_twAA
      - sk-ant-api02-bNnxxxx
    model :
      - claude-3-5-sonnet-20240620 : claude-3-5-sonnet # Rename model, claude-3-5-sonnet-20240620 is the provider's model name, claude-3-5-sonnet is the renamed name, you can use a simple name to replace the original complex name, optional
    tools : true # Whether to support tools, such as generating code, generating documents, etc., default is true, optional

  - provider : gemini
    base_url : https://generativelanguage.googleapis.com/v1beta # base_url supports v1beta/v1, only for Gemini model use, required
    api : # Supports multiple API Keys, multiple keys automatically enable polling load balancing, at least one key, required
      - AIzaSyAN2k6IRdgw123
      - AIzaSyAN2k6IRdgw456
      - AIzaSyAN2k6IRdgw789
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash-exp-0827 : gemini-1.5-flash # After renaming, the original model name gemini-1.5-flash-exp-0827 cannot be used, if you want to use the original name, you can add the original name in the model, just add the line below to use the original name
      - gemini-1.5-flash-exp-0827 # Add this line, both gemini-1.5-flash-exp-0827 and gemini-1.5-flash can be requested
    tools : true
    preferences :
      api_key_rate_limit : 15/min # Each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # api_key_rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      api_key_cooldown_period : 60 # Each API Key will be cooled down for 60 seconds after encountering a 429 error. Optional, the default is 0 seconds. When set to 0, the cooling mechanism is not enabled. When there are multiple API keys, the cooling mechanism will take effect.
      api_key_schedule_algorithm : round_robin # Set the request order of multiple API Keys, optional. The default is round_robin, and the optional values are: round_robin, random. It will take effect when there are multiple API keys. round_robin is polling load balancing, and random is random load balancing.
      model_timeout : # Model timeout, in seconds, default 100 seconds, optional
        gemini-1.5-pro : 10 # Model gemini-1.5-pro timeout is 10 seconds
        gemini-1.5-flash : 10 # Model gemini-1.5-flash timeout is 10 seconds
        default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the timeout is also 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
      proxy : socks5://[username]:[password]@[ip]:[port] # Proxy address, optional. Supports socks5 and http proxies, default is not used.

  - provider : vertex
    project_id : gen-lang-client-xxxxxxxxxxxxxx # Description: Your Google Cloud project ID. Format: String, usually composed of lowercase letters, numbers, and hyphens. How to obtain: You can find your project ID in the project selector of the Google Cloud Console.
    private_key : " -----BEGIN PRIVATE KEY----- n xxxxx n -----END PRIVATE " # Description: Private key for Google Cloud Vertex AI service account. Format: A JSON formatted string containing the private key information of the service account. How to obtain: Create a service account in Google Cloud Console, generate a JSON formatted key file, and then set its content as the value of this environment variable.
    client_email : [email protected] # Description: Email address of the Google Cloud Vertex AI service account. Format: Usually a string like "[email protected]". How to obtain: Generated when creating a service account, or you can view the service account details in the "IAM and Admin" section of the Google Cloud Console.
    model :
      - gemini-1.5-pro
      - gemini-1.5-flash
      - gemini-1.5-pro : gemini-1.5-pro-search # Only supports using the gemini-1.5-pro-search model to request uni-api when using the Vertex Gemini API, to automatically use the Google official search tool.
      - claude-3-5-sonnet@20240620 : claude-3-5-sonnet
      - claude-3-opus@20240229 : claude-3-opus
      - claude-3-sonnet@20240229 : claude-3-sonnet
      - claude-3-haiku@20240307 : claude-3-haiku
    tools : true
    notes : https://xxxxx.com/ # You can put the provider's website, notes, official documentation, optional

  - provider : cloudflare
    api : f42b3xxxxxxxxxxq4aoGAh # Cloudflare API Key, required
    cf_account_id : 8ec0xxxxxxxxxxxxe721 # Cloudflare Account ID, required
    model :
      - ' @cf/meta/llama-3.1-8b-instruct ' : llama-3.1-8b # Rename model, @cf/meta/llama-3.1-8b-instruct is the provider's original model name, must be enclosed in quotes, otherwise yaml syntax error, llama-3.1-8b is the renamed name, you can use a simple name to replace the original complex name, optional
      - ' @cf/meta/llama-3.1-8b-instruct ' # Must be enclosed in quotes, otherwise yaml syntax error

  - provider : other-provider
    base_url : https://api.xxx.com/v1/messages
    api : sk-bNnAOJyA-xQw_twAA
    model :
      - causallm-35b-beta2ep-q6k : causallm-35b
      - anthropic/claude-3-5-sonnet
    tools : false
    engine : openrouter # Force the use of a specific message format, currently supports gpt, claude, gemini, openrouter native format, optional

api_keys :
  - api : sk-KjjI60Yf0JFWxfgRmXqFWyGtWUd9GZnmi3KlvowmRWpWpQRo # API Key, required for users to use this service
    model : # Models that can be used by this API Key, required. Default channel-level polling load balancing is enabled, and each request model is requested in sequence according to the model configuration. It is not related to the original channel order in providers. Therefore, you can set different request sequences for each API key.
      - gpt-4o # Usable model name, can use all gpt-4o models provided by providers
      - claude-3-5-sonnet # Usable model name, can use all claude-3-5-sonnet models provided by providers
      - gemini/* # Usable model name, can only use all models provided by providers named gemini, where gemini is the provider name, * represents all models
    role : admin

  - api : sk-pkhf60Yf0JGyJxgRmXqFQyTgWUd9GZnmi3KlvowmRWpWqrhy
    model :
      - anthropic/claude-3-5-sonnet # Usable model name, can only use the claude-3-5-sonnet model provided by the provider named anthropic. Models with the same name from other providers cannot be used. This syntax will not match the model named anthropic/claude-3-5-sonnet provided by other-provider.
      - <anthropic/claude-3-5-sonnet> # By adding angle brackets on both sides of the model name, it will not search for the claude-3-5-sonnet model under the channel named anthropic, but will take the entire anthropic/claude-3-5-sonnet as the model name. This syntax can match the model named anthropic/claude-3-5-sonnet provided by other-provider. But it will not match the claude-3-5-sonnet model under anthropic.
      - openai-test/text-moderation-latest # When message moderation is enabled, the text-moderation-latest model under the channel named openai-test can be used for moderation.
      - sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo/* # Support using other API keys as channels
    preferences :
      SCHEDULING_ALGORITHM : fixed_priority # When SCHEDULING_ALGORITHM is fixed_priority, use fixed priority scheduling, always execute the channel of the first model with a request. Default is enabled, SCHEDULING_ALGORITHM default value is fixed_priority. SCHEDULING_ALGORITHM optional values are: fixed_priority, round_robin, weighted_round_robin, lottery, random.
      # When SCHEDULING_ALGORITHM is random, use random polling load balancing, randomly request the channel of the model with a request.
      # When SCHEDULING_ALGORITHM is round_robin, use polling load balancing, request the channel of the model used by the user in order.
      AUTO_RETRY : true # Whether to automatically retry, automatically retry the next provider, true for automatic retry, false for no automatic retry, default is true. Also supports setting a number, indicating the number of retries.
      rate_limit : 15/min # Supports rate limiting, each API Key can request up to 15 times per minute, optional. The default is 999999/min. Supports multiple frequency constraints: 15/min,10/day
      # rate_limit: # You can set different frequency limits for each model
      #   gemini-1.5-flash: 15/min,1500/day
      #   gemini-1.5-pro: 2/min,50/day
      #   default: 4/min # If the model does not set the frequency limit, use the frequency limit of default
      ENABLE_MODERATION : true # Whether to enable message moderation, true for enable, false for disable, default is false, when enabled, it will moderate the user's message, if inappropriate messages are found, an error message will be returned.

  # Channel-level weighted load balancing configuration example
  - api : sk-KjjI60Yd0JFWtxxxxxxxxxxxxxxwmRWpWpQRo
    model :
      - gcp1/* : 5 # The number after the colon is the weight, weight only supports positive integers.
      - gcp2/* : 3 # The size of the number represents the weight, the larger the number, the greater the probability of the request.
      - gcp3/* : 2 # In this example, there are a total of 10 weights for all channels, and 10 requests will have 5 requests for the gcp1/* model, 2 requests for the gcp2/* model, and 3 requests for the gcp3/* model.

    preferences :
      SCHEDULING_ALGORITHM : weighted_round_robin # Only when SCHEDULING_ALGORITHM is weighted_round_robin and the above channel has weights, it will request according to the weighted order. Use weighted polling load balancing, request the channel of the model with a request according to the weight order. When SCHEDULING_ALGORITHM is lottery, use lottery polling load balancing, request the channel of the model with a request according to the weight randomly. Channels without weights automatically fall back to round_robin polling load balancing.
      AUTO_RETRY : true

preferences : # Global configuration
  model_timeout : # Model timeout, in seconds, default 100 seconds, optional
    gpt-4o : 10 # Model gpt-4o timeout is 10 seconds, gpt-4o is the model name, when requesting models like gpt-4o-2024-08-06, the timeout is also 10 seconds
    claude-3-5-sonnet : 10 # Model claude-3-5-sonnet timeout is 10 seconds, when requesting models like claude-3-5-sonnet-20240620, the timeout is also 10 seconds
    default : 10 # Model does not have a timeout set, use the default timeout of 10 seconds, when requesting a model not in model_timeout, the default timeout is 10 seconds, if default is not set, uni-api will use the default timeout set by the environment variable TIMEOUT, the default timeout is 100 seconds
    o1-mini : 30 # Model o1-mini timeout is 30 seconds, when requesting models starting with o1-mini, the timeout is 30 seconds
    o1-preview : 100 # Model o1-preview timeout is 100 seconds, when requesting models starting with o1-preview, the timeout is 100 seconds
  cooldown_period : 300 # Channel cooldown time, in seconds, default 300 seconds, optional. When a model request fails, the channel will be automatically excluded and cooled down for a period of time, and will not request the channel again. After the cooldown time ends, the model will be automatically restored until the request fails again, and it will be cooled down again. When cooldown_period is set to 0, the cooling mechanism is not enabled.
  error_triggers : # Error triggers, when the message returned by the model contains any of the strings in the error_triggers, the channel will return an error. Optional
    - The bot's usage is covered by the developer
    - process this request due to overload or policy

Montez le fichier de configuration et démarrez le conteneur Docker Uni-API:

docker run --user root -p 8001:8000 --name uni-api -dit 
-v ./api.yaml:/home/api.yaml 
yym68686/uni-api:latest

Méthode deux: Démarrez Uni-API à l'aide de la variable d'environnement `CONFIG_URL`

Après avoir écrit le fichier de configuration en fonction de la méthode un, téléchargez-le sur le disque cloud, obtenez le lien direct du fichier, puis utilisez la variable d'environnement CONFIG_URL pour démarrer le conteneur Docker Uni-API:

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml 
yym68686/uni-api:latest

Variable d'environnement

Config_url: l'adresse de téléchargement du fichier de configuration, qui peut être un fichier local ou un fichier distant, facultatif
Timeout: Demandez le délai d'expiration, la valeur par défaut est de 100 secondes. Le délai d'expiration peut contrôler le temps nécessaire pour passer au canal suivant lorsqu'un canal ne répond pas. Facultatif
DISABLE_DATABASE: Que ce soit pour désactiver la base de données, la valeur par défaut est fausse, facultative

Déploiement à distance de Vercel

Après avoir cliqué sur le bouton de déploiement en un clic ci-dessus, définissez la variable d'environnement CONFIG_URL sur le lien direct du fichier de configuration, DISABLE_DATABASE sur true, puis cliquez sur Créer pour créer le projet. Après le déploiement, vous devez définir manuellement la durée maximale de la fonction sur 60 secondes dans le panneau du projet Vercel sous Paramètres -> Fonctions, puis cliquez sur le menu des déploiements et cliquez sur Redeploy pour redéployer, qui définira le délai d'expiration sur 60 secondes. Si vous ne redéposez pas, le délai d'expiration par défaut restera aux 10 secondes d'origine. Notez que vous ne devez pas supprimer le projet Vercel et le recréer; Au lieu de cela, cliquez sur Redéployer dans le menu Déploiements dans le projet Vercel actuellement déployé pour rendre la fonction de modification de la durée maximale.

Déploiement d'Ubuntu

Dans les versions de l'entrepôt, recherchez la dernière version du fichier binaire correspondant, par exemple, un fichier nommé uni-api-linux-x86_64-0.0.99.pex. Téléchargez le fichier binaire sur le serveur et exécutez-le:

wget https://github.com/yym68686/uni-api/releases/download/v0.0.99/uni-api-linux-x86_64-0.0.99.pex
chmod +x uni-api-linux-x86_64-0.0.99.pex
./uni-api-linux-x86_64-0.0.99.pex

Déplacement à distance Serv00 (FreeBSD 14.0)

Tout d'abord, connectez-vous au panneau, dans des services supplémentaires, cliquez sur l'onglet Exécuter vos propres applications pour activer l'option d'exécuter vos propres programmes, puis accédez à la réservation de port de panneau pour ouvrir au hasard un port.

Si vous n'avez pas votre propre nom de domaine, accédez aux sites Web du panneau WWW et supprimez le nom de domaine par défaut fourni. Créez ensuite un nouveau domaine avec le domaine étant celui que vous venez de supprimer. Après avoir cliqué sur les paramètres avancés, définissez le type de site Web sur le domaine proxy et le port proxy doit pointer vers le port que vous venez d'ouvrir. Ne sélectionnez pas utiliser HTTPS.

Connexion SSH au serveur Serv00, exécutez la commande suivante:

git clone --depth 1 -b main --quiet https://github.com/yym68686/uni-api.git
cd uni-api
python -m venv uni-api
tmux new -s uni-api
source uni-api/bin/activate
export CFLAGS= " -I/usr/local/include "
export CXXFLAGS= " -I/usr/local/include "
export CC=gcc
export CXX=g++
export MAX_CONCURRENCY=1
export CPUCOUNT=1
export MAKEFLAGS= " -j1 "
CMAKE_BUILD_PARALLEL_LEVEL=1 cpuset -l 0 pip install -vv -r requirements.txt
cpuset -l 0 pip install -r -vv requirements.txt

Ctrl + BD pour quitter TMUX, attendez quelques heures pour que l'installation se termine, et une fois l'installation terminée, exécutez la commande suivante:

tmux attach -t uni-api
source uni-api/bin/activate
export CONFIG_URL=http://file_url/api.yaml
export DISABLE_DATABASE=true
# Modify the port, xxx is the port, modify it yourself, corresponding to the port opened in the panel Port reservation
sed -i ' ' ' s/port=8000/port=xxx/ ' main.py
sed -i ' ' ' s/reload=True/reload=False/ ' main.py
python main.py

Utilisez Ctrl + BD pour quitter TMUX, permettant au programme d'exécuter en arrière-plan. À ce stade, vous pouvez utiliser Uni-API dans d'autres clients de chat. Curl Test Script:

curl -X POST https://xxx.serv00.net/v1/chat/completions 
-H ' Content-Type: application/json ' 
-H ' Authorization: Bearer sk-xxx ' 
-d ' {"model": "gpt-4o","messages": [{"role": "user","content": "Hello"}]} '

Document de référence:

https://docs.serv00.com/python/

https://linux.do/t/topic/201181

https://linux.do/t/topic/218738

Déploiement local de Docker

Démarrer le conteneur

docker run --user root -p 8001:8000 --name uni-api -dit 
-e CONFIG_URL=http://file_url/api.yaml  # If the local configuration file has already been mounted, there is no need to set CONFIG_URL
-v ./api.yaml:/home/api.yaml  # If CONFIG_URL is already set, there is no need to mount the configuration file
-v ./uniapi_db:/home/data  # If you do not want to save statistical data, there is no need to mount this folder
yym68686/uni-api:latest

Ou si vous souhaitez utiliser Docker Compose, voici un exemple docker-compose.yml:

 services :
  uni-api :
    container_name : uni-api
    image : yym68686/uni-api:latest
    environment :
      - CONFIG_URL=http://file_url/api.yaml # If a local configuration file is already mounted, there is no need to set CONFIG_URL
    ports :
      - 8001:8000
    volumes :
      - ./api.yaml:/home/api.yaml # If CONFIG_URL is already set, there is no need to mount the configuration file
      - ./uniapi_db:/home/data # If you do not want to save statistical data, there is no need to mount this folder

Config_url est l'URL du fichier de configuration distant qui peut être téléchargé automatiquement. Par exemple, si vous n'êtes pas à l'aise de modifier le fichier de configuration sur une certaine plate-forme, vous pouvez télécharger le fichier de configuration sur un service d'hébergement et fournir un lien direct vers Uni-API à télécharger, qui est le config_url. Si vous utilisez un fichier de configuration monté local, il n'est pas nécessaire de définir Config_url. Config_url est utilisé lorsqu'il n'est pas pratique de monter le fichier de configuration.

Exécutez le conteneur Docker Compose en arrière-plan

docker-compose pull
docker-compose up -d

Docker

docker build --no-cache -t uni-api:latest -f Dockerfile --platform linux/amd64 .
docker tag uni-api:latest yym68686/uni-api:latest
docker push yym68686/uni-api:latest

Image docker de redémarrage en un clic

 set -eu
docker pull yym68686/uni-api:latest
docker rm -f uni-api
docker run --user root -p 8001:8000 -dit --name uni-api 
-e CONFIG_URL=http://file_url/api.yaml 
-v ./api.yaml:/home/api.yaml 
-v ./uniapi_db:/home/data 
yym68686/uni-api:latest
docker logs -f uni-api

Test de boucle reposant

curl -X POST http://127.0.0.1:8000/v1/chat/completions 
-H " Content-Type: application/json " 
-H " Authorization: Bearer ${API} " 
-d ' {"model": "gpt-4o","messages": [{"role": "user", "content": "Hello"}],"stream": true} '

Emballage PEX Linux:

VERSION= $( cat VERSION )
pex -D . -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    --platform linux_x86_64-cp-3.10.12-cp310 
    --interpreter-constraint ' ==3.10.* ' 
    --no-strip-pex-env 
    -o uni-api-linux-x86_64- ${VERSION} .pex

Emballage macOS:

VERSION= $( cat VERSION )
pex -r requirements.txt 
    -c uvicorn 
    --inject-args ' main:app --host 0.0.0.0 --port 8000 ' 
    -o uni-api-macos-arm64- ${VERSION} .pex

Comment nous parrainer

Si vous souhaitez soutenir notre projet, vous pouvez nous parrainer de la manière suivante:

Paypal
USDT-TRC20, USDT-TRC20 Adresse du portefeuille: TLFbqSv5pDu5he43mVmK1dNx7yBMFeN7d8
Wechat
Alipay

Merci pour votre soutien!

FAQ

Pourquoi la demande d'erreur Error processing request or performing moral check: 404: No matching model found n'apparaît toujours?

Le réglage ACTIVE_MODERATION sur FALSE résoudra ce problème. Lorsque ACTIVE_MODERATION est vraie, l'API doit être capable d'utiliser le modèle de test de modulation de texte, et si vous n'avez pas fourni de modulation de texte-moderne dans les paramètres du modèle du fournisseur, une erreur se produira indiquant que le modèle ne peut pas être trouvé.

Comment hiérarchiser les demandes d'un canal spécifique, comment définir la priorité d'un canal?

Définissez directement l'ordre des canaux dans l'API_KEYS. Aucun autre paramètre n'est requis. Exemple de fichier de configuration:

 providers :
  - provider : ai1
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

  - provider : ai2
    base_url : https://xxx/v1/chat/completions
    api : sk-xxx

api_keys :
  - api : sk-1234
    model :
      - ai2/*
      - ai1/*

De cette façon, demandez d'abord AI2 et s'il échoue, demandez AI1.

Quel est le comportement derrière divers algorithmes de planification? Par exemple, FIXT_PRIORITY, PELETED_ROUND_ROBIN, LOTTERY, RANDE, ROUND_ROBIN?

Tous les algorithmes de planification doivent être activés en définissant API_KEYS. (API) .preferences.scheduling_algorithme dans le fichier de configuration à l'une des valeurs: fixe_priority, ponteted_round_robin, loterie, aléatoire, rond_robin.

FIXED_PRIORITY: Priorité de priorité fixe. Toutes les demandes sont toujours exécutées par le canal du modèle qui a d'abord une demande utilisateur. En cas d'erreur, il passera au canal suivant. Il s'agit de l'algorithme de planification par défaut.
pondéré_round_robin: Équilibrage de la charge de la robe ronde pondérée, demande des canaux avec le modèle demandé de l'utilisateur en fonction de la commande de poids définie dans le fichier de configuration api_keys. (API) .model.
Loterie: dessinez l'équilibrage de la charge du robe ronde, demandez au hasard le canal du modèle avec les demandes de l'utilisateur en fonction du poids défini dans le fichier de configuration api_keys. (API) .model.
Round_Robin: Équilibrage de la charge du Round-Robin, demande le canal propriétaire du modèle demandé par l'utilisateur en fonction de l'ordre de configuration dans le fichier de configuration api_keys. (API) .Model. Vous pouvez vérifier la question précédente sur la façon de définir la priorité des canaux.

Comment le base_url doit-il être rempli correctement?

À l'exception de certains canaux spéciaux illustrés dans la configuration avancée, tous les fournisseurs de formats OpenAI doivent remplir complètement la base_url, ce qui signifie que la base_url doit se terminer avec / v1 / chat / complétions. Si vous utilisez des modèles GitHub, le base_url doit être rempli comme https://models.inference.ai.azure.com/chat/completions, pas URL d'Azure.

Comment fonctionne le temps d'attente du modèle? Quelle est la priorité du paramètre de temporisation au niveau de la chaîne et du paramètre de temps d'expiration du modèle global?

Le paramètre de délai d'expiration au niveau du canal a une priorité plus élevée que le paramètre de temporisation du modèle global. L'ordre de priorité est: Paramètre de temporisation du modèle au niveau du canal> Paramètre de délai d'expiration par défaut au niveau de la chaîne> Paramètre de temporisation du modèle global> Paramètre de délai d'expiration par défaut mondial> Tempsion de la variable d'environnement.

En ajustant l'heure du délai d'expiration du modèle, vous pouvez éviter l'erreur de la synchronisation des canaux. Si vous rencontrez l'erreur {'error': '500', 'details': 'fetch_response_stream Read Response Timeout'} , veuillez essayer d'augmenter le temps de temps mort du modèle.

Comment fonctionne API_KEY_RATE_LIMIT? Comment définir la même limite de taux pour plusieurs modèles?

Si vous souhaitez définir la même limite de fréquence pour les quatre modèles Gemini-1.5-Pro-Latest, Gemini-1.5-Pro, Gemini-1.5-Pro-001, Gemini-1.5-Pro-002, vous pouvez le définir comme celui-ci:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min

Cela correspondra à tous les modèles contenant la chaîne Gemini-1.5-Pro. La limite de fréquence pour ces quatre modèles, Gemini-1.5-Pro-Latest, Gemini-1.5-Pro, Gemini-1.5-Pro-001, Gemini-1.5-Pro-002, sera tous réglé à 1000 / min. La logique pour configurer le champ API_KEY_RATE_LIMIT est la suivante, voici un exemple de fichier de configuration:

 api_key_rate_limit :
  gemini-1.5-pro : 1000/min
  gemini-1.5-pro-002 : 500/min

À l'heure actuelle, s'il y a une demande utilisant le modèle Gemini-1.5-Pro-002.

Premièrement, l'Uni-API tentera de faire correspondre avec précision le modèle dans l'API_KEY_RATE_LIMIT. Si la limite de taux pour Gemini-1.5-Pro-002 est fixée, la limite de taux pour Gemini-1.5-Pro-002 est de 500 / min. Si le modèle demandé à ce moment n'est pas Gemini-1.5-Pro-002, mais Gemini-1.5-Pro-Latest, puisque l'api_key_rate_limit n'a pas de limite de taux pour Gemini-1.5-Pro-Latest être réglé sur 1000 / min.

Histoire des étoiles

Développer

uni api

uni-API

Introduction

Caractéristiques

Méthode d'utilisation

Méthode 1: Montez le fichier de configuration `api.yaml` pour démarrer Uni-API

Méthode deux: Démarrez Uni-API à l'aide de la variable d'environnement `CONFIG_URL`

Variable d'environnement

Déploiement à distance de Vercel

Déploiement d'Ubuntu

Déplacement à distance Serv00 (FreeBSD 14.0)

Déploiement local de Docker

Sponsors

Comment nous parrainer

FAQ

Histoire des étoiles

evolution api

Europe Uni

Université de lanceur de sorts

Uni

Université brisée

Réservoir Uni

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

uni api

uni-API

Introduction

Caractéristiques

Méthode d'utilisation

Méthode 1: Montez le fichier de configuration api.yaml pour démarrer Uni-API

Méthode deux: Démarrez Uni-API à l'aide de la variable d'environnement CONFIG_URL

Variable d'environnement

Déploiement à distance de Vercel

Déploiement d'Ubuntu

Déplacement à distance Serv00 (FreeBSD 14.0)

Déploiement local de Docker

Sponsors

Comment nous parrainer

FAQ

Histoire des étoiles

Méthode 1: Montez le fichier de configuration `api.yaml` pour démarrer Uni-API

Méthode deux: Démarrez Uni-API à l'aide de la variable d'environnement `CONFIG_URL`