OpenOpenAI Download - OpenOpenAI Quellcode herunterladen

OpenOpenAI

Anderer Quellcode

1.0.0

Herunterladen

Openopenai

Beispiel Verwendung

Status erstellen

Intro
Warum?
Stapel
Entwicklung
- Umgebungsvariablen
- Dienstleistungen
- E2E -Beispiele
  - Beispiel für benutzerdefinierte Funktion
  - Beispiel für das Abrufen von Tools
- Serverrouten
Todo
Lizenz

Intro

Dieses Projekt ist eine selbst gehostete Version der neuen staatlichen Assistenten-API von Openai. ?

Alle API-Routendefinitionen und -Typen sind zu 100% automatisch generiert aus OpenAIs offizieller OpenAPI-Spezifikation. Alles, was es braucht, um zwischen der offiziellen API und Ihrer benutzerdefinierten API zu wechseln, ist die Änderung der baseURL . ?

Dies bedeutet, dass alle API-Parameter, Antworten und Typen mit der offiziellen OpenAI-API drahtkompatibel sind, und die Tatsache, dass sie automatisch generiert sind, bedeutet, dass es relativ einfach ist, sie im Laufe der Zeit synchronisiert zu halten.

Hier ist ein Beispiel mit dem offiziellen Node.js openai -Paket:

 import OpenAI from 'openai'

// The only difference is the `baseURL` pointing to your custom API server 
const openai = new OpenAI ( {
  baseURL : 'http://localhost:3000'
} )

// Since the custom API is spec-compliant with OpenAI, you can use the sdk normally ?
const assistant = await openai . beta . assistants . create ( {
  model : 'gpt-4-1106-preview' ,
  instructions : 'You are a helpful assistant.'
} )

Python -Beispiel

Hier ist das gleiche Beispiel mit dem offiziellen Python openai -Paket:

 from openai import OpenAI

client = OpenAI (
    base_url : "http://localhost:3000"
)

# Now you can use the sdk normally!
# (only file and beta assistant resources are currently supported)
# You can even switch back and forth between the official and custom APIs!
assistant = client . beta . assistants . create (
    model = "gpt-4-1106-preview" ,
    description = "You are a helpful assistant."
)

Beachten Sie, dass dieses Projekt keine vollständige Erholung der gesamten OpenAI -API sein soll. Vielmehr konzentriert es sich nur auf die staatlichen Teile der neuen Assistenten -API . Die folgenden Ressourcentypen werden unterstützt:

Assistenten
Assistantfiles
Dateien
Nachrichten
Messagefiles
Themen
Läuft
Runsteps

Weitere Informationen zur Arbeit Assistenten finden Sie im offiziellen OpenAI -Assistentenhandbuch.

Warum?

In der Lage zu sein, Ihre eigenen, maßgefertigten OpenAI -Assistenten zu betreiben, die zu 100% kompatibel sind, werden alle möglichen nützlichen Möglichkeiten freigeschaltet:

Verwenden von OpenAI -Assistenten mit benutzerdefinierten Modellen (OSS FTW!)?
Voller anpassbarer Lappen über das eingebaute Abrufwerkzeug (Integrationen von Langchain und Llamaindex kommen in Kürze)
Verwenden eines benutzerdefinierten Code-Interpreter wie Open-Interpreter
Self-Hosting / On-Premise -Bereitstellungen von Assistenten
Vollständige Kontrolle über Assistenten Evals
Entwickeln und Testen von GPTs in vollständig sandkäfigen Umgebungen
SANDBOOD -Tests von benutzerdefinierten Aktionen vor dem Einsatz in den OpenAI "GPT Store"

Vor allem, wenn der OpenAI "GPT Store" mit den 100-m-wöchentlichen aktiven Benutzern von ChatGPT an Traktion gewinnt, wird die Möglichkeit, OpenAI-kompatible Assistenten zuverlässig auszuführen, zu debuggen und anzupassen, in Zukunft unglaublich wichtig sein.

Ich könnte mir sogar einen zukünftigen Assistentengeschäft vorstellen, der mit OpenAIs GPTs vollständig kompatibel ist, aber anstatt sich auf Openai als Gatekeeper zu verlassen, könnte er vollständig oder teilweise dezentralisiert werden. ?

Stapel

Postgres - Primärdatastore über Prisma (Schema -Datei)
Redis - Backing -Store für die async -Task -Warteschlange zum Verarbeiten von Thread -Läufen über bullmq
S3 - Geschäfte hochgeladene Dateien
- Jeder S3-kompatible Speicheranbieter wird unterstützt, wie z. B. CloudFlare R2
Hono - dient der Rest -API über @Hono/Zod -Openapi
- Wir verwenden standardmäßig den Adapter node.js, aber Hono unterstützt viele Umgebungen, darunter CF -Arbeiter, Vercel, Netlify, Deno, Bun, Lambda usw.
Dexter - Produktionslappen von Dexa
Typscript?

Entwicklung

Voraussetzungen:

Knoten> = 18
PNPM> = 8

DEPs installieren:

pnpm install

Generieren Sie die Prisma -Typen lokal:

pnpm generate

Umgebungsvariablen

cp .env.example .env

Postgres
- DATABASE_URL - Postgres -Verbindungszeichenfolge
- Auf macOS: brew install postgresql && brew services start postgresql
- Sie müssen npx prisma db push ausführen, um Ihre Datenbank gemäß unserem Prisma -Schema einzurichten
Openai
- OPENAI_API_KEY - OpenAI -API -Schlüssel zum Ausführen der zugrunde liegenden Chat -Comate -Anrufe
- Dies ist vorerst erforderlich, aber je nachdem, wie interessierte Menschen sind, wird es nicht schwierig sein, Unterstützung für lokale Modelle und andere Anbieter zu unterstützen
Redis
- Auf macOS: brew install redis && brew services start redis
- Wenn Sie eine lokale Redis -Instanz ausgeführt haben, sollten die Standard -Redis -Env -Vars funktionieren, ohne sie zu berühren
- REDIS_HOST - optional; Standardeinstellungen nach localhost
- REDIS_PORT - optional; Standardeinstellungen zu 6379
- REDIS_USERNAME - optional; default
- REDIS_PASSWORD - optional
S3 - erforderlich, um Dateianhänge zu verwenden
- Jeder S3-kompatible Anbieter wird unterstützt, wie z. B. CloudFlare R2
- Alterant können Sie einen lokalen S3 -Server wie Minio oder Lokalstack verwenden
  - Um Lokalstack auf macOS auszuführen: brew install localstack/tap/localstack-cli && localstack start -d
  - Um Minio macOS auszuführen: brew install minio/stable/minio && minio server /data
- Ich empfehle jedoch, CloudFlare R2 zu verwenden - es ist erstaunlich und sollte für die meisten Anwendungsfälle kostenlos sein!
- S3_BUCKET - Erforderlich
- S3_REGION - optional; standardmäßig auto
- S3_ENDPOINT - erforderlich; Beispiel: https://<id>.r2.cloudflarestorage.com
- ACCESS_KEY_ID - Erforderlich (CloudFlare R2 -Dokumente)
- SECRET_ACCESS_KEY - Erforderlich (CloudFlare R2 -Dokumente)

Dienstleistungen

Die App besteht aus zwei Diensten: einem erholsamen API -Server und einem Async -Taskläufer . Beide Dienste sind staatenlos und können horizontal skaliert werden.

Es gibt zwei Möglichkeiten, diese Dienste lokal auszuführen. Der schnellste Weg ist über tsx :

 # Start the REST API server in one shell
npx tsx src/server

# Start an async task queue runner in another shell
npx tsx src/runner

Alternativ können Sie zuerst die Quelle Ts in JS umsetzen, was für die Produktion vorgezogen wird:

pnpm build

# Start the REST API server in one shell
npx tsx dist/server

# Start an async task queue runner in another shell
npx tsx dist/runner

E2E -Beispiele

Beispiel für benutzerdefinierte Funktion

Dieses Beispiel enthält ein End-to-End-Assistant-Skript, das eine benutzerdefinierte Funktion get_weather verwendet.

Sie können es mit dem offiziellen OpenAI -Client für node.js mit der Standard -OpenAI -API ausführen, die unter https://api.openai.com/v1 gehostet wird.

npx tsx e2e

Um dieselbe Testsuite gegen Ihre lokale API durchzuführen, können Sie ausführen:

OPENAI_API_BASE_URL= ' http://127.0.0.1:3000 ' npx tsx e2e

Es ist ziemlich cool zu sehen, dass beide Testsuiten genau den gleichen Assistentencode mit dem offiziellen OpenAI -Node.js -Client ausführen - ohne merkliche Unterschiede zwischen den beiden Versionen. Huzzah! ?

Beispiel für das Abrufen von Tools

Dieses Beispiel enthält ein End-to-End-Assistant-Skript, das das integrierte retrieval Tool mit dieser readme.md Datei als Anhang verwendet.

Sie können es mit dem offiziellen OpenAI -Client für node.js mit der Standard -OpenAI -API ausführen, die unter https://api.openai.com/v1 gehostet wird.

npx tsx e2e/retrieval.ts

Um dieselbe Testsuite gegen Ihre lokale API durchzuführen, können Sie ausführen:

OPENAI_API_BASE_URL= ' http://127.0.0.1:3000 ' npx tsx e2e/retrieval.ts

Die Ausgabe wird sich aufgrund der Unterschiede in der integrierten Umsetzung von OpenAI und unserer implementierten Abruf-Implementierung von Naiven wahrscheinlich geringfügig unterscheiden.

Beachten Sie, dass die aktuelle retrieval nur Textdateien wie text/plain und Markdown unterstützt, da momentan keine Vorverarbeitung oder Konvertierungen durchgeführt werden. Wir verwenden derzeit auch eine sehr naive Abrufmethode, die immer die vollständigen Dateiinhalte zurückgibt, anstatt sie vorzubereiten und nur die semantisch relevanten Brocken zurückzugeben. Weitere Informationen finden Sie in dieser Ausgabe.

Serverrouten

 GET       /files
POST      /files
DELETE    /files/:file_id
GET       /files/:file_id
GET       /files/:file_id/content
GET       /assistants
POST      /assistants
GET       /assistants/:assistant_id
POST      /assistants/:assistant_id
DELETE    /assistants/:assistant_id
GET       /assistants/:assistant_id/files
GET       /assistants/:assistant_id/files
POST      /assistants/:assistant_id/files
DELETE    /assistants/:assistant_id/files/:file_id
GET       /assistants/:assistant_id/files/:file_id
POST      /threads
GET       /threads/:thread_id
POST      /threads/:thread_id
DELETE    /threads/:thread_id
GET       /threads/:thread_id/messages
POST      /threads/:thread_id/messages
GET       /threads/:thread_id/messages/:message_id
POST      /threads/:thread_id/messages/:message_id
GET       /threads/:thread_id/messages/:message_id/files
GET       /threads/:thread_id/messages/:message_id/files/:file_id
GET       /threads/:thread_id/runs
POST      /threads/runs
POST      /threads/:thread_id/runs
GET       /threads/:thread_id/runs/:run_id
POST      /threads/:thread_id/runs/:run_id
POST      /threads/:thread_id/runs/:run_id/submit_tool_outputs
POST      /threads/:thread_id/runs/:run_id/cancel
GET       /threads/:thread_id/runs/:run_id/steps
GET       /threads/:thread_id/runs/:run_id/steps/:step_id
GET       /openapi

Sie können die automatisch generierte OpenAPI-Spezifikation des Servers anzeigen, indem Sie den Server ausführen und dann http://127.0.0.1:3000/openapi besuchen

Todo

Status : Alle API-Routen wurden nebeneinander mit der offiziellen OpenAI-API getestet und arbeiten wie erwartet. Die einzigen fehlenden Funktionen im Moment sind die Unterstützung für das integrierte code_interpreter Tool (Ausgabe) und die Unterstützung für Nicht-Text-Dateien mit dem integrierten retrieval Tool (Ausgabe). Alle anderen Funktionen sollten vollständig unterstützt und mit der offiziellen API einkompatibel sein.

Todo :

Hosted Demo (Bringen Sie Ihren eigenen OpenAI -API -Schlüssel mit?)
Hosted Redis arbeiten
Handle Sperrefaden und Nachrichten verhalten
- Ich bin mir nicht sicher, wie dies genau funktioniert, aber laut dem OpenAI -Assistentenhandbuch werden Threads gesperrt, während die Läufe verarbeitet werden
integriertes code_interpreter Tool (Problem)
Unterstützen Sie Nicht-Text-Dateien mit integriertem retrieval -Tool (Ausgabe)
OpenAI verwendet Präfix -IDs für seine Ressourcen, was großartig wäre, außer dass es ein Schmerz ist, mit Prisma zu arbeiten (Problem).
Finden Sie heraus, warum die Lokalhost -Auflösung für #6 nicht funktioniert hat
Umgang mit Kontextüberläufen (vorerst Kürzung)

Lizenz

Wenn Sie dieses Projekt als nützlich empfanden, sollten Sie mich sponsern oder mir auf Twitter folgen

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-11
Größe 320.37KB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

OpenOpenAI

Openopenai

Intro

Warum?

Stapel

Entwicklung

Umgebungsvariablen

Dienstleistungen

E2E -Beispiele

Beispiel für benutzerdefinierte Funktion

Beispiel für das Abrufen von Tools

Serverrouten

Todo

Lizenz

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express