aura voice Download - تنزيل رمز مصدر aura voice

aura voice

شفرة المصدر الأخرى

1.0.0

تنزيل

قل مرحبا للهالة

Aura هو مساعد صوت ذكي محسن لاستجابات الكمون المنخفضة. يستخدم وظائف vercel Edge ، والتعرف على الكلام الهامس ، GPT-4O و Eleven Labs TTS.

عرض العرض التوضيحي · الإبلاغ عن خطأ · طلب ميزة

سمات

 ✅ A Siri-like voice assistant within your browser
✅ Optimized for low latency responses
✅ With the combined power of OpenAI, Whisper Speech Recognition and Eleven Labs

العرض التوضيحي

يمكنك اختبار الهالة هنا: https://voice.julianschoen.co

تحفيز

أصبح المساعدون الصوتيون جزءًا لا يتجزأ من حياتنا. هم في كل مكان. في هواتفنا ، في سياراتنا ، في منازلنا. لماذا لا على الويب أيضًا؟

حتى وقت قريب كانت المشكلة الرئيسية مع المساعدين الصوتيين على الويب هي الكمون. استغرق الأمر وقتًا طويلاً لإرسال الصوت إلى الخادم ، وإنشاء إكمال LLM وإرسال الكلام مرة أخرى. لقد جعلت التطورات الحديثة لـ Openai و Eleven Labs و Vercel من الممكن بناء مساعد صوتي سريع بما يكفي لاستخدامه على الويب.

أحب أن يصبح هذا الريبو مكانًا للأشخاص الذين يرغبون في بناء مساعد صوتي خاص بهم. لقد كنت أعمل في هذا المشروع لفترة من الوقت الآن وأنا متحمس حقًا لمشاركته معك.

أفكار حول الكمون وتجربة المستخدم

يعد زمن انتقال المساعد الصوتي هو العامل الأكثر أهمية لتجربة المستخدم الجيدة. يوجد حاليًا 3 عوامل رئيسية تساهم في الكمون:

الوقت الذي يستغرقه نسخ الصوت (عبر التعرف على خطاب الهمس)
الوقت الذي يستغرقه توليد الاستجابة (عبر GPT-4O Mini)
الوقت الذي يستغرقه دفق استجابة الكلام (عبر أحد عشر مختبرًا TTS)

بناءً على بعض الاختبارات التي أجريتها ، يستغرق توليد الكلام معظم الوقت. كلما طال توليف النص ، كلما طال أمده لتوليد الكلام. يعد زمن انتقال توليد الكلام هو الأكثر توسلاً.

قد تكون استراتيجية التخفيف المحتملة تقسيم الاستجابة إلى أجزاء متعددة وتدفقها واحدًا تلو الآخر. هذا من شأنه أن يسمح للمستخدم بالبدء في الاستماع إلى الاستجابة أثناء إنشاء بقية الاستجابة. لم أقم بتطبيق هذا بعد ، لكن هذا شيء أفكر فيه. إذا كان لديك أي أفكار حول كيفية تحسين الكمون ، فيرجى إبلاغي بذلك.

شيء آخر يجب وضعه في الاعتبار هو وقت الانتظار. بناءً على بعض الأبحاث ، يبدو أن وقت الانتظار المتصور أقصر إذا تم إعطاء المستخدم نوعًا من التعليقات أثناء الانتظار. لقد قمت بتنفيذ إشعار "تفكير" بسيط يتم عرضه بينما يقوم المساعد بمعالجة الاستجابة ، لكنني متأكد من أن هناك طرقًا أفضل لتحسين وقت الانتظار المتصور.

تثبيت

استنساخ الريبو

git clone https://github.com/ntegrals/aura-voice

احصل على مفتاح API من https://openai.com/ و https://elevenlabs.com/

انسخ ملف .env.example إلى .env.local وأضف مفاتيح API

OPENAI_API_KEY= " YOUR OPENAI API KEY "
OPENAI_BASE_URL=(Optional)
NEXT_PUBLIC_ELEVENLABS_API_KEY= " YOUR ELEVENLABS API KEY "
NEXT_PUBLIC_ELEVENLABS_VOICE_ID= " YOUR ELEVENLABS VOICE ID "

تثبيت التبعيات
```
npm install
```
تشغيل التطبيق
```
npm run dev
```
نشر إلى Vercel

اتصال

أهلاً! شكرا للتحقق من هذه المكتبة واستخدام هذه المكتبة. إذا كنت مهتمًا بمناقشة مشروعك ، أو تتطلب الإرشاد ، أو فكر في توظيفني ، أو أريد الدردشة - يسعدني التحدث.

يمكنك أن ترسل لي بريدًا إلكترونيًا للاتصال: [email protected] أو رسالة على Twitter: julianschoen

إذا كنت ترغب فقط في إعادة شيء ما ، فقد حصلت على حساب قهوة:

شكرا ويوم رائع

تنصل

مساعد الصوت ، هو تطبيق تجريبي ويتم توفيره "كما هو" دون أي ضمان ، صريح أو ضمني. باستخدام هذا البرنامج ، فإنك توافق على تحمل جميع المخاطر المرتبطة باستخدامه ، بما في ذلك على سبيل المثال لا الحصر فقدان البيانات أو فشل النظام أو أي مشكلات أخرى قد تنشأ.

لا يقبل المطورون والمساهمين في هذا المشروع أي مسؤولية أو مسؤولية عن أي خسائر أو أضرار أو عواقب أخرى قد تحدث نتيجة لاستخدام هذا البرنامج. أنت وحدك مسؤول عن أي قرارات والإجراءات المتخذة بناءً على المعلومات التي قدمها المساعد الصوتي.

يرجى ملاحظة أن استخدام نموذج لغة GPT-4 يمكن أن يكون مكلفًا بسبب استخدامه الرمزي. من خلال استخدام هذا المشروع ، فإنك تقر بأنك مسؤول عن مراقبة وإدارة استخدام الرمز المميز الخاص بك والتكاليف المرتبطة بها. يوصى بشدة بالتحقق من استخدام API Openai بانتظام وإعداد أي حدود أو تنبيهات ضرورية لمنع رسوم غير متوقعة.

من خلال استخدام مساعد الصوت ، فإنك توافق على تعويض المطورين والمساهمين وأي أطراف تابعة واضطرابها من أي وجميع المطالبات ، والأضرار ، والالتزامات ، والتكاليف ، والنفقات (بما في ذلك أتعاب المحاماة المعقولة) الناشئة عن استخدامك لهذا البرنامج أو انتهاكك لهذه المصطلحات.

رخصة

موزعة تحت رخصة معهد ماساتشوستس للتكنولوجيا. انظر LICENSE لمزيد من المعلومات.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-28
الحجم 597.08KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
GLM 4 Voice

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
GOOGLE VOICE واجهة SMS غير محدودة

2009-11-07

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل