Proyek ini adalah asisten suara bertenaga AI yang menggunakan berbagai model dan layanan AI untuk memberikan respons cerdas terhadap kueri pengguna. Ini mendukung input suara, transkripsi, teks-ke-ucapan, pemrosesan gambar, dan panggilan fungsi dengan komponen UI yang diberikan secara kondisional. Ini terinspirasi oleh tren perangkat AI baru -baru ini seperti pin AI Humane dan Rabbit R1.
git clone https://github.com/developersdigest/ai-devices.gitnpm install
# or
bun installUntuk menggunakan asisten suara bertenaga AI ini, Anda perlu memberikan kunci API yang diperlukan untuk model dan layanan AI yang dipilih.
Ganti 'API_KEY_GOES_HERE' dengan kunci API Anda yang sebenarnya untuk setiap layanan.
npm run dev
# or
bun dev Akses aplikasi di http://localhost:3000 atau melalui url yang disediakan.
Modifikasi app/config.tsx untuk menyesuaikan pengaturan dan konfigurasi untuk asisten suara bertenaga AI. Berikut gambaran opsi yang tersedia:
export const config = {
// Inference settings
inferenceModelProvider : 'groq' , // 'groq' or 'openai'
inferenceModel : 'llama3-8b-8192' , // Groq: 'llama3-70b-8192' or 'llama3-8b-8192'.. OpenAI: 'gpt-4-turbo etc
// BELOW OPTIONAL are some options for the app to use
// Whisper settings
whisperModelProvider : 'openai' , // 'groq' or 'openai'
whisperModel : 'whisper-1' , // Groq: 'whisper-large-v3' OpenAI: 'whisper-1'
// TTS settings
ttsModelProvider : 'openai' , // only openai supported for now...
ttsModel : 'tts-1' , // only openai supported for now...s
ttsvoice : 'alloy' , // only openai supported for now... [alloy, echo, fable, onyx, nova, and shimmer]
// OPTIONAL:Vision settings
visionModelProvider : 'google' , // 'openai' or 'fal.ai' or 'google'
visionModel : 'gemini-1.5-flash-latest' , // OpenAI: 'gpt-4o' or Fal.ai: 'llava-next' or Google: 'gemini-1.5-flash-latest'
// Function calling + conditionally rendered UI
functionCallingModelProvider : 'openai' , // 'openai' current only
functionCallingModel : 'gpt-3.5-turbo' , // OpenAI: 'gpt-3-5-turbo'
// UI settings
enableResponseTimes : false , // Display response times for each message
enableSettingsUIToggle : true , // Display the settings UI toggle
enableTextToSpeechUIToggle : true , // Display the text to speech UI toggle
enableInternetResultsUIToggle : true , // Display the internet results UI toggle
enableUsePhotUIToggle : true , // Display the use photo UI toggle
enabledRabbitMode : true , // Enable the rabbit mode UI toggle
enabledLudicrousMode : true , // Enable the ludicrous mode UI toggle
useAttributionComponent : true , // Use the attribution component to display the attribution of the AI models/services used
// Rate limiting settings
useRateLimiting : false , // Use Upstash rate limiting to limit the number of requests per user
// Tracing with Langchain
useLangSmith : true , // Use LangSmith by Langchain to trace the execution of the functions in the config.tsx set to true to use.
} ; Kontribusi dipersilakan! Jika Anda menemukan masalah atau memiliki saran untuk perbaikan, silakan buka masalah atau kirimkan permintaan tarik.
Saya pengembang di belakang Developers Digest. Jika Anda menganggap pekerjaan saya bermanfaat atau menikmati apa yang saya lakukan, pertimbangkan untuk mendukung saya. Berikut beberapa cara Anda dapat melakukannya: