Ce projet est un assistant vocal alimenté par AI utilisant divers modèles et services d'IA pour fournir des réponses intelligentes aux requêtes utilisateur. Il prend en charge l'entrée vocale, la transcription, le texte-vocation, le traitement d'image et les appels de fonction avec des composants d'interface utilisateur rendus conditionnellement. Cela a été inspiré par la tendance récente des dispositifs d'IA tels que la broche AI humaine et le lapin R1.
git clone https://github.com/developersdigest/ai-devices.gitnpm install
# or
bun installPour utiliser cet assistant vocal alimenté par AI, vous devez fournir les clés API nécessaires pour les modèles et services d'IA sélectionnés.
Remplacez 'API_KEY_GOES_HERE' par vos clés API réelles pour chaque service.
npm run dev
# or
bun dev Accédez à l'application sur http://localhost:3000 ou via l'URL fournie.
Modifiez app/config.tsx pour ajuster les paramètres et les configurations de l'assistant vocal alimenté par AI. Voici un aperçu des options disponibles:
export const config = {
// Inference settings
inferenceModelProvider : 'groq' , // 'groq' or 'openai'
inferenceModel : 'llama3-8b-8192' , // Groq: 'llama3-70b-8192' or 'llama3-8b-8192'.. OpenAI: 'gpt-4-turbo etc
// BELOW OPTIONAL are some options for the app to use
// Whisper settings
whisperModelProvider : 'openai' , // 'groq' or 'openai'
whisperModel : 'whisper-1' , // Groq: 'whisper-large-v3' OpenAI: 'whisper-1'
// TTS settings
ttsModelProvider : 'openai' , // only openai supported for now...
ttsModel : 'tts-1' , // only openai supported for now...s
ttsvoice : 'alloy' , // only openai supported for now... [alloy, echo, fable, onyx, nova, and shimmer]
// OPTIONAL:Vision settings
visionModelProvider : 'google' , // 'openai' or 'fal.ai' or 'google'
visionModel : 'gemini-1.5-flash-latest' , // OpenAI: 'gpt-4o' or Fal.ai: 'llava-next' or Google: 'gemini-1.5-flash-latest'
// Function calling + conditionally rendered UI
functionCallingModelProvider : 'openai' , // 'openai' current only
functionCallingModel : 'gpt-3.5-turbo' , // OpenAI: 'gpt-3-5-turbo'
// UI settings
enableResponseTimes : false , // Display response times for each message
enableSettingsUIToggle : true , // Display the settings UI toggle
enableTextToSpeechUIToggle : true , // Display the text to speech UI toggle
enableInternetResultsUIToggle : true , // Display the internet results UI toggle
enableUsePhotUIToggle : true , // Display the use photo UI toggle
enabledRabbitMode : true , // Enable the rabbit mode UI toggle
enabledLudicrousMode : true , // Enable the ludicrous mode UI toggle
useAttributionComponent : true , // Use the attribution component to display the attribution of the AI models/services used
// Rate limiting settings
useRateLimiting : false , // Use Upstash rate limiting to limit the number of requests per user
// Tracing with Langchain
useLangSmith : true , // Use LangSmith by Langchain to trace the execution of the functions in the config.tsx set to true to use.
} ; Les contributions sont les bienvenues! Si vous trouvez des problèmes ou avez des suggestions d'amélioration, veuillez ouvrir un problème ou soumettre une demande de traction.
Je suis le développeur derrière les développeurs Digest. Si vous trouvez mon travail utile ou profitez de ce que je fais, envisagez de me soutenir. Voici quelques façons de le faire: