ai devices
1.0.0
このプロジェクトは、さまざまなAIモデルとサービスを利用して、ユーザークエリにインテリジェントな応答を提供するAI駆動の音声アシスタントです。音声入力、転写、テキストからスピーチ、画像処理、および条件付きでレンダリングされたUIコンポーネントを使用して呼び出しをサポートします。これは、人道的AIピンやラビットR1などのAIデバイスの最近の傾向に触発されました。
git clone https://github.com/developersdigest/ai-devices.gitnpm install
# or
bun installこのAI搭載の音声アシスタントを使用するには、選択したAIモデルとサービスに必要なAPIキーを提供する必要があります。
各サービスの実際のAPIキーに「API_KEY_GOES_HORE」を置き換えます。
npm run dev
# or
bun dev http://localhost:3000または提供されたURLからアプリケーションにアクセスします。
app/config.tsxを変更して、AIを搭載した音声アシスタントの設定と構成を調整します。利用可能なオプションの概要を次に示します。
export const config = {
// Inference settings
inferenceModelProvider : 'groq' , // 'groq' or 'openai'
inferenceModel : 'llama3-8b-8192' , // Groq: 'llama3-70b-8192' or 'llama3-8b-8192'.. OpenAI: 'gpt-4-turbo etc
// BELOW OPTIONAL are some options for the app to use
// Whisper settings
whisperModelProvider : 'openai' , // 'groq' or 'openai'
whisperModel : 'whisper-1' , // Groq: 'whisper-large-v3' OpenAI: 'whisper-1'
// TTS settings
ttsModelProvider : 'openai' , // only openai supported for now...
ttsModel : 'tts-1' , // only openai supported for now...s
ttsvoice : 'alloy' , // only openai supported for now... [alloy, echo, fable, onyx, nova, and shimmer]
// OPTIONAL:Vision settings
visionModelProvider : 'google' , // 'openai' or 'fal.ai' or 'google'
visionModel : 'gemini-1.5-flash-latest' , // OpenAI: 'gpt-4o' or Fal.ai: 'llava-next' or Google: 'gemini-1.5-flash-latest'
// Function calling + conditionally rendered UI
functionCallingModelProvider : 'openai' , // 'openai' current only
functionCallingModel : 'gpt-3.5-turbo' , // OpenAI: 'gpt-3-5-turbo'
// UI settings
enableResponseTimes : false , // Display response times for each message
enableSettingsUIToggle : true , // Display the settings UI toggle
enableTextToSpeechUIToggle : true , // Display the text to speech UI toggle
enableInternetResultsUIToggle : true , // Display the internet results UI toggle
enableUsePhotUIToggle : true , // Display the use photo UI toggle
enabledRabbitMode : true , // Enable the rabbit mode UI toggle
enabledLudicrousMode : true , // Enable the ludicrous mode UI toggle
useAttributionComponent : true , // Use the attribution component to display the attribution of the AI models/services used
// Rate limiting settings
useRateLimiting : false , // Use Upstash rate limiting to limit the number of requests per user
// Tracing with Langchain
useLangSmith : true , // Use LangSmith by Langchain to trace the execution of the functions in the config.tsx set to true to use.
} ; 貢献は大歓迎です!問題が見つかった場合、または改善のための提案がある場合は、問題を開くか、プルリクエストを送信してください。
私は開発者のダイジェストの背後にある開発者です。あなたが私の仕事を役立つと感じたり、私がしていることを楽しんだりしたら、私をサポートすることを検討してください。ここにあなたがそれを行うことができるいくつかの方法があります: