livewhisper.py produit la dictée de phrase par phrase par sensation au terminal. Utiliser le modèle Whisper d'Openai et la bibliothèque SoundDevice pour écouter le microphone. L'audio du micro est stocké s'il atteint un seuil de volume et de fréquence, puis lorsque le silence est détecté, il enregistre l'audio dans un fichier temporaire et l'envoie à chuchoter.
Dépendances: chuchotement, Numpy, Scipy, Sounddevice
Livewhisper peut quelque peu fonctionner comme une alternative à la reconnaissance de la parole. Bien que cela ait maintenant son propre soutien à Whisper, c'est donc à vous. ;)
J'ai également inclus assistant.py , qui utilisant Livewhisper comme base, est ma tentative de faire un simple assistant de commande vocale comme Siri, Alexa ou Jarvis.
Même dépendances que Livewhisper, ainsi que les demandes, Pyttsx3, Wikipedia, BS4. Besoin également: Espeak et Python3-Espeak.
L'assistant vocal peut être activé en disant que son nom, "ordinateur" par défaut, "Hé ordinateur" ou "OK Ordink" fonctionne également. Vous pouvez attendre que l'ordinateur réponde ensuite, ou demander immédiatement une action / question sans s'arrêter.
Caractéristiques disponibles: météo, date et heure, raconter des blagues et faire des recherches Wikipedia. Il peut également gérer d'autres demandes, comme les mathématiques de base ou les anciens anecdotes simples. Ce qui s'appuie sur les extraits instantanés de Google et ne fonctionne parfois pas.
Contrôlez des joueurs de médias Utilisation: Play, pause, suivant, précédent, arrêt, qu'est-ce qui joue? Les commandes des médias ont besoin d'une forme de bruit / annulation d'écho permis de fonctionner correctement. Voir cette page pour plus d'informations sur la façon d'activer cela dans Linux PulseAudio.
Vous pouvez fermer l'assistant via ctrl+c , ou en disant que c'est le nom et "se terminer".
Si vous aimez mes projets et que vous souhaitez m'aider à continuer à en faire plus, envisagez de faire un don sur ma page Ko-Fi! Merci!