wukong-robot 是一個簡單、靈活、優雅的中文語音對話機器人/智能音箱項目,目的是讓中國的Maker 和Haker 們也能快速打造個性化的智能音箱。 wukong-robot 還可能是第一個開源的腦機喚醒智能音箱。
截至2023 年3 月31 日,wukong-robot 的安裝設備數已超過13,000 台,喚醒次數累積超過了700,000 次。
特性
Demo
環境要求
安裝
升級
運行
配置
技能插件
API接口
捐贈
貢獻
引用
聯繫
感謝
FAQ
免責聲明
模塊化。功能插件、語音識別、語音合成、對話機器人都做到了高度模塊化,第三方插件單獨維護,方便繼承和開發自己的插件。
中文支持。集成百度、科大訊飛、阿里、騰訊、OpenAI Whisper、Apple、微軟Edge、VITS聲音克隆TTS 等多家中文語音識別和語音合成技術,且可以繼續擴展。
對話機器人支持。支持基於AnyQ 的本地對話機器人,並支持接入圖靈機器人、ChatGPT 等在線對話機器人。
全局監聽,離線喚醒。支持Porcupine 和snowboy 兩套離線語音指令喚醒引擎,並支持Muse 腦機喚醒以及行空板搖一搖喚醒等其他喚醒方式。
靈活可配置。支持定制機器人名字,支持選擇語音識別和合成的插件。
智能家居。支持和小愛音箱、Siri、mqtt、HomeAssistant 等智能家居協議聯動,支持語音控制智能家電。
後台配套支持。提供配套後台,可實現遠程操控、修改配置和日誌查看等功能。
開放API。可利用後端開放的API,實現更豐富的功能。
安裝簡單,支持更多平台。相比dingdang-robot ,捨棄了PocketSphinx 的離線喚醒方案,安裝變得更加簡單,代碼量更少,更易於維護並且能在Mac 以及更多Linux 系統中運行。
wukong-robot 的功能還在不斷更新迭代中,詳見更新說明。
wukong-robot 的工作模式:
wukong-robot 被喚醒後,用戶的語音指令先經過ASR 引擎進行ASR 識別成文本,然後對識別到的文本進行NLU 解析,再將解析結果進行技能匹配,交給適合處理該指令的技能插件去處理。插件處理完成後,得到的結果再交給TTS 引擎合成成語音,播放給用戶。
雖然一次交互可能包含多次網絡請求,不過帶來的好處是:每一個環節都可以被修改和定制。而且我認為,到了5G 時代,音箱的響應速度將不再成為體驗問題。可定制和個性化才是未來的主流,而屆時wukong-robot 將會是更好的選擇!
Demo視頻:
wukong-robot + ChatGPT 實現支持流式對話的智能音箱(一分半鐘)
粉絲向定製版,演示對話+音樂+開放API+智能家居(五分鐘)
使用腦機喚醒wukong-robot
Google AIY Voice Kit + wukong-robot
Siri 聯動wukong-robot + ChatGPT
小愛同學聯動wukong-robot
教程:基於樹莓派&wukong-robot&VITS的AI泠鳶開源智能音箱的初步實現(by @二維環狀無限深勢阱)
教程:實現一個虛擬管家:賈維斯(by @Echo)
後台管理端Demo
體驗地址:https://bot.hahack.com (體驗用戶名:wukong;體驗密碼:wukong@2019)
wukong-robot 只支持Python >= 3.7 且< 3.10 ,不支持Python 2.x 。
wukong-robot 支持運行在以下的設備和系統中:
Intel Chip Mac (不支持M1 芯片)
64bit Ubuntu(12.04 and 14.04)
全系列的樹莓派(Raspbian 系統)
Pine 64 with Debian Jessie 8.5(3.10.102)
Intel Edison with Ubilinux (Debian Wheezy 7.8)
裝有WSL(Windows Subsystem for Linux) 的Windows
見wukong-robot 安裝教程。
python3 wukong.py update
如果提示升級失敗,可以嘗試在wukong-robot 的根目錄手動執行以下命令,看看問題出在哪。
git pull pip3 install -r requirements.txt
python3 wukong.py
建議在tmux 或supervisor 中執行。
第一次啟動時將提示你是否要到用戶目錄下創建一個配置文件,輸入y即可。
然後通過喚醒詞“snowboy” 喚醒wukong-robot 進行交互(該喚醒詞可自定義)。
此外,wukong-robot 默認在運行期間還會啟動一個後台管理端,提供了遠程對話、查看修改配置、查看log 等能力。
默認地址:http://localhost:5001
默認賬戶名:wukong
默認密碼:wukong@2019
建議正式使用時修改用戶名和密碼,以免洩漏隱私。
參考配置文件的註釋進行配置即可。注意不建議直接修改default.yml 裡的內容,否則會給後續通過git pull更新帶來麻煩。你應該拷貝一份放到$HOME/.wukong/config.yml中,或者在運行的時候按照提示讓wukong-robot 為你完成這件事。
tips:不論使用哪個廠商的API,都建議註冊並填上自己註冊的應用信息,而不要用默認的配置。這是因為這些API都有使用頻率和並發數限制,過多人同時使用會影響服務質量。
官方插件列表
用戶貢獻插件
wukong-robot 的後台接口是開放Web API 的,可以使用Restful 方式調用,見後台API。
您的捐贈將鼓勵我繼續完善wukong-robot。
對於個人用戶,可以使用支付寶或者微信進行捐贈,單筆超過100 元的捐贈者,您的ID 將可以出現在wukong-robot 後台管理端的捐贈頁面中。
| 支付寶 | 微信支付 |
|---|---|
如果以上的圖裂了,可以下載圖片(支付寶| 微信)到本地進行掃描。
對於企業用戶,建議成為這個項目的backer,您將可以把一個帶鏈接的logo 放在wukong-robot 後台管理端的首頁、捐贈頁面以及Github 項目首頁中。
喜歡本項目請先打一顆星;
提bug 請到issue 頁面;
要貢獻代碼,歡迎fork 之後再提pull request;
插件請提交到wukong-contrib ;
如果使用本項目的代碼或插件,請引用本項目。
@misc{wukong-robot,
author = {潘伟洲},
title = {wukong-robot,一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目},
year = {2019},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {url{https://github.com/wzpan/wukong-robot}},
}wukong-robot 的主要開發者是潘偉洲。
QQ 頻道(推薦):
使用QQ 掃碼加入:
QQ 群:580447290(人數將滿,為控制人數,需付費20元入群。微信或支付寶支付後,申請入群時貼上轉賬單號即可。群收入的前一萬元已無償捐贈給壹基金等公益項目)。
| 支付寶 | 微信支付 |
|---|---|
如果以上的圖裂了,可以下載圖片(支付寶| 微信)到本地進行掃描。
悟空的前身是dingdang-robot 項目和jasper-client 項目。感謝Shubhro Saha, Charles Marsh and Jan Holthuis 在Jasper 項目上做出的優秀貢獻;
感謝三咲智子提供了備選的後台管理端Demo 體驗地址。
感謝aliciacai 貢獻的wukong-robot 圖標。
感謝所有為本項目、 wukong-contrib 項目以及dingdang-robot 項目做出過貢獻的人!
wukong-robot 只用作個人學習研究,如因使用wukong-robot 導致任何損失,本人概不負責。
本開源項目與騰訊叮噹助手及優必選悟空項目沒有任何關係。