谷歌AIY Voice Kit智能語音開發套件安裝和使用體驗 [農步祥]

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 安裝成品

要如何更深入瞭解人工智能科技?那麼谷歌AIY一定是值得考慮的項目,AIY的含義就是以DIY方式折騰AI。雖然絕大多數人會對樹莓派和紙盒子音箱沒什麼興趣,再加上語言的天然阻礙,但AIY的確是是谷歌人工智能三駕馬車的精簡化集合,AIY項目包括了語音套件[Voice Kit]、視覺套件[Vision Kit]和看起來最高科技的TPU單元[EDGE TPU],包含了智能語音、計算視覺和深度學習等人工智能的核心應用的開發硬件。

硬件分析

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件

語音套件[AIY Voice Kit]是AIY項目中最便宜也是上手簡單的一款,也是三款產品中對代碼編程基礎要求最低的套件,所以從它開始技術性瞭解智能語音是比較合適的。由於谷歌提供的助手和語音轉文字API已經比較成熟可靠,開發者主要是開發技能和插件等進行練手。當然Soomal並不是開發者網站,主要還是以把玩的角度來看待。而且作為專業學習用途缺乏通用性,AIY設備熱門程度也不是特別高,Google Play上官方AIY應用下載量也就一萬左右,當然玩AIY主要靠電腦,手機APP並不是必需品。

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - Voice Hat主板

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - MEMS數字麥克風

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 安裝在樹莓派主板上

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 按鍵

我們在中,對智能音箱硬件解析的例子就是這套語音套件,由於購買時間較早,我們手上這坨紙盒還是1.0版的,2.0版主要是改善了紙模的安裝和固定效果。住的注意的是官方網站的安裝說明書是針對更小的樹莓派Zero,這個用於樹莓派3的AIY套件其實是“非官方性能版”,軟件和系統是完全通用的,整套價格不到400元人民幣,貳包含樹莓派Zero的官方版反而要貴不少。除了耀眼的紙板,AIY的核心組件還有一個使用樹莓派2/3主板GPIO針腳的主控板,它控制著音頻IO以及物理開關、供電等功能。窄條的則是拾音板,有兩顆MEMS微型麥克風進行拾音,支持遠場拾音但效果不算特別好。整個組件最喜感的自然是頂部那顆超大物理按鍵,常混街機廳的80後和90後應該非常眼熟,瞬間把智能音箱拉回到上世紀90年代審美,按鍵自帶LED燈,可以作為夜燈照明使用。一個4歐阻抗3W功率的3英寸喇叭負責發聲。

安裝設置

DIY是AIY的一部分,按照英文說明書的步驟安裝也比較簡單,先安裝好按鍵,固定好樹莓派和電路板、揚聲器,然後裝入紙盒並接上連線即可。當然智能音箱光有硬件是無法工作的,還需要一個簡化的操作系統,那麼自然是樹莓派常用的Linux了。系統部分谷歌官方提供了包含源的代碼定製的Raspbian系統,Raspbian就是一種基於ARM處理器編譯的Debian Linux系統。系統安裝也和Volumio OS、Moode類似,不過在Github上谷歌的系統鏡像文件是.xz後綴,解壓縮後使用Win32diskimager寫入一張容量至少8GB的MicroSD卡就完成了系統的安裝。

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 使用內置操作系統上網和寫代碼

雖然有了硬件和操作系統,但智能音箱還離不開互聯網,這部分才是AIY的開始。音箱聯網的方式有兩種:1、打開紙盒,長按控制板上的按鍵5秒,使用手機的AIY應用進行藍牙配對,然後輸入無線接入的密碼即可實現聯網;2、直接接上鍵鼠和顯示器,音箱會自動啟動一個精簡的Xfce圖形桌面,通過設置嚮導設置無線網絡。由於是完整的Linux系統,因此這臺智能音箱同時也是一臺上網衝浪的迷你電腦,只是非常卡。當然也可以直接連網線在路由器管理界面上看IP。

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 測試聲音

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 調整音量

從這裡開始就需要用戶有一定的Linux使用經驗了,使用putty等ssh客戶端工具遠程登錄至音箱的命令行[默認用戶名/密碼為pi/raspberry]。首先來測試聲音是否正常工作,運行/home/pi/AIY-projects-python/checkpoints/check_audio.py,按照提示進行語音輸出和輸入功能的測試,確定正常後運行alsamixer命令調整音量。 用戶也可以通過系統桌面自帶的遊戲和影音功能進行聲音測試。在確保系統、聲音和麥克風正常後,就可以進入應用的配置。

初步使用體驗

當成功進入系統和聯網後,音箱也沒有任何預想的功能,所以我們還需要運行語音服務。用戶需要在谷歌的Cloud Platform上啟用項目並激活Google Assistant的API,如果需要自定義命令和應用開發,就需要申請收費的語音轉換服務[Cloud Speech-to-Text]了,雲服務為每個月60分鐘使用免費,額外時長為0.024美元/分鐘。這些部分需要在谷歌的網站上完成創建項目、創建API和註冊設備等操作,按照AIY網站提示操作即可,這裡就不再重複。

當所有準備完成後,用戶可以在ssh上運行/AIY-voice-kit-python/src/example/voice下的示例文件進行體驗了。運行assistant_grpc_demo.py可以通過按按鍵激活語音交互,使用“OK,Google”語音命令激活則運行assistant_library_with_button_demo.py,從現在開始就可以體驗紙盒的基礎語音功能了。

谷歌AIY Voice Kit智能语音开发套件安装和使用体验  [农步祥]

Google 谷歌 AIY Voice Kit智能語音開發套件 - 命令行日誌輸出

所謂“基礎功能”,就是不包含任何多媒體相關的內容,僅支持簡單的語音交互,如時間、天氣、日曆鬧鐘提醒和百科等,對於學習研究來說也基本足夠,在加入Google Home後也可以對智能家居設備進行控制,例如通過語音控制Shield TV、Chromecast等設備播放是沒有問題的。在手機Home應用中,AIY音箱自身被識別為一盞燈,可以使用語音和手機控制按鍵燈的明暗和開關。由於演示DEMO程序不具備任何多媒體相關功能[包括藍牙音箱]以及新聞資訊播報等,這裡就不再進行對比和詳細測試。

總結

由於樹莓派3B支持5G WiFi網絡,因此AIY的響應速度絕對是一個巨大優勢,相較於中低價位的國產智能音箱,2.4G的延遲甚至比繞地球半圈傳輸數據的谷歌助手雲服務還要慢,也解決了人口密集的城市小區裡2.4G和藍牙干擾導致的各種異常鬼叫的問題。整個後臺智能語音服務使用Python開發,因此各類插件功能都必須通過Python相關的設置和下載完成。

由於系統是樹莓派和帶圖形桌面的Linux系統,在可擴展性上也是相當強大豐富的,也可以安裝遊戲、多媒體播放器、VoIP軟件進行網絡通話等充實音箱服務端的功能,系統已經內置了LibreOffice、《我的世界》等辦公和娛樂應用,可以直接進行遊戲、打字和寫代碼等,但語音交互功能就要靠自己寫Python代碼擴展了。在音質方面,AIY套件的聲音動態和音量表現要遜於普通的智能音箱,但聲音風格正常,用來簡單聽聽音樂不是問題。

由於完全使用谷歌的智能語音雲服務,從純技術角度來說,谷歌的識別準確度、速度和糾正能力都能通過後臺日志進行分析,在英語世界的優勢還是巨大的,而且支持的語言種類也是最多的。當然,畢竟Google Home還是沒有中文功能還是很遺憾的。但AIY的本質還是DIY,既然有了硬件有了系統,自然也會有國內的智能語音開發入口跟進,如果有時間,我們也會對通過這個AIY紙盒音箱對中文的wukong-robot等智能語音開發平臺進行體驗。


分享到:


相關文章: