智能音箱最核心的東西是什麼?
其實這個答案很明顯了,從它的名字上就能看出來,智能音箱最重要的肯定是智能。
也有的人說是音箱二字,其實能被成爲音箱的,音質都很重要。
就像如果去參加全國廚藝大賽,人們的聚焦的點肯定是做出來的美食好不好吃,而不用考慮做出來的東西到底能不能吃一樣。
如果不能吃的美食那還叫美食嗎?智能音箱也一樣,如果都不能成爲音箱,再高的智能又有什麼用。
智能音箱最終是靠聲音體現它自身的價值,如果唱個歌曲還帶着刺刺拉拉的電流聲,高音上不去,低音下不來,除了能製造噪音,別無用途。
之前林奇見過某互聯網公司在製造智能音箱之前做的一個問卷調查,裡面有一個問題是這樣的:
對於一款智能音箱,您最看重的項目依次點擊排序。然後下面給出來了幾個選項,內容豐富;支持控制的智能家居設備多;音質好;品牌有名;外觀好看;價格便宜;反應速度快;功能多。
林奇反覆了確認了一遍,沒有智能這個選項,林奇想破了腦袋也想不明白,爲什麼智能音箱的問卷調查沒有智能。
難道是他們認爲這個是智能音箱的標配,就像音質那樣嗎?那去掉的也應該是音質而不是智能好吧,每個公司的造出來的智能音箱裡面的智能可是天差地別。
所以林奇決定先編寫智能音箱的最核心的東西——智能模塊。
與所有的智能音箱一樣,林奇決定把智能模塊放到服務端。
如果智能音箱不聯網,它可以使用一些簡單的功能,比如可以定時,可以定鬧鐘什麼的。
但是如果涉及到交互就不行了,比如你問他一個簡單的問題後天的天氣是什麼,“他”(擬人化,有的時候“它”、“他”會混着用)就回答不上來。
智能音箱可以分爲智能和使用方面還有硬件三部分。
智能是所有的智能音箱賴以生存的土壤,硬件是他的載體,使用方面則是一些使用方面的定義等(比如喚醒詞,比如周圍的環境音干擾……)。
林奇在寫智能軟件後端的時候就要考慮到一些使用方面的問題,比如第二智慧科技的智能音箱是否需要喚醒詞。
現在所有的智能音箱都有一個喚醒詞,不論是4字5字還是6字的。
爲什麼會有“喚醒詞”這個奇怪的東西,喚醒詞是怎麼來的。
經過查詢資料,林奇瞭解到了喚醒詞的故事。
和智能音箱在對話的時候,就像你和一屋子的同事在說話,有問有答。
你對同事喊道“小明。”
小明聽到了就會擡頭看着你,表示在聽。
你接着問,“今天我們叫什麼外賣?”
小明打開手機翻看了一圈,“要不我們吃黃悶雞米飯。”
“我昨天剛吃過。”
小明……
人們和智能音箱的對話也類似,可以分爲五個步驟——喚醒、相應、輸入、理解、反饋。
第一個環節就是喚醒,智能音箱是實時的在那裡待命,就像一個警戒的“貓鼬”。
“小黑。”你叫了他的名字,他就會把耳朵豎起來聽你講話,否則你說其他什麼任何話語他都處於神遊的狀態,這是在假設現在的智能音箱都遵守隱私,不會實時監聽我們說話。
因爲這個是第一個環節,所以喚醒環節的體驗在整個語音交互的流程中起着至關重要的作用,它的體驗好壞將直接影響用戶對產品的“第一印象”。
林奇對此深有感觸,他買了很多的智能音箱,有的音箱他喊了好幾次纔有迴應,而其他的響應比率就比較高。
在長期測試下來,林奇更傾向於使用喚醒率高的那些智能音箱,而喚醒率低的慢慢就被林奇遺忘了。
其實上面的舉得那個例子也不是特別恰當,如果辦公室裡面就你和小明兩個人,你就不需要先叫小明的名字,然後在問出來問題,否則會顯得很彆扭。
辦公室明明就他一個人,你還在叫一遍名字,會顯得多餘。
智能音箱之所以一定要有喚醒詞,歸根到底還是因爲他不夠智能,如果他足夠智能的話,就能自己判斷是否是在和他對話,他就知道改如何響應了。
關於喚醒詞這個東西,市場上還有專門的研究人員對這個做了研究。
除了喚醒詞本身的含義外,他們還從多個方面入手研究。
比如“名字+名字”的疊詞式組合方式最受用戶喜歡,而“品牌+名字”的組合方式最不被用戶喜歡,還有“小+字”的名字最受用戶喜歡。
甚至還從聲調、聲母和韻母這幾個方面都做了調研研究。
研究了這麼多的喚醒詞,林奇發現扳手公司對此有自己“獨特的理解”,他們發佈的智能音箱,除了用語音喚醒之外,還能支持觸摸式和遙控器式的喚醒。
雖然這種方式是一種創新,但是林奇並不贊同這種“創新”,本來智能音箱就是一個語音交互,爲了讓人們省事。
可以想象,在家中你想換一個喚醒音箱的方法,然後就跑去音箱旁邊摸它一下,把他喚醒了,但是反正都要說話,還不如直接就叫它名字。
這也還好吧,多一種選擇,無非多一些設計多一些錢。
但是遙控器喚醒就有點……
語音交互的本質是爲了節省用戶時間,讓用戶感覺到舒服,這倒好,給配了一個遙控器。
遙控器是一個容易丟失的東西,比如空調遙控器,如果一整個秋天都沒有開,到冬天了,想起來開了,估計需要找很久。
就連電視的遙控器,天天用的,也會經常找不到。
感覺給智能音箱增加一個遙控器,有點畫蛇添足,徒增成本,沒有任何實際的優化。
關於喚醒詞,林奇心裡有一個大膽的想法,在他看來,第二智慧科技出的智能音箱,儘量應該去掉喚醒詞。
如果效果真的不太好,也要保留一個可以讓用戶自定義喚醒詞的功能。
林奇除了調研智能音箱的喚醒詞外,還對手機助手的喚醒詞做了調研。
說起來手機助手,不得不說水果公司的siri。
hei siri!就是水果手機語音助手的喚醒詞。
這個發音,林奇專門學習過,也不知道是發音不標準還是怎麼着,經常喚不醒,爲此林奇還想是不是英文識別的問題,找了半天也沒有找到在哪裡能更改這個喚醒詞。
等到有了國內版本的智能音箱,林奇發現喚醒詞都是中文的,喚醒率好像比siri高了一些。
“看來還是和軟件相關。”林奇最終得出了這麼一個結果。