從亞馬遜推出第一款帶屏智能音箱Echo show 以來,關(guān)于帶屏智能音箱的討論就沒有停止過,除了屏幕外,帶屏智能音箱與智能音箱還有區(qū)別嗎?它們之間相同的技術(shù)又是什么?帶塊屏幕的智能音箱真的有市場嗎 ?
據(jù)Strategy Analytics的最新研究顯示,2018Q4出貨量增長了95%,達到3850萬臺。這超過了2017年的總量,并使2018年的總量達到8620萬臺。
Strategy Analytics總監(jiān)大衛(wèi)沃特金斯評論說:“智能音箱和帶屏智能音箱在過去的假日季節(jié)再次成為最受歡迎的技術(shù)產(chǎn)品,我們估計全球有超過6000萬家庭擁有至少一臺設(shè)備?!?/span>
“谷歌的Home Hub,亞馬遜的Echo Show和百度的小度在家等帶屏智能音箱受到消費者的歡迎,他們被視聽結(jié)合的刺激所吸引”。
帶屏智能音箱在2018年第四季度占總出貨量需求的10%以上,預(yù)計到2019年它們將成為市場增長的重要推動力。
也就是說,帶屏音箱不僅有市場,還會成為2019年智能音箱新的增長點。
無屏的智能音箱讓大家的生活進入語音交互的場景,而帶屏智能音箱則是語音+視頻交互的又一次場景升級。
那么,除了屏幕以外,帶屏智能音箱與智能音箱還有沒有別的區(qū)別呢?它如何成為2019年新的增長點呢?要想回答這個問題,先來看看國外的帶屏智能音箱是怎么樣的。
國外帶屏智能音箱
Amazon Echo Show
2017年,亞馬遜推出Echo Show,這款智能音箱有一個7英寸觸控屏幕,下半部分是一個相當強大的揚聲器。所有這些都放在一起,用戶不僅能夠清晰地接聽視頻電話和觀看媒體,而且還能聽到清脆明快的音質(zhì)。
Echo Show依舊搭載了亞馬遜的Alexa語音助手,所以你可以給它幾乎任何你想要的命令。例如,播放歌曲,電視節(jié)目,設(shè)置計時器,在日歷上創(chuàng)建活動。
與亞馬遜最早發(fā)布的echo不同,echo show 最大的賣點自然是它的7英寸觸控屏,而且還配備了英特爾凌動處理器以及前置550萬像素攝像頭,可與其它的Echo Show用戶進行視頻通話。
值得一提的是,echo show 和去年推出的第二代echo show 使用的都是8麥克風(fēng)陣列,亞馬遜設(shè)備和服務(wù)副總裁大衛(wèi)·利姆普(David Limp)稱,這是所有Echo設(shè)備中最先進的麥克風(fēng)陣列,這意味著其可以實現(xiàn)更優(yōu)秀的噪聲屏蔽,更好地聽到用戶發(fā)出的指令。
Amazon Echo Spot
亞馬遜還推出了一個帶有小顯示屏的Echo Spot,它的屏幕只有2.5英寸(480×480像素),在屏幕的頂部有一個攝像機的空間,整個設(shè)備的頂部有三個按鈕,它們都與表面齊平,形成真正流線型的外觀。
這款智能音箱幾乎可以放在任何地方,比如,廚房的一個角落,床頭柜等。雖然這款智能音箱很小,但是它內(nèi)置亞馬遜自己的Alexa語音助手,所以用戶仍然可以用它進行視頻通話和觀看視頻。并且,它也可以做任何其他語音助手的事情。用戶可以設(shè)置一個計時器,詢問天氣,播放電影等等。
盡管這款智能音箱很小,但是,它采用的是環(huán)形4麥克風(fēng)陣列,因此,在語音喚醒方面并不遜色。
Google Home Hub
去年10月,谷歌召開硬件新品發(fā)布會,會上,谷歌發(fā)布了3款硬件產(chǎn)品,其中就包括了Google Home Hub。
Google Home Hub是谷歌推出的首款帶屏智能音箱,配備了7英寸LCD觸摸屏、遠場麥克風(fēng)、環(huán)境光傳感器以及15W揚聲器,支持藍牙5.0,并配發(fā)了綠、粉、白、深灰四種顏色。
Google Home Hub內(nèi)置谷歌語音助手,用戶可以通過它語音獲取日歷、通勤信息、提醒以及其他個人信息。用戶還可以在Google Home Hub上觀看YouTube、YouTube TV以及其他視頻服務(wù)。
不過,與其他帶屏智能音箱頗為不同的是,谷歌這款帶屏智能音箱并沒有內(nèi)置攝像頭,也不能進行視頻通話,這是谷歌對于隱私考慮的結(jié)果。
值得一提的是,這款帶屏智能音箱是一個控制中心,它有一個新的家庭控制儀表盤(Home View),可以讓用戶看到家中智能門鎖、攝像頭、恒溫器等的狀態(tài)。
Facebook Portal
也許是帶屏智能音箱刮的風(fēng)太大了,連聲稱自己不會成為一家硬件公司的Facebook也坐不住了,去年10月,推出了一款帶屏智能音箱Facebook Portal。
Facebook推出的整個硬件系列包括兩款產(chǎn)品,即199美元、10英寸的Portal和349美元、15.6英寸的Portal Plus。
Portal系列帶屏智能音箱內(nèi)置了亞馬遜的Alexa語音助手,環(huán)形4麥克風(fēng)陣列,除了大屏幕外,最大的賣點就是它的廣角攝像頭。
廣角攝像頭采用了人工智能技術(shù),可以識別身體形狀,從而實現(xiàn)自動對焦,始終讓用戶處于畫面之中,而無需調(diào)整設(shè)備角度,這個技術(shù)可以讓用戶在進行視頻聊天隨意走動,更加地方便。
關(guān)于Portal的另一個特點是,當用戶不在通話或觀看某種媒體時,Portal可以通過用戶的Facebook個人資料幻燈片顯示用戶最喜愛的照片和視頻。
JBL Link View
去年的CES展上,JBL聯(lián)合谷歌推出帶屏智能音箱Link View,JBL Link View配有一對10W揚聲器和一個8英寸觸摸屏。它還有一個500萬像素的前置攝像頭,帶有高清視頻錄制功能。內(nèi)置Google智能助手,而不是亞馬遜Alexa。
JBL Link View的一個特點就是配備了相當不錯的屏幕,但內(nèi)部沒有很多清晰度或清晰度,但是仍然可以使用它進行視頻通話,觀看視頻等。
然而,JBL Link View真正突出的地方在于它的揚聲器。JBL以制作高質(zhì)量的揚聲器和音響產(chǎn)品而聞名,因此,電影,音樂和其他媒體在這款智能音箱上會聽起來非常棒。
其實,看了一圈國外的帶屏智能音箱,目前,帶屏音箱最大的賣點就是可以視頻通話,觀看視頻,最多的使用場景還是在家庭,并沒有探索出更多的落地場景,也就是說,目前來看,和不帶屏的智能音箱并沒有本質(zhì)的差異。
如果用戶家里已經(jīng)有了智能音箱,那么,再次購買帶屏智能音箱的可能性就會很小,因此,在2019年,帶屏智能音箱需要做出更大的差異化,能讓用戶根據(jù)個人需求進行個性化定制,能擴展出更多的應(yīng)用場景。
在技術(shù)上看,不管是智能音箱還是帶屏智能音箱,最重要的技術(shù)之一都是麥克風(fēng)陣列。
麥克風(fēng)陣列
麥克風(fēng)陣列是一種功能與普通麥克風(fēng)類似的麥克風(fēng)設(shè)備,但它不是只有一個麥克風(fēng)來記錄聲音輸入,而是有多個麥克風(fēng)來記錄聲音。簡單來說,就是麥克風(fēng)的排列組合。
麥克風(fēng)陣列一般來說有線形、環(huán)形和球形之分,嚴謹?shù)膽?yīng)該說成一字、十字、雙L、平面、螺旋、球形等。
麥克風(fēng)陣列可以根據(jù)需要或希望記錄聲音輸出而設(shè)計成包含任意數(shù)量的麥克風(fēng),具體來說,可以有2個到上千個不等。
然而,由于成本限制,消費級麥克風(fēng)陣列的數(shù)量一般不超過8個,所以市面上最常見的就是6麥和4麥的陣型。
麥克風(fēng)陣列對智能音箱至關(guān)重要,它的作用主要是語音增強、聲源定位、去混響、單或多聲源定位等。
亞馬遜最早推出的智能音箱Echo就是環(huán)形6+1麥克風(fēng)陣列,而它推出的第二代Echo依舊延續(xù)了第一代麥克風(fēng)的設(shè)計,2017年推出的Echo show 則多加了兩個麥克,為8麥克陣列。從上述圖表可以看出,智能音箱大多都采用6麥克風(fēng)陣列,采用雙麥克陣列的較少。
使用雙麥克陣列最典型的智能音箱是Google Home,2016年,谷歌推出Google Home,與Amazon Echo相比,最大的區(qū)別就是麥克風(fēng)陣列,Amazon Echo采用的是環(huán)形6+1麥克風(fēng)陣列,而Google Home只采用了雙麥克陣列。
與多麥克風(fēng)相比,雙麥克風(fēng)有它的缺點,主要是聲源定位只能定位 180°內(nèi)的范圍,而環(huán)形麥克風(fēng)陣列(不管是 4Mic、6Mic 還是 8Mic)都可以做到 360°全角度范圍內(nèi)的定位。
與此同時,麥克風(fēng)越多越容易實現(xiàn)更好的降噪和語音增強效果,手機和藍牙耳機上的降噪功能可以使用雙麥克陣列,因為距離近,受噪聲干擾小。
但是,智能音箱的使用場景大多在家里,環(huán)境嘈雜,距離又遠,在定向聲源信息,抑制無關(guān)噪聲,保證真實環(huán)境的語音識別率方面,雙麥克與多麥克相比,效果肯定會大打折扣。
在國內(nèi),多麥克風(fēng)陣列也已經(jīng)是智能音箱行業(yè)的“標配”,市面上大熱的幾款智能音箱,都是多麥克陣列,例如,阿里天貓精靈X1、華為小藝小藝、小米小愛同學(xué)采用的都是環(huán)形6麥克陣列,這樣的麥克風(fēng)陣列可以更好地實現(xiàn)語音喚醒、聲源定位等功能。
要想更好的接收聲音,抑制噪聲,麥克風(fēng)陣列中的麥克風(fēng)匹配至關(guān)重要,需要考慮三個方面:方向性、靈敏度和相位。
方向性——麥克風(fēng)的方向性是指它可以從哪個方向接收聲音。麥克風(fēng)是用來接收來自特定方向的聲音的。有些麥克風(fēng)只能接收單向的聲音。還有一些麥克風(fēng)是用來接收來自四面八方的聲音,全方位的麥克風(fēng)。
在構(gòu)建陣列麥克風(fēng)時,所有麥克風(fēng)必須具有相同的方向性。一個麥克風(fēng)只能接收來自某個方向的聲音,而另一個麥克風(fēng)只能接收來自各個方向的聲音,這將導(dǎo)致災(zāi)難性的、不平衡的錄音。
除非有某種獨特的情況會出現(xiàn)這種情況,否則這在很大程度上是不可取的。因此,麥克風(fēng)陣列總是使用相同方向的麥克風(fēng)。
靈敏度——靈敏度是麥克風(fēng)陣列必須匹配的另一個方面。靈敏度是麥克風(fēng)在記錄信號時獲得的增益。在麥克風(fēng)陣列設(shè)備中,靈敏度必須非常匹配,否則一個麥克風(fēng)的聲音會比另一個大,從而產(chǎn)生不平衡的錄音。
相位——相位是麥克風(fēng)陣列必須匹配的最后一個重要方面。相位是麥克風(fēng)開始錄音的時間的參考度線,也就是說,它決定了陣列中所有麥克風(fēng)開始和停止錄音的時間。
如果麥克風(fēng)有完全不同的相位,它們將在不同的時間記錄信號。這將導(dǎo)致不同步的記錄,同樣,這在很大程度上是不可取的。
麥克風(fēng)最好能同時記錄信號,這樣信號之間就不會有延遲。就像靈敏度一樣,麥克風(fēng)之間的相位差必須有一個最大的允許公差。這種差異通常是±1.5度,確保信號記錄同時,可以統(tǒng)一記錄。
在萬物互聯(lián)的今天,麥克風(fēng)陣列技術(shù)已經(jīng)越來越多地被應(yīng)用到消費領(lǐng)域,隨著智能車載、智能家居、機器人、可穿戴設(shè)備等熱潮的興起,語音交互越來越被用戶所習(xí)慣,麥克風(fēng)陣列自然也成為其中非常重要的前端技術(shù)。
總體來說,機器人、智能家居行業(yè)尤其是智能音箱,采用的以多麥克居多,這是因為,雖然多麥克相較于雙麥克成本高,但是,在降噪和語音增強方面,自然是麥克數(shù)量越多效果越好。
結(jié)語
亞馬遜帶頭推出帶屏智能音箱,國外的谷歌、Facebook,國內(nèi)的BATJ等也紛紛迎頭趕上,推出自家的帶屏智能音箱,智能音箱大戰(zhàn)也由此進入了第二階段。
但是,需要注意的是,目前的帶屏智能音箱都大同小異,無非是屏幕的大小、麥克風(fēng)陣列的選擇、接入資源的多少等差異。
當下,帶屏智能音箱的主要場景還是家庭,希望在未來,帶屏智能音箱可以拓展更多的應(yīng)用場景,可以實現(xiàn)基于用戶需要的個性化定制。