2017-01-09 新浪家居
想象这样的情景:你躺在床上,忽然想关掉头顶刺眼得令你无法直视的智能灯泡。于是你开始四处翻找手机、解锁、打开控制APP、寻找这盏灯的选项、点击按钮——好了,总算关掉了。发现了没?原本可能5秒走过去按个开关的事,硬生生的花去了你将近1分钟的时间。
上面的情景,并不是个例。从目前智能硬件的发展状况来看,大部分智能设备仍只是“伪智能”设备,仅通过Wi-Fi通信模块提供了基础的联网控制。在家庭设备的互联领域,目前的重点都仍在设备及硬件连接上——然而, 真正的智能化设备不仅仅是实现通信连接,更要在人与设备间的交互上不断进化。
语音=人机交互的未来?
回顾人机交互的发展历程,实际上是工程师对机器不断改造,以解放人的过程。最早期,键盘是唯一的输入设备,与你为伴的只有枯燥的指令与冰冷的字符界面;后来有了图形界面,才有了鼠标。但是鼠标和键盘都只是交互的介质,并不符合直觉。 真正好的交互,应该符合人的直觉,上手即可用。
装备了触摸屏的智能手机,让我们离这个目标更近了一步。灵敏的指尖,代替了键盘/鼠标这层中间介质,做到了所触即所得,身体得以进一步解放。然而,虽然在空间上,你的身体不再需要端坐在电脑前——但操控一部手机,仍然需要手指和眼睛的全程参与——人机交互理应有更好的未来。
语音交互,则为人机交互打开了新世界的大门。首先,感官占用更少了,手可以解放出来;其次,开口说话是我们先天具备的沟通技能,学习成本最小;最重要的是,声波天然可以摆脱设备位置的束缚自由传播,未来甚至可以做到 device-free,在任何地方发出指令,都可以进行交互。在信息输入的速度上,语音直接说出指令也比触控点选来的方便。
想象一下,你再也不用翻箱倒柜的找手机,然后从一排排密密麻麻的APP中翻找目标——你只需自然的说出来:“卧室的灯关了吧,太晃眼了”,它就会乖乖的熄灭掉,甚至下次再打开时,你会发现亮度变低不那么晃眼了。
人工智能帮助提升人机交互体验
要保证上面这种级别的语音交互,机器需要准确提炼出的重要讯息有“卧室、灯、关、晃眼”,并最终组合为2个单独的指令“卧室灯→关闭”“卧室灯→初始亮度75%这需要设备具备自然语言理解的能力(Natural Language Understanding,NLU),以正确地理解用户的语音指令。而谈到NLU技术,人工智能是无法避开的一个话题。
击败国际顶级棋手李世石的“AlphaGO”,可能最为人熟知的人工智能了。帮助它在围棋上击败对手的技术,和帮助机器理解人类语言的NLU,是基于同一种的、起源于上世纪50年代的技术——机器学习。作为人工智能的核心技术之一,机器学习的核心在于“学习”二字上。 通过模拟人类的学习过程,机器学习用一些特定的算法指导计算机利用已知数据得出适当的模型,并利用此模型对新的情境给出判断。这其中的关键,在于一种叫做“神经网络”的算法,它通过模仿人类神经元工作方式,让单一神经元处理接收到的信号,并基于信号特性,给出相应的反馈信息传递给关联的其他神经元,最终经过多层神经元的彼此筛选,得出针对信号的结论。
听起很复杂的过程,实际上因为模拟了人脑处理信号的方式,可以通过有限次数的训练,让程序自己学会对新信号的处理能力,即NLU(自然语言理解)。在神经网络算法,只要有足够数量的语音数据来训练,机器也可以准确的理解人类语言的意图,甚至是“言外之意”——问完天气的你随口抱怨一句“最近外面好冷”,它或许会调皮的提醒你,要不要规划一趟飞往热带的海岛之旅。
取代“伪智能”,语音交互让设备服务链接更紧密
NLU技术在美国市场的应用最为成熟,各巨头也纷纷推出其基于语音交互的智能设备,希望提前抢占市场。而这一市场,目前有着界限鲜明的两派:一边是以Apple、Microsoft为代表的语音辅助派,把自家的手机版助手直接移植到了Apple TV、XBOX设备上,语音仅作为辅助交互手段。而另一边是则更为激进的Google和Amazon,其推出的智能设备Google Home、Amazon Echo仅支持语音交互。技术方案各有不同,但四家巨头在商业上的战略野心惊人的相似:通过融入家庭生活,而成为家庭成员获取服务的新入口。
如果把目光转回国内,国内有此野心的厂商目前并不在少数,但市场反响平平。究其原因,智能音箱只是连接服务的一个可以实现语音交互的端口, 最重要的是通过不断叠加不同的服务,并提升使用体验,实现真正意义的智慧服务系统——设备+云服务,这才是智慧家庭产业的重要发展方向。
在2015年底的第二次世界互联网大会上,联想集团总裁杨元庆曾提出:“未来的用户需要的是设备+云服务的完美结合体验,为此我们就必须打造更加智能的连接”,并很快组建了Smart Home(联想智慧家庭)部门。
有消息表明,联想Smart Home的首个智能设备将于近期推出。其“设备+云服务”的概念将如何践行?设备的人机交互会采用Apple还是Amazon模式?如何更好的让NLU适应中国人的习惯?一切答案,恐怕只能等产品浮出水面才能揭晓了,让我们共同期待吧!