“百度筷搜”概念产品成为今年百度世界大会的亮点,这款产品能够实现检测地沟油、水质酸碱度等交互功能。可以看出,百度正在向“非文字需求”应用场景方面做出更多的新尝试。
9月3日上午,百度董事长兼CEO李彦宏亮相2014年百度世界大会,在开幕演讲中李彦宏发表了他的核心观点,“移动时代消费者的行为在发生变化,未来五年使用语音和图像来表达需求的比例将超过50%”;同时李彦宏还宣布“百度筷搜”1.0版本问世,这款产品能够实现检测地沟油、水质酸碱度等交互功能,这算是在“非文字需求”应用场景方面的新尝试,成为本届大会的亮点。
关于搜索的未来趋势,李彦宏怎么看?以下是主题演讲的干货总结:
一、李彦宏表示,传统的搜索是以关键词搜索为主,而移动时代消费者的行为在发生变化,语音和图片搜索更加自然,门槛也更加低。
拿语音搜索来说,PC互联网时代实现起来比较麻烦,现在移动端可以轻易的解决,目前已有10%的搜索请求来自语音。同时,对于儿童以及不会打字的人来说,语音能够更好地解决他们的需求。
二、拍照也是门槛较低的一种搜索方式,目前图片搜索35.5%是生活需求,比如包、家居、工艺品搜索等,在李彦宏看来,这方面将会有巨大的商业价值。
三、发展心理学的研究表明,人类所获取的70%的外部信息来自视觉,因此人们的沟通以及交互极其依赖于图像。在李彦宏看来,移动互联网正不断推动语音、图像等需求表达,这样的用户行为变化也说明未来的科技将更加回归自然、贴近人性。
随着技术的进步,语音和图像识别度会更高,到时候“非文字搜索”的使用会更加的普遍,李彦宏也预言,未来五年使用语音和图像来表达需求的比例将超过50%。
而最新发布“百度筷搜”1.0版本引起了媒体关注,对于这样一款仅凭概念就火爆业界的产品,“百度筷搜”已经能够实现检测油质优劣、水质酸碱度等交互功能。从中可以看出,百度正在向成为“非文字需求”的更多典型应用场景而努力。
以下是李彦宏在2014百度世界上的主题演讲实录,经编辑
各位尊敬的来宾、企业家朋友们,大家上午好!欢迎来到2014百度世界。刚才主持人也讲了,百度世界是我们一年一度的技术创新大会,每年,我们都会利用这个时机,向大家展示在过去一年当中百度技术方面的创新成果。过去一年尤其特殊,因为我们每个人都能深切地感受到移动互联网这个大潮所带来的冲击和影响。
其实,移动不仅给互联网公司带来了巨大的影响和冲击,也给很多传统产业的从业者带来了巨大的影响和冲击。今天我们请到了2000多位嘉宾,我看到还有很多人站着。这些嘉宾当中,绝大多数都来自所谓的非互联网产业、或者说是传统产业,有娱乐业的、旅游业的、金融业的、教育业的、餐饮业的……各行各业。这说明大家都非常关心互联网、尤其是移动互联网给人们带来的影响到底是什么。今天我也想从这个话题开始与大家一起分享。
语音图像等非文字输入方式未来五年将超50%
移动时代消费者的行为在发生变化,我想这可能是每一个人都能感受到的。但是具体在发生什么样的变化,让我们来看一下。
这是我们熟悉的百度搜索:每一个人通过自己掌握的终端,以输入关键词的形式表达他的需求、并进入到这个搜索框,最后通过百度获得答案。这是有十几年历史的搜索引擎能够给大家带来的好处。
可是,移动互联网时代的到来给了用户新的可能性与新的机会。比如说,现在的搜索可以用语音操作。语音是一个更加自然的表达需求的方式。我们知道,文字的历史大约只有5000多年,语音的历史有多少年?至少有20万年。所以,它是一个更加自然、更加容易、更加低门槛的表达方式。在过去的PC互联网时代,人们不可能以这种方式向计算机和互联网表达需求,可是今天,这种可能性是存在的,不仅存在,我还可以告诉大家,现在进入百度的搜索请求中有10%是以语音的形式来表达的。
语音搜索已经变成很多人的习惯,很多人对于这种习惯的依赖度也是非常的高。我们看到,有一些人每天都会进行很多次的语音搜索。很多次是什么概念?使用语音搜索次数最多的人每天能达到多少次,50次?100次?我告诉大家,我们做了一个统计,一个人一天最多使用了500多次的语音进行搜索。而且我们发现,在每天使用400次以上语音搜索的人中,绝大多数都是儿童。这也印证了我之前讲到的:语音是一个更加自然、更加低门槛的表达方式。当一个儿童他还不会打字的时候,他可能已经可以用语音来表达他的需求了。
这是一个语音搜索的例子。“7年前姐姐的年龄是妹妹的4倍,7年以后姐妹俩的年龄之和是48岁,姐姐今年多少岁?”我们可以想像,这可能是一个小学二年级学生用语音输入的query。如果我们用文字表达的话,你输入这些字所需要的时间,可能比自己亲自算出答案还要长一些,或者干脆就不去输入了。但是当语音成为一种表达需求的可能时,你就可以很方便地用语言告诉百度,这是你想要的,我们也能提供答案。
除了语音之外,还有更为丰富的形式,就是图片。现在的百度也支持拍照搜索,也就是说,你可以用一个图片去找相似的图片。图片、或拍照搜索其实也是一种非常自然且低门槛的表达需求方式。可以说,当一个小孩在学会语言之前,他已经可以用眼睛来认知世界了。他们的这种认知和需求的表达,也可以通过现代的科技、通过移动互联网带来的技术创新来解决。所以,在百度可以支持拍照或图片搜索之后,我们也看到有很多人用这种方式向百度表达需求。
我们看了一下人们以图片搜索表达的需求,其中,需求表达最多的一个类型是与life style(生活方式)相关的。比如说,拍下一个包,就可以在网上看到哪里有卖这个包的;家具或者工艺品,有很多人拍这些东西去搜索,大家可以想象,这种搜索的商业价值是非常高的。这个类型的搜索占到拍照搜索的35.5%。
第二类占15.8%的搜索是什么呢?是Face recognition(人脸识别),就是通过人脸进行识别,自拍一个照片,输入后看我长的像哪个明星。或者在街上看到什么人,拍一下到网上看看有什么类似的图片。其实除了人脸识别之外,还有很多人拍人体的其他部位进行识别,这个我就不详细去讲了。
可能很多人都知道,在1943年,IBM一位非常传奇的CEO Tom Watson曾讲过一句经久不衰、被人们不断引用的话,他说:“I think there is a world market for maybe 5 computers.”( 我认为全球计算机的市场需求量大概是5台”)。而今天,每一个人手上的手机都是一台计算机。过去半个多世纪以来,文字、语音、图片等技术不断发展,这就让使用技术的门槛不断降低。比如说,无论是一个接受过大学教育的人,还是一个二年级的小学生,甚至婴儿,都可以用他的眼睛和视觉表达需求。这种创新在过去的一两年中在不断加速,所以,这是一个非常令人兴奋的时代,这是一个魔幻的时代。
现在,人们表达需求的方式有语音、文字、图片。那么展望一下,五年以后会是什么样子的呢?我认为,未来五年,使用语音和图片进行搜索的请求量会超过纯文字的请求量。这也是由于技术的进步。我们过去说一段语音,其中会有20%的字不能被计算机识别,那么整段话就被废掉了,所以,人们就不可能使用语音搜索表达需求。过去你拍一张照片,搜索出来的东西都是乱七八糟的,完全不是你想要的,那么你也不会再使用了。未来,随着技术的进步,以及计算机识别语音、图片的精度越来越高,我们就可以让人们用更加自然、更加低门槛、且更加方便的方式表达他们的需求。