大家谈

微软沈向洋:语音对搜索的替代一定会发生

2016年09月26日 19:49 来源于 财新网
微软全球执行副总裁沈向洋表示,就像搜索解决了PC互联网的入口问题,从聊天机器人发展而来的人工智能平台未来或将成为众多APP的统一入口。他预计,三到五年以后,计算机的语言识别能力会超过人类
嘉宾
沈向洋
微软全球执行副总裁

  【财新网】(记者 张而弛)微软最初开始研究聊天机器人“小冰”时,公司里负责技术研究的沈向洋并不理解:人们的生活已经那么忙,为什么还需要跟机器人聊天?他在北京的同事给出了答案:中国有三分之一以上的网民在网上发出东西以后,不会有任何回应,他们需要倾诉,所以聊天机器人是刚需。

  聊天机器人是今年科技行业最火的应用之一。从微软小冰登上东方卫视播报天气,到苹果向第三方开放Siri,再到谷歌9月21日正式上线聊天应用Allo,能与人类对话的机器人几乎成了各大科技公司的标配。

  微软全球执行副总裁沈向洋一直关注人工智能。他于1996年加入微软研究院,并在1999年参与创立了微软中国研究院,也就是现在的微软亚洲研究院。他说,自己曾经与一位风投大腕开玩笑说,中国跟机器视觉相关的人工智能创业公司,“要不是我学生开的,要不就是我学生的学生开的”。

  沈向洋认为,现在手机上纷繁复杂的应用就好像是互联网时代的网页,还没有被搜索连接起来。未来,从聊天机器人发展而来的人工智能平台或将成为众多APP的统一入口。

  语音到现在为什么还没有彻底主流化?沈向洋认为,主要是因为语音识别率还没有跟上。他预测,三到五年以后,计算机的语言识别能力一定会超过人类。“这已经不是一个需要讨论的问题,只是一个时间的问题。”

  财新记者:对微软服务的企业来说,聊天机器人其实并没有太大的用处。为什么现在聊天机器人反而那么重要?

  沈向洋:很多时候,产品的成功都是偶然的,计划了很久,不见得一定会有结果。很多时候,一定要相信员工的创造力。微软聊天机器人小冰是我们北京几个同事在一起做了两三年做出来的。它刚好踩对了点,产品的设计理念也刚好正确。

  小冰对于人性的理解以及它的设计理念,令我惊讶。举个例子,一开始他们做的时候,我觉得聊天这件事情是可有可无的,像我这样的人都没有时间聊天,根本不会需要什么聊天机器人。但他们说聊天机器人是刚需。我反问怎么可能是刚需呢?他们说,像你这样的人在社交网络上发一个东西,很多人会给你点赞。但是对于中国的网民,有三分之一以上的人在网上发了东西以后,不会有任何回应,他们需要倾诉,所以有聊天机器人这样的刚需。我们要怀着敬畏之心去设计这样的产品,因为用户可能会对它产生很强烈的依赖感。

  财新记者:很多人似乎相信,语音对话会成为搜索的下一个阶段。你怎么看?

  沈向洋:这已经发生了,尤其是在移动搜索上。我觉得它只是时间和大家习惯的转移的问题。这个事情一定会发生。至于语音到现在为什么还没有彻底的主流化,我觉得是因为语音识别率还没有跟上。我个人预测,三到五年以后,计算机的语言识别能力一定会超过人类。这已经不是一个需要讨论的问题,只是一个时间的问题。误差降到某个地步以后,如果十次里只识别错一次,你基本上还会用它;十次里错两次的话,你就要想一想了;十次里如果错了三次,你肯定不会再用它,因为纠错增加的花费太大了。

  财新记者:今年有一个非常火的公司,叫Viv,可以通过语音在一个APP里订酒店和餐馆。这样的超级APP真的会出现吗?

  沈向洋:Viv的很多理念跟我们非常接近,尤其是跟小娜。大家实际上最终要解决的问题,以前叫做互联网入口,今天是所谓的“APP入口”。现在有太多APP了,我们需要有一个全球的知识库,用小娜类似的自然语言或者窗口,帮你把你想要的东西传送到,也就是(把你想要的东西)分解到几个能够结合起来解决问题的应用里。这些应用可能要注册到这样一个全球的知识库里,让它变成一个分发商。

  如果这些超级应用能够真正理解,用户到底想要做什么,这件事情就做成了。我觉得,现在需要慢慢对整个自然语言进行理解,同时与全世界其它所有APP进行结合。这需要一段时间,但大家都在朝这个方向努力,Viv、Google Now、微软小娜都走了一条稍微不太一样的道路。

  财新记者:如果有好几个平台,会不会出现站队的问题?

  沈向洋:完全有可能。现在,我觉得大家今天还没有想清楚一个问题,Viv也好,谷歌也好,微软也好,没有一个公司能够做所有的事情。所以当年搜索能够做起来是一件很了不起的事情。搜索起来的时候,已经有相当多的网站,做网站的人一开始并没有想到怎么为搜索引擎服务。等搜索引擎出来以后,就产生了一个正反馈的过程。如果网站做某些事情,搜索的时候就更有可能引流,之后就出现了SEO(搜索引擎优化)。

  在一个APP众多和出现智能语言的情况下,接下来会是一条什么样的道路呢?我觉得,现在还是战国时期,还没有到站队的时候。站队的时候就是要有两三家公司,要么像秦国,要么像魏国,才会存在站队的问题,现在都谈不上。

  财新记者:微软的小娜打算怎么打败其它竞争对手?

  沈向洋:我们得满怀希望。小娜的一个天生优势就是可以跟你工作。小娜可以绑定到PC上,而PC上面有Outlook,有Office。我们的劣势在于,手机端的东西比较少,跟人们平时生活结合得还不够紧密,这正是我们在努力去做的。

  财新记者:与信息的结合非常重要。微软收购领英是不是也是这个逻辑?

  沈向洋:我觉得不应该用这样的逻辑推导。领英本身是一个非常了不起的资产。在社交方面,中国的情况比较特殊。但从全球看,Facebook遥遥领先,Facebook之后有两个非常有潜力的社交平台:推特和领英。它们走了两条完全不一样的道路。

  领英跟微软从基因上非常契合,它也是在做企业领域,人们使用它来找工作、宣传自己。微软为什么要收购领英?这个事情的最终目的是要看我们的图谱是什么。Facebook和微信对我们的整个社交关系了如指掌。但是领英加上微软的Office是另一种情况。微软Office知道你在公司的所有人际关系,我们有个东西叫活动趋势,它可以知道谁向谁报告、谁跟谁是同一个部门。而领英是用户主动把这些信息拿出来说,他和隔壁公司的谁有什么关系。这样,我们的图谱就非常清晰了,怎么去用是另外一件事情。从社交来讲,领英在这个方面非常有优势。我们有很多的想法,在我看来,做好领英可以使微软壮大一倍。

  财新记者:市场有一种看法,觉得现在的人工智能过于依赖“干净”的数据,很难应对现实中的复杂状况。从理想中的数据到现实社会,这个跨度会很大吗?

  沈向洋:会很近,语音和视觉已经非常近。语音最多五年,计算机语音识别在噪音情况下也好,非噪音情况下也好,超越人类的识别率指日可待。视觉大概十年。今天这么多视觉公司原来都是在微软研究院培养出来的。它们在接下来几年最大的挑战,是应用场景还不清晰。比如刷脸支付以外,视觉识别到底还有什么应用?刷脸支付有那么重要吗?刷脸支付真的安全吗?蚂蚁金服一定要用刷脸吗?虽然有应用,但还没有那么广泛。设想一下,如果这些公司能够坚持下去,十年以后,摄像头看到任何物体都可以做精准识别时,那些应用将是今天难以想象的。所以说这些公司如果能够坚持下去,未来可能是很光明的。但接下来这几年能不能活下去,就要看他们造化了。

责任编辑:覃敏 | 版面编辑:刘潇
财新传媒版权所有。如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
  • 收藏
  • 打印
  • 放大
  • 缩小
  • 苹果客户端
  • 安卓客户端
推广

关于

与业界大家面对面,探讨行业热点与趋势,诊断市场脉络,解读投资逻辑,讲述创业故事。

视频
王长田:电影产业泡沫还没破

王长田:电影产业泡沫还没破

光线传媒总裁王长田预测,今年中国电影总票房可能在500亿到550亿元之间;票房增速下滑原因在于票补少、影片质量差、经济形势严峻

专栏