关注我们:

华为AI投资处女秀:从“看见听见”到“看懂听懂”

2019-10-12

来源:中国人工智能网

分享到:




923日消息,华为全资子公司哈勃科技投资有限公司(下称哈勃科技)已于近日完成了对语义理解企业深思考人工智能机器人科技有限公司(iDeepWise,下称深思考)的投资,认缴了深思考3.67%的注册资本。据泰伯网估算投资金额超过2000万元,目前华为是公司的第五大股东。

华为对外投资披露极少,此前多由内部部门完成且多为国外企业。在投资界统计的华为公开投资事件表中,自2006年以来华为仅有过14次较大规模的投资,且主要集中在物联网、芯片、云存储等关键技术领域。

这样的投资步伐在今年发生显著的转变。进入2019年以来,华为营收支柱发生变化:终端(含手机、系统)业务取代运营商(包括5G)业务成为营收贡献最大业务。同时华为成立投资子公司哈勃科技,被外界解读为华为开始利用投资完善其移动端生态的开端。

哈勃成立后,先后投资了两家半导体企业,如果说对半导体企业的投资尚在意料之中,那么对深思考的投资则成了华为在人工智能领域投资的处女秀

在深思考的案例介绍中,有一部分看起来与传统的计算机视觉业务极其类似。例如帮助医生自动、快速地识别可疑癌变细胞。这样的业务形态与目前主流计算机视觉形态类似,也与遥感影像的自动解译有异曲同工之妙。

那么究竟深思考的技术与计算机视觉(CV或者语音识别的区别是什么

泰伯网在国庆节前跟这家公司的创始人、来自中科院人工智能方向的博士,同时也是一名连续创业者的杨志明聊了聊,尝试更加深入地理解这家公司的技术、路线和观点。

一、人工智能皇冠上的最后一颗明珠

比尔盖茨曾说过:语言理解是人工智能皇冠上的明珠。业内人士也认为,自然语言处理(NLPNatural Language Processing)的进步将会推动人工智能整体进展。

NLP也是深思考的核心技术。究竟什么是NLP,它又是如何帮助人们解决问题的呢?

杨志明:

如果说计算机视觉和语音识别是解释看见听见问题,那么多模态语义理解是在它们的基础上解决看懂听懂的问题。

以医疗场景为例。传统宫颈癌筛查主要由病理医生通过显微镜肉眼观测,一个经验丰富的病理医生一天最多看100张细胞玻片。病理医生需要逐个细胞排查是否有癌变迹象,不仅效率较低,而且疲劳也容易引发判断准确率的下降。

结合计算机视觉技术,可以在短时间内通过影像识别的技术完成阴性细胞的排除和重点需要检查细胞的标记。只把需要进一步判断的细胞交给医生做进一步判断,既解放了医生的精力,也能保证在关键行为(即判断癌细胞)上,是凭借医生的经验来参与决策。

计算机视觉技术并不能解决全部问题。例如腺细胞异常通常呈现团伙作案特点,通常仅从单个细胞的影像学上难以判断。因此这时不仅要看到,还要看懂。结合语义理解技术,学习细胞之间及细胞与背景之间关系的形态特征,从而判断出异常。这仅靠传统的计算机视觉技术是无法实现的。

而我们的优势在于多模态语义理解,所谓多模态就是指可以同时理解文本、图像等多模态非结构化数据背后的语义。

语义理解还可以被用于多轮人机交互。这常常被用于智能客服的场景。但这个场景目前几乎所有NLP厂商都在关注。厮杀很激烈,也几乎已经成为一个红海。

作者按:人机交互可以简单地理解成人机对话,多轮能理解上下文对话是其中的一个难点。例如你对一个智能音响说:请播放周杰伦的歌。当你之后再说请换一首他唱的其它歌曲。如果是单纯的语音识别技术,仅仅靠语音指令的匹配,可能会切换为一首任意歌曲,但多轮对话技术则会基于对上下文的理解,切换至同一歌手的另一首歌。

因此,我们避开壁垒较低的场景,选择了医疗、家居、汽车和手机智能终端作为我们的四大落地场景。

二、AI价值在场景中爆发,而非实验室中

对于一些普世技术而言,例如一些云巨头企业,他们只做底层技术而不碰具体的应用场景,另一些企业则是更注重技术在场景中的落地。深思考作为一家人工智能普世技术的公司,对自己的定位是什么样的呢?

杨志明:

AI作为一种科技含量很高的技术,很多ai企业会陷入只关注科研和论文指标水平的误区中。这样的企业关注发了多少论文、在多少比赛中获得了奖项,但往往忽略了技术是否能面用户需求,真正地解决刚需问题。

我们因此做了一个最基础的判断:AI只有在应用场景中才能发挥最大的价值。

结合这个判断,我们结合实际业务中的经验,总结出了几个评判场景的维度。

第一,在上个技术时代就已经有痛点存在;也就是说已经有技术手段在试图解决问题,但由于技术本身受限没有我们这一代技术解决好。这可以确保我们发现的痛点不是我们人为制造出来的,而是它客观存在的。或者说是比较刚需的。

第二,用户基数要足够大。例如如果医院筛查量很小,一天只有几例。这样的场景也是没有必要的。但宫颈癌筛查一是工作量巨大,二是我国妇女宫颈癌筛查需求巨大。因此整体基数也很大。这样的场景下AI才是有意义的。

第三,就是这个任务人能做到,但是工作量太大容易产生疲劳。也就是AI是去帮助人提升效率,而不是取代人、代替人去做诊断。有点像领导和秘书的关系,材料在给领导之前秘书要过一遍,圈出几个重点之后再给领导看。但它不能替代领导做决策。

这也是我认为AI在未来相当长时间里落地的一个必然规律。它不取代医生、司机,而是一个助手的身份“划重点”

就这几个维度来衡量,我们认为应该围绕人和生活这一主线来挑选场景,在我们选择的四个场景中,用户基数足够大而且人和机器之间也会产生大量交互,在此基础上我们用AI能力帮助人们解放精力、提升效率。

三、深思考的独门绝技和突出价值

杨志明:

我们在多模态语义理解和人机对话领域,无论在权威AI赛事评测还是实际ToB场景下做验证性评测我们在与同行友商竞争中更胜一筹

深思考形成的公司文化就是在技术方面挖掘的更深,要有更“深思考”和深落地

四、有机会成长为独角兽,但跟商汤、旷世并非竞争对手

人工智能领域已经诞生了多家估值超过10亿美金的独角兽公司,其中包括商汤科技、旷世、依图、寒武纪等等。对于以NPL与多模态语义理解技术为核心的深思考来说,在成立4年时间里,已经规模化落地,估值不断升高,那么它有没有可能在未来一段时间内成长为独角兽呢?

杨志明:

我觉得语义理解领域中的企业完全有可能成长为独角兽。可以对比目前AI的语音识别和图像识别两个领域,这两个领域已经成长出独角兽了。

识别解决的是感知问题,而AI落地的下一步必定的是认知与理解。通过各种人工智能手段识别出的数据已经在人们眼前形成了一座数据矿山,剩下的问题就是怎么从这座矿山中去提炼出金子。这是语义理解要解决的问题

因此我们实质上与识别型公司不构成竞争,我们是基于感知识别积累的数据做理解。从这个角度来看,市场容量非常巨大。

五、创造商业价值,需要技术壁垒。

随着技术的普世性越来越高,很多技术都逐渐从供给侧转入场景侧。例如计算机刚开始出现时,IBM为很多著名企业提供IT支持,但当计算机技术逐渐发展成熟企业也就纷纷开始成立自己的IT部门。IT服务市场也因此逐渐萎缩。

AI技术是否也面临这样的未来?NLP与语义理解技术是否有一天将成为未来企业的标配而成为大企业中的一个部门,从而对提供专业NLP与语义理解服务的厂商造成冲击呢?

杨志明:

这里有两个角度。第一,客户也希望形成自己的NLP与语义理解能力时,具不具备这个实力?例如当支付宝构建出一个足够普世的支付能力时,银行也尝试去构建一个电子支付体系,但是并未超越支付宝。百度构建出一个搜索能力后,一些大企业希望构建自己的搜索引擎也失败了。所以第一点要看这家企业能否迅速构建壁垒和占领市场

第二,要看客户构建自己的解决方案时是否经济。当客户认为跟你合作的成本远远低于他自己去做的成本时,他就会选择跟你合作,而不是把你PK掉。

其实这个也是创业企业的魅力所在。创业企业就是要细分的领域、细分的场景里先切入,建立独特的壁垒。这个跟打仗一样,就相当于有了一块根据地,之后再去不断规模化地扩大。

VR硬件评估more+
智能硬件more+

投稿