罗永浩发布锤子M系列语音识别成为最大赢家_人工智能网-人工智能专业官方网站

罗永浩发布锤子M系列语音识别成为最大赢家

2016-10-19

来源：中国人工智能网

锤子手机

分享到：

10月18日晚，在各种被收购的猜忌声中，德艺双馨的艺术家罗永浩老师在上海梅赛德斯·奔驰中心举办了一场被期待了又期待的发布会。因为所有人都知道，论手机发布会，除了罗永浩，

10月18日晚，在各种被收购的猜忌声中，德艺双馨的艺术家罗永浩老师在上海梅赛德斯·奔驰中心举办了一场被期待了又期待的发布会。因为所有人都知道，论手机发布会，除了罗永浩，国内其他厂商都是XX。

新款手机Smartisan M系列以一种曾经被罗永浩鄙视的姿态出现在大众眼前：消失的三段式实体键，高光塑料后壳，圆形指纹识别home键，大容量电池，发光的type-C接口，以及友商都看傻的顶级硬件配置。那个桀骜不驯的老罗似乎变了，变得学会迎合市场了。开放购买后，锤子官网、天猫、京东、一号店等渠道全部一抢而空。

而在整场发布会众多亮点中，最让人瞩目的是罗永浩为语音输入法科大讯飞做了长达半小时的广告植入，将一场手机发布会活生生开成了语音识别的科普会。

在介绍M系列三大亮点之一的语音输入时，老罗用几段话进行现场演示，讯飞语音都以最快的速度进行着高准确率的文字转换，准确率达100%。这一惊艳表现赢得现场观众的阵阵欢呼（很奇怪，他们难道之前都不知道吗）。当晚，讯飞语音就被各大社交媒体刷了屏。

其实语音识别技术由来已久，最早的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统，它是第一个可以识别十个英文数字的语音识别系统。而大规模的语音识别研究始于上世纪70年代以后，并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后，语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。

随着应用场景的变化和技术的发展，特定人语音识别系统已经远远无法满足实际应用，多人语音识别的需求衍生出了人工神经网络（ANN）、双向长短时记忆神经网络（BLSTM）等基于人工智能的算法，新算法具有自适应性、并行性、鲁棒性、容错性和学习特性。

话说，苹果手机也有语音识别，不过因为众所周知的原因中文语音识别效果并不好。但在安卓手机阵营，凡是讯飞、百度、搜狗等输入法都具备这一功能，其效果也在伯仲之间。

据业内人士介绍，国内从事语音识别的团队多数从中科大、中科院以及清华大学等几个院校毕业，其基础实力相仿，在产品的易用性和语料的丰富度上略有差异。随着技术的成熟，语音识别正在不同行业大规模普及。

此前，阿里云已经在云栖大会上将直播的视频配上字幕，而字幕来源正是人工智能ET的语音识别。在更早时候的一项测试中，现场挑战世界速记大赛亚军得主，以0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军姜毅。

据阿里云研究团队表示，语音识别的优势在于可以忠实还原现场的语言语气并长时间高效工作，并根据演讲人的语境及时回到前文修改错别字。这一方案应用于浙江高级人民法院的庭审。