查找某某电话。”科大讯飞董秘徐景明对着一部手机发出指令,一张通讯名片迅疾跳了出来。按下短信图标,再说一句:“今天上午有记者到公司来参观,请做好准备。”不到一秒钟,18个字符加2个标点符号准确无误地显示在屏幕上。
“我想听刘德华的歌”、“查一下明天从合肥到北京的航班”、“明天上午10点提醒我参加一个重要会议”。徐景明不是在吩咐自己的员工,而是继续对手机下达了一连串的命令。
当iPhone4S用户还在对Siri中文版翘首以待,Android用户羡慕嫉妒恨的时候,兼具语音输入、对话和搜索的讯飞语点已在各大App应用商店上架两个多月。但这家总部位于中部省份安徽省的中文语音公司格外低调,用户对于其新产品的认知远不如股民对002230(股票代码)的追捧。
002230第一季度财报显示:公司实现营业总收入1.30亿元,同比增长51.77%;归属股东净利润达1986万元,同比增长 36.77%。其成长势头可与美国Nuance媲美——苹果iPhone 4S的虚拟个人助手Siri所用的语音识别引擎正是由在纳斯达克(微博)上市的Nuance开发。
13年前就坚信“语音将成为未来基本需求点”的刘庆峰,如今终于如愿以偿。那一年,在读博士刘庆峰,东奔西走借钱维持中国科大的语音实验室;那一年,刘庆峰最后决定,放弃出国机会,开始创业。目前,科大讯飞的语音云开发合作伙伴已有4000多家,终端用户数已达5000 万,每天在线用户数超120 万,总请求量超过700 万次,讯飞语音输入法更是占据了移动终端70%的市场。在每年的新员工培训会上,身为科大讯飞董事长的刘庆峰都会告诉年轻人:“你所清晰预见的,热烈渴望的,真诚追求的,最后都将自然而然的实现。”
语音生活必需品
2010年,上海世博会,除了志愿者外,出现了一群吉祥物海宝机器人,它们操着一口标准的外语与来宾交流世博会的情况,逗得外国人捧腹大笑;2011年,在广州车展上,一款语音云驾驶ivoka产品引来与会者围观,无需手动,声音便可实现导航、发短信、打电话;2012年年初,长虹推出首款语音智能电视,人可以通过语音直接操作电视。今年3月,科大讯飞又推出手机App“讯飞语点”。
“这些技术都是我们提供的。”科大讯飞移动互联终端产品部总经理葛勇告诉《环球企业家》。随着苹果Siri的发布,市场掀起一阵语音热潮,而在语音领域已坚守13年的科大讯飞也逐渐声名鹊起。
尽管刚刚推出的“讯飞语点”与Siri具有很多相似功能,但刘庆峰告诉《环球企业家》:“我们与Siri有根本的不同。Siri更多地强调趣味性,对于手机厂商来说,增加了产品销量,但消费者不可能天天“调戏”一部手机,所以科大讯飞追求的是实用性,然后兼顾一些娱乐功能。
如果说乔布斯在做一件艺术品,那么刘庆峰则希望创造生活必需品。刘将这种理念也贯彻到对产品的开发 上。
葛勇带领团队从2010年开始酝酿讯飞语点,期间近100人参与到产品的设计、研发和测试当中。刘庆峰也常常关注最新进展。“刘庆峰对技术很挑剔,一点点瑕疵都逃不过他的眼睛和耳朵,为此争吵甚至拍桌子是家常便饭。”葛回忆说,当一个版本出来时,拿给刘庆峰测试,不用任何工具,仅凭耳朵,听完之后,刘庆峰就质问开发团队,一段语音怎么会出现两个人的声音?“这种效果连我都听不出来,更何况普通用户。但是没办法,刘总是一个追求完美的人,我们不得不一遍又一遍的修改。”葛勇笑称,想糊弄刘庆峰,没门儿。
“语点”此名,意为语音点亮生活。而对于生活的理解,刘庆峰不仅注重用户的体验,并且关注用户的使用习惯。因此在多功能的讯飞语点推出之前,科大讯飞在2010年率先发布了讯飞语音输入法。
当时,用户还是通过键盘和触摸屏输入,但局限于手机屏幕小,传统输入非常麻烦。所以刘庆峰决定先解决这一问题,讯飞语音输入法虽然没有放弃键盘和手写,但在手写上做了改进,实现了叠写和连写,不用等待一个字生成文本后再输入下一个字,大大提高了输入效率。而语音输入更是实现了在3G网络下1秒钟完成,2G网络下2秒完成。
讯飞语音输入法和讯飞语点正在改变着手机用户的使用习惯,而科大讯飞则早已在各个领域百花齐放。2012年,国家语委将彻底取消普通话考试的人工评测,未来考试者面对的将是科大讯飞的一部部机器,而打分者也是它们;微博控们再也不用一个字一个字地敲,用嘴便可“说”出微博;打开大众点评网(微博),只要说出自己的需求,页面便会自动搜索;深圳的大型玩具厂商已经开发出第一个声控飞机、第一个能挺会说的玩具机器人、第一个能听会说的儿童玩具手机。
从实验室到市场
比尔·盖茨在卸任微软(微博)董事长后进行了一场巡回演讲,当有人问 “您对未来IT最看好什么?”时,这位IT巨擘列举的第一项技术就是语音。而在此之前,他已多次公开宣称,未来键盘、触摸、鼠标等外部电脑操作设备将彻底让位于语音。
事实上,IT巨头在上个世纪末已开始布局语音产业,包括中文市场。IBM(微博)、Motorola、Intel等相继在中国成立实验室,但当时谁都难言语音产业化。
国内的语音技术虽然也在社科院和几大高校的实验室里酝酿了十多年,但依然达不到商用标准。1999年,来自中国科技大学语音实验室的几位创业者成立了科大讯飞,刘庆峰被推上管理者的位置。几个年轻人准备大干一场,要让电脑“能听会说”,要将语音技术产业化,而这也是刘庆峰创办公司前给导师王仁华提的条件之一。在计算机还未普及的时代,这样的想法似乎有点异想天 开。
刘庆峰大学的专业是电子学,大二时被老师王仁华选拔到语音实验室。刘逐渐展露出其在语音技术方面的天赋。实验室曾经使用一个日本的LMA语音分析工具,王仁华认为效率太低,就问刘庆峰能否提高二三倍。当时还是学生的刘庆峰花了一个月的时间,最终将效率提高了整整10倍。
但以技术见长的刘庆峰在创业初期却遭受了“技术”的重创。在技术性攻势的路线图指导下,他们下了很大的功夫,开发出一款电脑桌面软件,试图把手写输入的随意性、键盘输入的准确性和语音输入的高效性完美地结合起来,当时号称“只要能说话就能使用电脑”。这款产品确实让人眼前一亮,刘庆峰拿去参加很多展会都非常受追捧。但随后的市场效果让他们大跌眼镜。刘庆峰回忆,顾客来看产品时满意度100%,我们在场使用时满意度70%,用户自己操作时满意度降至30%。
在产业化的道路上,刘庆峰栽了一个跟头。当公司账上只剩下20万元时,他们决定放弃B2C。技术不是问题,科大讯飞的背后是中科大语音实验室和863项目组,刘庆峰等几个创业者也从来没有怀疑过自己的专业能力。因此,惨遭失败后的科大讯飞只是需要新的商业模式,这次他们转向B2B,准备只做核心技术提供商,让有渠道、有市场、有技术的大公司去直接面对消费者。刘庆峰找到了华为、中兴,找到了联想。
“当时我们准备像英特尔(微博)一样,做iFly Inside。”刘庆峰告诉《环球企业家》。科大讯飞只负责开发引擎、语音合成和语音识别芯片,而应用集成则由下游的开发商或客户自己完成。这一模式也就意味着越来越多的市场主体进入语音的产业链当中。
科大讯飞的B2B成为中国语音技术产业化的真正起点。1999年底到2000年初,总工程师陈涛带领同事在公司住了一个多月,没日没夜对系统修改测试再修改,最终成功通过了华为的测试。这次突围被刘庆峰认为是科大讯飞发展的第一个重大节点。到2000年年底,科大讯飞拥有了50位稳定的客户,也凭此拿到了关键性的风险投资。
此后,科大讯飞进入了快车道。2001年迎来联想投资;2004年公司开始盈利;2006年之后,其语音合成技术和语音识别技术陆续在多个国际专业大赛上获得第一;2008年,科大讯飞登陆中小板。充裕的资金加上技术的突破,科大讯飞加足马力在电信、银行、国家安全等领域拓展疆土。如今其语音云开发伙伴已达4000多家,用户量突破5000多万。而产品在中文语音市场总份额已达到70%,在专业领域的应用更是达80%。2011年,公司实现净利润1.3亿元。
做产业链主导者
语音是一门集合数字信号处理、人工智能、心理学、计算机软硬件工程、概率统计学和自然语言处理的交叉学科,国际和国内的研发者已经苦战近40年,至今依然没有像触摸屏一样得到大范围普及。高门槛让很多创业者望而却步,尤其汉语的复杂性,使得国际IT巨头也只能望此兴叹。语音产业的高壁垒为科大讯飞留下了足够的空间实现产业化,甚至主导整个产业格局的走 向。
今年3月22日,科大讯飞新一代语音云的发布现场人山人海。徐景明称,我们只邀请了500多为开发伙伴,预留了1000个座位,但没想到最终来了2300多人,临时借光了会议中心的椅子还是不够用。
随着Siri的出现,市场掀起新一轮语音热。草根创业者也跃跃欲试,刘庆峰要抓住这次机遇,拓展语音产业格局。而移动互联网的普及和云计算的成熟也让刘庆峰的设想成为可能。
“这相当于iFly Inside的移动互联网版本。”刘庆峰说。之前以芯片等技术做应用系统的模式成本很高,客户设计、研发、测试、运行的平台价格奇高,产品交给运营商后,运营商也无法预测用户规模,以致造成服务器资源的浪费或超负荷。如此以来,把很多创业者挡在创新门槛之外。而科大讯飞推出的语音云平台解决了这一问题,开发者既可以在开发阶段免费使用语音云平台进行研发和测试,也可以零成本地将自己的应用产品连接到语音云平台。
这对于科大讯飞来说,无需自己开发应用产品即可拥有庞大用户群;而对于开发者来说则大大降低了进入门槛。刘庆峰称,之前将近十年开发商只有2000多家,语音云推出后,包括草根创业者增加了4000多个。
在产业格局上,语音云的推出意味着语音应用产品不再被华为、中兴这样的大型公司独享,越来越多的草根创业者成为语音产业新军。一位来自内地中小城市的参会者经营着一家类似大众点评网的城市型生活网站,在看完科大讯飞的演示后告诉记者:“语音应用比想象的要好,准备找一家开发商来尝试一下。”
“我们是产业链的主导者。”刘说。在他的设想里,未来衣食住行各个领域都会出现科大讯飞的影子。刘庆峰把科大讯飞定位成一个基础服务提供商,如今已主导搭建起家电、电信、银行、手机、国家安全、交通、旅游、音乐、玩具等多条细分产业链。
当然,这种主动驱动产业格局的行为在目前面临着挑战,需要产业链上的每个环节配合。如果采用语音技术,首先终端产品开发者的系统就要做出改变。对于一项新技术的应用,下游客户面临着原有系统的更新换代,这无疑增加了语音技术普及的时间成本。
稳固了中文语音市场的刘庆峰开始计划走向海外,“面对国际巨头的竞争,我们必须采取以攻为守的策略。”刘庆峰表示,“但我们不会选择收购,而是采取结盟来占领市场,因为那么多企业,收购并不是一个好办法。”刘显然有着更大的梦想——要向世界输出中国的语音技术。