媒体报道创业故事|由精通技术到改变世界——刘雨松和他的意能通(2)

创业故事|由精通技术到改变世界——刘雨松和他的意能通(2)

2018-11-08 10:27:19人工智能小k机器人语音交互

框架是自己定的,突破自己才能有更大的格局

 

突破语言障碍的刘雨松开始自己尝试学习计算机语言,从最浅层的前端调用,到写 JAVA,再到自学 C 语言直接写代码,甚至在一段时间里,他尝试去学习算法,了解最基础的理论层面上的机器神经网络。可以说,在能力范围之内,刘雨松将所有技术流程都尝试了一遍。然而,学习到最底层的刘雨松同时也触到了自己能力的天花板。

 

“靠一个人,想从技术的路线上将人工智能的路走通是不可能的,这不同于突破语言上的障碍。一方面,一个人的精力是有限的,所有流程都兼顾的结果就是所有的流程都做不好。另一方面,人工智能的理论越到底层越抽象,这不是单凭一腔热血就能完全搞明白的。”在技术的道路上过关斩将的刘雨松这次似乎真的摸到了自己能力的边界,那种站在门外孤立无援的无力感再次笼罩了他,此时,他即将大学毕业了。身边的同学有的在准备考研,有的在实习,唯独刘雨松在自己选择的道路上徘徊不前。

 

“和那时的选择相比,之前放弃专业的决定已经微不足道了。”整日面对着自己的边界,刘雨松最终决定再次改变,“如果说之前是选定方向,那么现在就是要选择目的地。”他决定不再纠结技术上的问题,转而以另一种身份进入人工智能行业——作为一个企业家。“企业家”这个词对于一个大四的学生来说还太过遥远,在2010 年的中国,这样的词还只能用来形容董明珠、王健林、李彦宏、马化腾一类的人。然而刘雨松相信,就和自己开始改变方向进入人工智能领域一样,成为一个企业家也是需要一步一步走出来的。于是在 2010 年的秋天,刘雨松做了一个很聪明的决定——考研,读管理。继续求学是一个一举两得的事情,一方面,刘雨松获得了两年继续了解人工智能的时间,另一方面,管理学的知识也能让他了解如何向成为企业家的方向前进。

 

有赖于那个夏天在操场上走过的一圈又一圈,刘雨松的英语水平已经不成问题,因此虽然考研的决定稍微有些仓促,他还是在 2011 年成功被西南大学经济管理学院录取了。

“2011 年再次入学,我的目标已经十分明确,那就是学会如何去调动资源组织一个公司,甚至是经营一个企业。其实这种前景一直就在那里,只是之前自己陷在了技术里打转,一旦突破了这种限制,事情就明朗了。”刘雨松的这个目标直到今天也一直未曾动摇,他最初的力量来自于相信改变,而这次的改变使他拥有了更大的格局。“直到今天,我越来越意识到,相比于科学家,中国的市场现在更缺乏的是能让技术落地并且进入消费品市场的企业家。如果能用商业将资源聚集起来,让市场参与进来,那么人工智能就不是一种幻想。”

 

以前想让底层技术起飞现在想让 AI 产品落地

 

两年的研究生时光确实给予了刘雨松宝贵的缓冲,在这段时间里,刘雨松在课业之余仍然在不断钻研人工智能技术,了解人工智能发展的最新动态。从程序员心态到企业家视角,他眼中的人工智能逐渐由一串串代码变成了一个个可以存在于现实世界中的商品。中国需要科学家,需要能够带领人类先去触碰未来的人,但是中国社会更需要企业家,需要能够让所有人都进入未来的人。

 

2011 年的市场中,AI 技术还没能以消费品的形式进入市场,以苹果为代表的具有图形界面可触屏的手机打着“智能”的名号进入消费者的手中,可是这样等级的“智能”还完全无法实现真正意义上的智能人机交互。以今天的目光看向那时,手机以触屏的方式省去了大量按键和输入的操作确实大大提升了可操作性,可是内容上的不开放和交互场景的限制性让这些产品与所谓“智能”仍然相差甚远。更勿论,彼时的诺基亚仍然坚守着自己封闭的塞班系统,所有程序的进入和操作的实现都有着较高的门槛,日后人工智能究竟会在手机上实现还是在电脑上落地,都是一个未知数。这一切的情形都被刘雨松看在眼里,他设想中的人工智能技术绝不是笨重的大设备,同时也必须要能够执行更加灵活的操作,使用者利用人工智能的交互要轻松自然,不能设置更多的使用门槛。基于这些思考,还留在学校中的刘雨松在苦苦等待,他能够感觉到未来有一个机会在向整个人工智能的领域招手。握住这只手,能够走上一条大路。

人工智能是一个大系统,虽然底层的理论已经走了很远,可是搭建起来还需要很多的砖瓦。它涉及到的领域包括芯片的研发、用户数据的收集、算法的改进、硬件系统的开发以及技术内容的开源等等。在这过程中,各个行业各自的改进是一个缓慢且不易察觉的过程,但是一旦它们各自搭建好了框架,一个足以支撑人工智能的大厦就搭建成了。

 

果不其然,2012 年,苹果发布了它们的第六代 IOS 系统,这其中,siri 的升级是一个重点,与以往的简单理解语音内容和执行简单命令不同,IOS 6 中的 siri 加入了更多的闲聊功能。彼时刘雨松也正巧在使用 iphone,升级过后的 siri与人之间的俏皮交流让刘雨松如梦初醒。“如果能够将语音作为人机交互的媒介,那么人工智能所有的技术就可以在所有设备上实现了!”敏感捕捉到时代改变的刘雨松兴奋得睡不着觉。人工智能产品的落地方式已经逐渐在他的心中显现出了轮廓,他明确地认识到自己未来将要在智能语音的路上走下去了。

 

把握先机,迈出创业第一步

 

2014 年,人工智能开始正式走入市场的一年,这一年,谷歌公司斥重金收购了人工智能初创企业 DeepMind,并于同年决定开源它的框架。一瞬间,大量的人力资源涌入到人工智能领域,纷纷从不同的层面对人工智能进行训练。如同淘金热一般,每一个对人工智能抱有理想的人都在同一时间拿到了一把铲子,踌躇满志地向着DeepMind 算法这座金山奔去。

 

亲手制作人工智能系统的时机终于到了,根据以往的想象,刘雨松团队选定了语音交互作为训练人工智能的方向。人工智能的训练需要数据,大数据,曾经从事过数据挖掘的刘雨松更加明白这一点,如果没有大数据的喂养,人工智能是无法快速成长的。 基于DeepMind 的算法框架模型,刘雨松团队找到了斯坦福大学Squad 问答系统的语音智能数据资料进行训练。由于刚开始人力上的不足,每一次跑完数据之后他们都需要自己将数据结果拿到论坛上去做数据对比,动辄上万的数据库往往看得几个年轻人头昏脑胀,一旦出现 bug,他们还要在上千行的代码中继续debug。犯错误很容易,可是找出错误在哪里却很难,最初用两天写出的算法模型在每一次数据测试之后都需要花上一星期甚至更长的时间去 debug,之后再从前端调取,继续进行测试。作为国内第一批进入人工智能领域进行模型训练的力量,刘雨松团队为语音智能的模型训练提供了宝贵的数据和大量的参数调整建议。如此循环往复多次,刘雨松团队终于在半年以后搭建了一个比较成熟的模型,他们决定要继续迈出一步:创立公司,让技术落地。

 

2015年,咖啦魔哆信息技术有限公司成立,紧随其后,刘雨松团队找到了华强北进行代工,推出了他们的第一款产品——小 K 机器人。

从今天的视角来看,小 K 机器人的理念也是比较超前的——它是一款以无线耳机作为载体的语音智能产品,一对无线耳机内部内置了语音智能交互系统“小 K”,方便携带,便于交互。人们可以在不同的场景中语音唤出“小 K”,对其下达一些简单的语音指令,比如播放歌曲、接电话、语音留言等等。虽然团队整体对于小 K 的设想都很美好,可是在一个问题上,他们出现了疏漏,那就是,国内的消费者不习惯长时间佩戴蓝牙耳机。

 

小 K 机器人是一款面向 C 端的产品,这样的产品必须要能够满足主流用户的绝大部分需要。刘雨松团队对于小 K 机器人的灵感来自于国外,当时亚马逊已经做出了他们初代的 Echo 智能音箱,实现了初步的智能语音交互,刘雨松团队的想法是将这种智能语音设备变得更加便携,适用在更多场景当中。基于对国外市场的了解,他们认为蓝牙耳机可以得到普及,可是当时还年轻的团队没有预想到国内消费环境的差异。也许是命运的捉弄,仅在一年之后,苹果公司就在 2016 秋季新品发布会上推出了 air pod,这款无线耳机的功能设计直指 siri 的语音交互功能,紧接着,国内的公司也纷纷开发起自己的语音智能系统,并陆续推出了自己的语音智能硬件,面对如此庞大的市场竞争压力,还处在早期的“小 K”不得不考虑新的方向。