“从2001年到北京大学学习,就注定了我这辈子要与电子信息打交道。”坐在《证券日报》记者面前的鄢贵海,如此表达自己与计算机的不解之缘。
鄢贵海,现任中科驭数(北京)科技有限公司的董事长兼首席执行官。而作为科学家的他,在计算机体系结构领域深耕多年,重点关注专用计算架构、机器学习和金融计算。
2018年,鄢贵海带着技术创业寻求商业化落地,创立中科驭数。中科驭数孵化于我国计算机产业的摇篮——中科院计算所,极为难得的具备了可“打造加速生态,破解算力瓶颈”的先天优势,从底层核心技术出发,以专用芯片架构为核心,创新性地采用软件定义加速器的技术路线,实现软硬件协同的高效解决方案,其主要核心技术KPU(核处理器),是专为加速特定领域核心功能计算而设计的一种协处理器。
日前,围绕计算架构、“硬科技”等一系列话题,鄢贵海接受了《证券日报》记者的专访。
做“硬科技”需要时间投入
在鄢贵海看来,“硬科技”是一些所谓的非模式创新的技术创新。鉴于这些技术需要多年积累,具有投入大、周期长等特点,因此,硬科技的创新要有技术积累、产业环境、高级人才、时间等四个变量。
“将这四个变量放到一起之后,才有可能将‘硬科技’做出来。”鄢贵海说,如果在创新过程中,采用迅速地将资本堆上去的模式,希望半年内就能看到效果,这绝对不是“硬科技”。“就像中科院计算所的曙光超级计算机和龙芯CPU,都有很长的时间投入。”
具体到中科驭数,鄢贵海表示,虽然成立才不到两年的时间,但是,如果要算上“胚胎期”,已经有近15年的时间了,前13年是在做积累。“最开始的时候没有朝着公司化、产业化方面去做,到2018年才决定把基础研究做产业化落地,一个主要的因素就是做‘硬科技’需要时间的投入。”
而时间投入也是最容易被人误解的。“很多人对此不太了解,认为‘硬科技’就是一个高新技术,想什么时候做就什么时候做,谁想来做就谁来做。其实不是这样的。”鄢贵海说。
他还判断称,下一波的科技创新浪潮会出现在高端制造、精密制造、基础信息技术等领域,因此这些领域的创新一定要做起来,要做“卡脖子”技术。
“就像中科院计算所的所训——科研为国分忧,创新与民造福。国家的忧在哪里?就是要解决‘卡脖子’技术,要往上顶。虽然‘卡脖子’技术有很多范畴,但至少在基础信息这方面,我们是责无旁贷的。”鄢贵海说,计算所要做的是一些真正能解决国家实际问题的东西,真正能为国家分忧的东西,数量多少不重要,关键是要把真正的产品做出来,服务国家、服务人民。
他告诉《证券日报》记者,电子学解决的是把客观世界的信号变成客观的电子信号的过程,计算机系统是把客观信号变成真正有价值的信息。“在中科院计算所求学期间,我疯狂地迷恋上计算机体系结构,这跟以前不一样,原来研究这些体系结构是为了应付考试,担心是否能通过,在读研究生阶段天天担心的是自己设计的结构、算法,最后是否能解决问题。”
需要说明的一点是,鄢贵海所研究的体系结构的一些内容,与他的导师的研究方向是不完全重合的。但幸运的是,鄢贵海的导师非常鼓励他做自由探索。因为踏出导师研究的范围,才有更多的机会创新,这个学科才会发展。
2010年博士研究生毕业后,鄢贵海主导的一个项目拿到了一些重要的课题支持。而这些课题都是他自己拟定的,所以,所有的方向都具有延续性。也正是这些早期的技术积累,为中科驭数以后的发展打下了坚实的基础。
“一旦朝着一个方向持续做十年,这样的技术壁垒,其他临时组建的团队基本上是很难能够超越的。”鄢贵海说,“中科驭数做专业技术架构的底气,就来源于之前十多年的积累。”
事实上,在创业期,技术框架在鄢贵海的脑子里搭了很长时间。“虽然不能保证在商业上一定能成功,但是起码敢保证中科驭数的技术具有先进性,在市场上能做到‘人无我有、人有我优’。”鄢贵海说。
驾驭数据需要“硬科技”
在数据大爆炸的时代,什么最珍贵?鄢贵海给出的答案是“数据”,因为数据已经成为一种生产资料。而所谓的数据生产资料,就是要从数据里面发现价值,要能够驾驭数据。
这也正是鄢贵海将公司取名为中科驭数的一个重要原因,即驾驭数据。
“所有的价值都蕴含在数据里,关键是想看应用它的哪一方面的属性,要做到这一点,首要的一点是数据必须玩得溜,这就需要专业的工具。”鄢贵海说。
那么,专业的工具是什么?鄢贵海给出的解释是“处理数据的手段、方法、系统、平台和基础设施”。想要做到这一点,就要必先利其器。现在所拥有的“器”,就是以芯片为核心的载体,在上面搭建软硬件的信息基础。
然而,必须面对的一个现实是,芯片的类型是有限的。“我们看到的电脑里面,都是Intel或者是AMD的东西,不管形态有多各异,99.5%都是通用CPU。用一个通用的东西,最后可以解决所有的问题,这是很不合理的。”鄢贵海说,但凡遇到这种情况,一定是做了很多的妥协,就像用瑞士军刀拧螺丝钉,完成拧螺丝钉的任务不成问题,但是使用起来没有螺丝刀用着顺手,效率也要低很多。“所以,很多应用领域要有专用的设备出来。”
正因为如此,中科驭数将自己定义为一家“手术刀”型的“硬科技”创新型公司。相比于“瑞士军刀”型的通用计算架构,中科驭数的“手术刀”型领域专用计算架构,在众多通用计算架构不能满足性能和功耗要求的特殊领域,发挥着不可替代的作用。
鄢贵海介绍称,针对现有大量计算密集型应用在通用服务器平台上的执行效率低、扩展成本高、性能升级难的痛点,中科驭数研发了领域专用加速器架构——KPU,实现两个数量级的算力提升,并已经有了完善的产品体系。
KPU是专为加速特定领域核心功能计算而设计的一种协处理器,以功能核作为基本单元,直接对应用中的计算密集性应用进行抽象和高层综合,实现以应用为中心的架构“定制”。一颗KPU根据需求可以集成数十个至数百个功能核,用芯片的“私人定制”助力不同领域突破算力瓶颈。
“在数据量变大、算法复杂、带宽增加、实时要求高的情况下,必将对芯片算力有更高的要求,而架构‘专用化’将是重要途径。”鄢贵海说,如金融计算、实时数据库、人工智能、数据中心、高性能计算、基因测序、区块链等差异显著,但共同的特征为数据驱动、计算密集、端云一体等。KPU就是要赋能计算密集型应用、显著提升计算效率的专用协处理器。
“DNA”一体化加速赋能金融
随着国家有关金融政策的实施,金融市场监管力度不断加强,风控的规则越来越多,风控的计算复杂度越来越高,所以金融数据处理会遇到算力瓶颈和解决方案不足的情况。
在去年12月初举行的赛灵思开发者大会(XDF)亚洲站活动上,中科驭数展示了自主研发金融交易系统中的网络和风控系统加速解决方案RiskCop?(锐警),用科技为金融赋能。
事实上,在中科驭数的合作伙伴中,不少来自金融相关领域,比如交易所、证券公司、期货公司等。
对此,鄢贵海介绍,金融领域加速大多仍然用的是GPU,但GPU本质上是单指令多数据(SIMD)的计算模式,与金融风控应用里的规则集处理模式无论是在计算模式上还是对数据流的处理上,都是不相适应的。