专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > 科技 > 科技数据 >

睿帆科技于海中:PB级异构数据处理是核心竞争力

导读:

    大数据技术与行业应用融合正在加速,企业对大数据的需求变得日益旺盛,当其他

    大数据技术与行业应用融合正在加速,企业对大数据的需求变得日益旺盛,当其他公司还在大谈大数据解决方案概念时,一家由Teradata、华为、阿里等知名企业大数据科学家创办的创业公司——睿帆科技,早已研发出大数据科学平台、分布式分析型数据库等产品,并在通信、政府、公安安防、旅游等领域形成落地案例。

  基于大数据产品,构建全新决策引擎

  作为一家业内技术领先的一站式大数据解决方案公司,睿帆科技研发的底层大数据科学平台产品Baymax经过多年打磨,已经能够提供PB级的异构数据接入、存储、清洗、治理等数据处理能力,从而支持睿帆科技在面对通信、政府、公安安防、旅游等领域多样化的大数据需求时都能轻松应对。

  与各个领域客户深度合作过程中,睿帆科技发现,目前客户对大数据技术的需求正在发生深刻的变化:

  首先,传统数据仓库更多是对结构化数据处理能力强,对非结构化数据处理能力较弱,但大数据深度落地行业时,需要进行行业深度数据挖掘,处理非结构化数据能力不可或缺。

  其次,大数据技术的落地从监测、洞察逐步迈向分析、决策过程中,不再是像传统BI一样,给出报表和分析结果,由业务人员做进一步决策,而是机器本身要能做一些简单决策,需要机器更加智能,能够理解业务逻辑。

  第三,当大数据更加贴近应用时,客户群体正逐步由IT人员变成业务人员,需要降低大数据的使用门槛,让技术平民化,获得更好的用户体验。

  基于上述需求的出现,睿帆科技逐步将大数据科学平台、分布式分析型数据库等产品加入到决策引擎中,满足不断产生的新需求。

  在公安、政府等行业,睿帆科技采用分布式分析型数据库(雪球DB)应用方案,满足了客户对极速高并发在线即席数据查询的需求;而在通讯领域,睿帆的大数据科学平台(Baymax),可以使中国移动、中国联通、中国电信很好的解决数据日增PB级数据量的难题,从而极大提升客户对大数据的应用分析能力。

  目前,睿帆科技是中国移动最大的大数据合作伙伴,为全国近一半的省份提供大数据服务支持。

  睿帆科技CEO兼联合创始人 于海中先生

  近期,记者来到位于北京的睿帆科技总部,与公司CEO兼联合创始人于海中先生进行了一场关于大数据技术和行业趋势的畅谈,他对睿帆科技的产品当前落地场景、面临的挑战,以及睿帆科技在大数据领域的实践进行了分享:

  记者:当年创建睿帆科技的初衷是什么?

  于海中:我在日本留学硕士毕业后,工作于日本最大的软件集成商NTT Data。工作中接触到车联网技术,此后从事了8年的车联网系统开发及运营,在这过程中充分认识到大数据技术发展及运用将会给企业带来革命性的发展。恰逢其时,我和几个就职于阿里巴巴、华为、Teradata的小伙伴商讨创业想法,大家一致认为,中国的信息技术发展速度全球领先,并且随着互联网、物联网、人工智能等技术的深度融合,必将催生庞大的大数据技术应用需求,大数据创业正当其时!于是,一拍即合果断选择创办了这家睿帆科技。

  记者:睿帆科技的业务发展战略是怎样的?

  于海中:睿帆科技的目标是成为全领域全行业的一站式大数据解决方案供应商。所以第一阶段,我们将业务主要聚焦在通信领域,服务于三大运营商,深耕结构化数据领域。目前,我们是中国移动最大的大数据解决方案供应商,为全国近一半的省份提供大数据支持服务。

  下一步,我们要继续深耕通信运营商领域的同时加大公安安防、政府、轨道交通、金融等行业的投入,切入非结构化数据领域。18年我们已经与广东公安、广州地铁的重要供应商达成合作,相关产品和方案已经在落地试点,相信很快能够看到我们在这个领域的新突破。

  远期,我们将打通大数据产业链上下游,目标成为全领域全行业的一站式大数据解决方案供应商。

  记者:为什么会有这样的选择呢?

  于海中:我们的产品优势在于比其他大数据产品处理数据量级要更大、稳定性更强和运行速度更快,只有在PB级数据、应用复杂的领域才能发挥优势,而运营商领域恰巧满足这些点。但运营商的数据多半都是以结构化数据为主,要想成为全领域全行业的一站式大数据解决方案供应商,还需要面对非结构化数据,所以我们的第二阶段战略是切入公安安防行业。

  政府、金融和轨道交通行业也是时下对大数据需求比较高的行业,我们现有的产品即可满足这些行业的需求。

  记者:能够服务像中国移动、中国联通、中国电信这种大客户,其核心的壁垒是什么?

  于海中:首当其冲的当然是过硬的技术实力,我们是少数真正在实际环境中能够处理PB级数据的企业。纵观整个大数据行业,大数据处理产品竞争是相当激烈的,各家企业都以开拓市场为目的,利润空间有限。为了方便公司业务拓展,这些大数据公司对外宣传都具有PB级数据处理的能力,实则只是在模拟环境下做过相关测试。

  实验环境和应用环境的大数据承载量、数据复杂程度及数据质量是不一样的,尽管在实验室场景下能完成PB级别以上的数据处理,但在实际应用场景下就会出现意想不到的问题,这些问题有时只会造成服务器卡顿,有时会出现宕机,甚至硬件损毁。