专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > 手机 > 资讯 >

奇虎360刘鹏:大数据深度挖掘技术还有很大空间

导读:

由CSDN重磅打造的“2015 中国软件开发者大会”近日在北京朗丽兹西山花园酒店隆重召开。奇虎360高级

由CSDN重磅打造的“2015 中国软件开发者大会”近日在北京朗丽兹西山花园酒店隆重召开。奇虎360高级总监、商业产品首席架构师刘鹏在会上接受了多家媒体的专访,并就大数据在互联网公司中应用等问题做了解答。

刘鹏介绍,免费的策略让奇虎360形成几项核心资产,第一流量、把无形资产变成钱,数据上叫做变现,也可以叫做货币化,或者商业化。我们可以看到大多数的互联网公司都是变现的,即大家产品都是免费的,变现通过广告。国际性的巨头,谷歌、脸书,基本上大部分收入都是来自广告。

对于大数据时代机器与人的作用,刘鹏我仍然坚定的认为,大数据服务于机器应该优先于服务于人。他解释,大数据如果要服务与人,那么这个人应该是有非常高专业素养的数据科学家,或者是统计工作者。但这样的情况,实际上你的企业里想建立起一支专业的数据科学家的队伍,比建立自己的大数据,服务于机器的系统更加困难。而且人只能是对宏观的东西,对部分的场景做决策,机器可以对个体,对全量的场景做决策。

刘鹏还介绍,奇虎360现在的方向还是要在自己的广告业务当中,推荐业务当中,把自有的数据用到极致。从方法论上先用到极致,全量分析这么大规模的数据,又要实实分析,从基础设施上、工具上,这点在互联网时代以前,所有东西是用不上的,这样的数据的特点是量极大,价值密度很低,我们说要去ROE,是很好的系统,对于交易数据的系统和加工,可以说到达一个很高的高度,不适合做行为数据的加工,这样高成本的东西去做,根本就不可能有利润。

刘鹏表示,今天我们看到随着深度学习的发展,随着数据量本身的浅层挖掘做得差不多了。现在要认真地再考虑,用更复杂的模型,更深度的模型去真正挖掘用户深入的一些价值、兴趣特征。这可以说是从产品技术上有很大空间。

刘鹏还建议,今后几年里,中国的互联网公司尤其是大公司,应该主要着眼点和发力点都在这些方向,不在于大规模进行数据的交易和合作。

以下是采访实录:

(刘鹏)

主持人:接下来我们邀请到的嘉宾是奇虎360高级总监、商业产品首席架构师刘鹏。

欢迎刘鹏先生。

我们的采访正式开始吧。

采访人:我看您介绍里边说是360变现产品那边,我想问一下变现产品怎么理解?

刘鹏:在互联网公司是最通用的产品,所有的产品你们用都是免费的。免费我们会形成几项核心资产,第一流量、…把无形资产变成钱,数据上叫做变现,也可以叫做货币化,或者商业化。你看到的大多数的互联网公司,都是变现的。大家产品都是免费的。现在的变现通过广告。其实你看到的大多数互联网BAT和360也好,国际性的巨头,谷歌、脸书,基本上大部分收入都是来自广告,除了腾讯可能有一半收入来自于游戏。网易是一个游戏占比很高的公司,可能到百分之八九十其他大多数互联网公司主要变现来源都是广告。占整个行业比重七成到八成。

采访人:以前您做过一个判断,大数据应该指导机器,而非人的决策。人到底在这个大数据时代应该扮演一个怎样的角色。

您刚才说到的数据变现的问题,以前您也提到,数据脱民…不能解决数据隐私的问题,怎么在数据变现的过程中,您之前有没有碰到过很难的坎儿,因为触及隐私的,案例,或者您的想法。

刘鹏:关于大数据时代机器和人的作用,下午的报告还会提到这点,我仍然坚定的认为,大数据主要服务于机器人三,服务于人不是不可能,我们的洞察因为要服务的人应该有非常高专业素养的数据科学家,或者是统计工作者。可是这样的情况,在实际上你在你的企业里想建立起一支专业的数据科学家的队伍,这件事情比你建立你的大数据,服务于机器的系统更加困难。并且还有一个问题,人只能是对宏观的东西,对部分的场景做决策,机器可以对个体,对全量的场景做决策。

我还是觉得服务于机器应该优先于服务于人。

第二个问题,关于脱米…的问题,这件事应该说在工业界只能摸着石头过河。因为到今天,数据的使用本身已经成为互联网一个主基调。我们有大量的业务都是基于用户行为数据的分析和加工。不仅仅说到变现的话题。个性化推荐,金融领域的个人征信,都用到这个问题。但是隐私问题到底有多严重,到底有什么系统性的方法解决,这就好比是咱们在网络里讲的这个应用和安全之间的关系。应用发展肯定先于安全,如果开始要把安全框架都定在发展应用,应用发展不起来。英勇献发展,碰到问题再去打补丁。这个数据的变现肯定也要走这条路。我讲的观点,包括脱米不能解决问题的观点,主要是引起大家的注意。数据的隐私安全风险,比实际上我们直观想的大得多。在我周围有什么案例爆发,目前没有看到。我在文章里讲的,(英文)这些都是真实的案例。如果有人恶意的在数据里面做些东西,可以做得到的,我们并不希望这样的案子出现。

采访人:现在主要数据变现,也是针对在广告上面吗?还是接下来会有其他的一些部署?

刘鹏:就我们公司来说,对数据使用和加工,主要还是局限在提高广告效果,帮广告主能够精准地找到客户,这样一个方向。当然市场上会有其他的公司,包括大公司和第三方公司,在探讨直接通过数据的加工和交易来变现的方式。

不过这个在中国市场还处于比较起步的阶段。

采访人:现在有没有一些自己在做这个工作,还是有一些合作伙伴一起把这个数据变现,有这样一个合作吗?

或者说有把数据打包卖给他们这种?

刘鹏:完全不可能。完全没有这种可能我认为在短期之内,我们是非常清楚,数据本身加工和交易的风险,并且数据本身在目前的商业环境里,变现价值,由于竞价的问题,由于怎么去(英文)的问题,其实还存在很多的不确定性和上升空间。现在要想拿数据变现,挣不了太多钱。本身商业模式、风险,如果对大公司来说,风险大于机会。这应该是第三方公司和创业公司更加继续考虑的问题。

采访人:你们考虑的怎么来优化产品上面,优化你们本来业务上面的一些东西?

刘鹏:这些东西比较成熟,不能说是大数据时代的东西。大数据时代我们考虑的数据是全体数据,或者说是全局数据。业务内的数据,比如说我们传统的CRM数据,B…这些用于优化你本身产品的运营能力,优化运营效果,它的经营和方法论,我认为在五年以前就相当成熟了。面对的数据是局部数据,本业务的数据。现在我们考虑的B…更多的是考虑对同一个用户跨域,跨产品线,甚至跨公司的,对用户整体行为的描述建模去推荐新业务。这两点在数据模式上,和具体业务增值空间上有挺大不一样。优化本身的业务,肯定所有公司都在做,而且我觉得是一个比较成熟的领域。

采访人:这是你们短期内的,一些主要的数据变现的可能说途径。像如果长期来看,您觉得大数据像对这种大型的互联网公司,你们的一些计划是什么?