HCR(慧辰资讯)大数据产品部总监黄鸣:基于运营商“行业洞察”标签的传统企业掘金之路
HCR大数据产品部总监黄鸣在2016年中国信息通信大数据上发表了以“基于运营商”行业洞察“标签的传统企业掘金之路”为主题的演讲。黄鸣提到,在5年前运营商大数据处于1.0阶段,现在进入运营商大数据的2.0阶段,从从2.0到3.0进化过程中,可以通过满足传统企业大数据变现的需求。
数据猿报道,2016年4月20-21日,2016中国信息大数据通信大数据大会在京召开。大会以“开放共享、转型创新”为主题,聚焦通信业大数据产业生态,邀请工信部、院士专家、三大运营商集团及省市大数据相关业务部门领导以及领先的大数据产业领军企业及应用单位代表出席,共同探讨通信业大数据发展带来的产业机遇和挑战。
本次大会主要针对前沿I.T技术与解决方案对运营商大数据能力建设的提升以及业务运营、架构的转型影响,通信业大数据的开放应用以及开放、共享、创新的产业生态等热点话题展开讨论,全景展现运营商大数据能力建设规划与开放应用策略。
以下是数据猿现场独家直播“HCR(慧辰资讯)总监黄鸣”的发言实录:
黄鸣:简单介绍一下HCR公司,我们主要做三件事情,第一是数据融合,我们把企业内部的各个系统打通,帮助企业在内外数据的一个融合。第二个是我们融合完以后,帮助传统企业做数据分析和分析洞察,告诉他这些数据给他带来什么样的结果。除了分析以后,我们还会直接帮他做很多落地的应用。比如通过CRM数据,找到很多规律性的东西,直接帮他去营销,我们会告诉你的CRM计划、品牌计划、广告计划怎么做,针对不同用户怎么投放广告,在什么地方投放广告,怎么花预算。我们有不同的子公司,比如负责舆情、文本挖掘、内外部挖掘、负责CRM的。
回到大会主题关于运营商大数据的变现,运营商是我们非常大的客户。中国移动90%的省份都是HCR的客户,我本人也是在运营商内、外服务了十多年,我们理解的,运营商大数据有几个阶段,第一个阶段是运营商大数据1.0阶段,在五年之前,大家还没有大数据概念的时候,运营商在做很多内部BI级的一些分析,做很多内部的精确营销,然后有一些零星的大数据探索,这个阶段是内部变现的探索,是大数据的一个萌芽阶段。
到现在应该是运营商大数据的2.0阶段,这个阶段中各个省的三大运营商都在建平台,做不同的业务,做内部的CM、BI、数据的整合,要去拿这个东西变现。因为传统业务已经开始有很大的萎缩,大数据是未来业务的一个突破点。这个阶段我认为是变现起飞的阶段。考虑到未来发展,我们的观点是说,未来到3.0阶段,运营商是深入行业的一个大数据。现在运营商的大数据基本是揉到一块,来什么客户,给你提供什么东西。未来运营商的大数据应该有很多行业的伙伴和行业的一些应用,我们内外部融合以后,针对每个细分行业提供很多垂直到这个行业真正的一些很深入的大数据服务。到那个阶段我认为是生态合作变现,真正扩张的一个阶段。
大家可以看到,这是运营商2.0时代。现在大家在各种大会或者各种材料、运营商的推荐上可以看到主流的大数据应用,还有很多没有包括进来。几年前提出基于人流量的实时监测,后来十三五规划出台,北京各个区县都在疏解人口,把非首都的人口往外迁,这是运营商很大的一个商机。还有就是之前的上海踩踏事件,激发了政府和运营商一起做人流量安全预警的想法,包括交通优化、商铺选址等都是人流量相关的大数据。
另外,比较火的就是金融、征信、信息验证等等,还有营销、舆情大数据,洞察的分析报告这几块,这是运营商积极参与在里面的。我们可以看到2.0已经是这样了,再往3.0做会有哪些变化?主要有这么几个方面的变化,第一是数据融合。现在不管是哪家运营商,都没有全部的数据,谁也不会说我有全部的数据。BAT也好,移动也好,电信、联通也好,他们是大数据的土豪,但是他们都没有全部的数据。从运营商来讲,电信、联通应该做的相对好点,有全国各个省公司的数据整合。因为中国移动的数据量比较大一点,各省都在建他的一些大数据平台。但是融合起来,数据量以及带宽都是很大的问题,未来无论是运营商还是传统企业、互联网企业,都要做数据融合。一旦融合到一定阶段以后,就有上面的比如基于一个人,在各个领域都有足够的数据,你的标签就足够丰富和完整。再往上,比如我们会有新的算法,以及更优化的计算能力,这些都会促使运营商的大数据有一个质的飞跃。
除了技术保障以外,协作机制也非常重要。今天大会的主题谈的也是开放协作的问题,如何跟各个领域公司的合作伙伴一起去融合,这也是影响到大数据变现一个非常重要的因素。最后一个,也是最重要的因素,前面说的所有这些东西,如果没有一个垂直行业应用的导向,那它的变现价值就会非常弱。一定是你提供的标签算法以及推出的产品都是垂直到某一个领域,某一个行业里面,解决某个客户、某一个针对性的问题,这样大数据的产品就非常有销量。
接下来我重点说两块,一个是我们可以分享的一些经验,比如标签的应用。第二个谈一下对这个论坛相关的一些内容,比如今天讲到的开放,如何开放?运营商的数据,我们从外部的合作伙伴来讲,如何希望运营商做一些开放和协作。
首先看一下,大部分的企业都是传统企业,传统企业是什么呢?就是非互联网企业。HCR主要的客户都是世界五百强的公司,世界五百强的公司他们大量的数据都是在自己的手上,没有在互联网上,不像互联网企业,基本上都在网上,大家可以去爬取。他们有很多大数据的需求,需要做很多内部数据的融合,比如我们给奥迪做,他内部有很多系统,区分在不同的部门,他要做一个大数据,就必须要做数据融合,只有这样才有基础去做深一步的分析。他首先要做的就是内部各个系统的打通,每个系统都是烟囱,怎么把它串起来,我们很多五百强企业都在干这个事情。极个别企业已经把这个事情做完了,他要获取外部数据,我要拿百度、腾讯、阿里的标签,把内部的用户标签打通,帮助获客拉新,谁是我的客户,他们在哪,怎么成为我的客户,如果有一款应用能够帮传统企业解决这个问题,基本上肯定会有很多人会买单。
运营商大数据从2.0到3.0进化过程中,如何满足传统企业大数据变现的需求呢?最重要的,你要去打造针对传统企业,符合他行业特征垂直的一些标签,真正能打动他的一些标签,才有上面的应用能够产生。我讲一下标签的进化,传统的用户画像,很多公司都在做。比如开始要去做很多数据融合,做数据交换。数据融合以后,我们找一些真实的数据做数据建模,滚动的一些迭代,不同的算法,然后去优化这个模型,去做很多的交叉销售、广告等各方面的应用,这是一个方面。我们接触很多无论是互联网公司还是大数据公司,大家在做的最常用的,就是他买了什么东西,我就给他打上这个东西的标签。或者他做了什么行为,就打上这个行为的标签,这个都是针对他行为或者针对物的一个标签,没有看到我为什么要做个东西,他为什么会买这个东西,而不是买另外一个东西。我们通常的标签方式看不到这个。在我们看来,人的任何一个行为,其实都是他内在一个动机的反馈。如果一个土豪级的老板,他买的东西、吃的、用的、去的地方等,这些行为和一个三四线的屌丝的行为会有本质性的差异,但有可能他们在某一个行为的节点上产生的一些标签是共同的。如果你只是用共同的标签简单去打物的标签,看不到这个人本身内在的动机不同,你就无法真正掌握到他这个人的动机以及他在消费时的一些偏好,到底为什么会产生这种消费。
在我们看来,比如绿色是很多在做的标签分类,比如看过宋仲基的片子,打一个宋仲基,看过3C,打一个3C产品,还没有到物的层面,都是绿色层面的标签。再往后进化,应该是一个物的标签,比如我买了一个3C的产品,笔记本,而且是一款游戏笔记本,它的价格可能是两万。我们看这个物的标签是什么,我们传统的可能就看不到。但是你真正去看到这个物的标签可能就是一个很昂贵的游戏本,再去看这个人的标签,什么人会去买一个很昂贵的游戏笔记本?而且又是一个神州的牌子,价格居然是两万,非常贵。我们要去分析,他带来的人的标签是什么,他是一个游戏的发烧友,极其看重游戏,不看重牌子,这个人消费3C产品的时候有什么偏好,我们就知道了。因为他买过这么贵的一个牌子很小价格很高的游戏本,我们知道他买3C产品的时候偏好是什么,我可以打上3C消费的偏好,可以抓到他行为背后的动机。
我们在打标签的时候,就会把标签分成两个层面去做。首先我们会把这个物打标签,不仅仅是你发生了什么行为,买了什么东西,你买这个东西是什么,我要拿出来。这个东西具备什么样的特征,我要去看到,这个特征有什么标签,我都打上去。通过物和人,就可以把人的标签丰富起来。我们怎么做的呢?比如3C笔记本,这是一个品类标签,很容易打上这个标签。接下来我们看SKU的标签,SKU是仓储的一个指标,可以这个商品的配置是什么。如果你一个人买了很多类似的产品,它的配置很接近,说明他对这些配置比较关注。我们就可以通过他这些配置去衍生出物的标签,比如这个笔记本是2016年2月份上市的,传统来讲,我们打一个标签,它是2月份上市的。2月份上市说明什么呢?说明它是一个新产品,有人会买这个新产品,而且我们看到这个人买了这个笔记本,他还买了其他的,比如相机或U盘,都是最新上市的。我就知道这个人爱购买新潮的东西,这几个物的标签,SKU的标签可以转成物的标签,物的标签可以转成人的标签,可以看到3C这个垂直领域里面用户的偏好是什么,就可以细分出来。再去做推荐的时候就很精准了,我就知道有一批用户他就喜欢新产品,京东下次要推新东西的时候,他就可以精准去找到这些用户,而不是只是看前面品类的标签,就会有更多的丰富得标签。我们可以从原来的SKU看到他背后为什么喜欢这样的东西,他的动机是什么。
HCR在这个方法论基础上做了很多工作,我们通过移动互联网APP的行为,通过和运营商合作,通过和互联网公司合作,对这些数据做了大量的分析和整合。我们对每一款主流的APP都进行了一些标签的分析,这个APP代表什么?这个APP的SKU是什么级别?能带来什么样的物的标签、人的标签、行业的标签,我们都可以给用户打上。
我们怎么做到的呢?举个例子,比如有一个用户去超市的时候会买一个价格特别贵的,四十块钱的鲜榨果汁。我们看这个人的消费记录,他买的比较贵,而且比较有牌子,有质量,有这个积累以后,我们就知道他这个人很讲究品质,不关心价格,这个标签通过他购买物的标签,转化到人,我们可以打上人的更多更深度的东西。在打标签的时候,有一个权重问题,根据他购买的行为,如果他经常买价格很高的东西,物的产品的累积,也会增加他在这个标签的权重。我们对物怎么理解呢?我们对移动互联网的APP都进行大量的梳理,比如应用宝上有20万比较主流的APP,这些APP所有行为,运营商都可以看到。因为运营商要做很多大数据分析,对DPI都要提取出来,然后打上相应的标签,这些工作我们都做好了,我们做了大量APP的分析。基本上除了工具类和游戏类,其他的APP覆盖量达到99%。
我们怎么做的呢?比如我们分为浅层标签和深层标签。浅层标签,比如积分论坛,有80%的IT男在看的,然后在全国违章查询时,这个就明显是车主的特征,通过特征的发现,去打上标签。这个很多人已经在做了,还有一个深层标签,我们在做什么?比如口袋记账,通过这个记账号,我们去判断他用这个APP后面的性格特征和价值观特征。比如记账的APP是什么样的特性。在场的各位嘉宾谁装有记账的APP?可以看到,现场只有一个人手机上装有记账APP。可见,大部分人不爱随时记账。为什么会有人记账?因为他有理财的习惯,对花钱有一个非常谨慎的习惯,他会把它记录下来。如果对花钱比较不关心,应该不会去记账。记账是为了把自己的消费记录下来,方便去分析自己每个月各方面花了多少钱,有没有超支,未来我要如何去调整自己的支出。用这个记账类的APP的人通常比较谨慎,消费比较理性。这位女士不知道是不是理性消费的主体,但我花钱是比较谨慎的。另外,比如食物相克手册,如果你用这类的APP,说明你很关注食品安全的问题,通过这样一个分析方式,我们对大量的APP做很多调研,各位嘉宾可能会觉得这个不一定全对。我们会给每个APP打上一个权重,如果你用了很多类似的APP,频率很高,权重很大,你在这方面的权重就高。
通过这样的方式,对APP进行理解,每个APP打上很多标签,通过行为权重、时间、频度,打到人的标签上,最后形成基础标签。行为偏好、性格、价值观,然后形成很全的价值观的一个量表。只要你有APP的一些行为数据,我们就能快速计算出你是什么样价值观的人,是什么性格的人。最后就是基于前面这几个标签,生成垂直行业不同领域的一些特定化的标签。真正最后能卖钱,有价值的,能满足客户核心需求的是垂直行业的深度的一些标签。
讲这么多,如果是解决传统品类的标签,从物到物的,你只能知道他以前有什么行为,然后去给他预测类似的行为。但你不知道他产生这个行为内在原因是什么,但是我们的方法是根据物的标签,去看这个人真正长什么样,动机是什么,性格、价值观是什么,行为偏好是什么,有这样一个刻画以后,再去推荐或者做很多分析,包括做一些物的关联。
其实针对这样一个体系,我们已经有现有的产品。我们把这个能力开放,给国内一些客户做标签能力的输出。我们的标签跟DSP最大的不同是,我们侧重关注人本身的动机、性格、价值观,这个他们都没有提供。这个在应用领域,比如营销、产品设计、用户洞察等等,有了标签以后,很多东西做的比较游刃有余了。
这是我们的标签进化。接下来谈一谈对协作机制的看法,在运营商大数据这块,运营商大数据这两年已经是非常火了。在运营商体系内,所有人都想抓住这个东西。我们从外面来看运营商大数据,术业有专攻。运营商传统来讲,他不是数据供应商,而是一个通信信息服务的供应商,要把基础的通信数据做一些变现的转化。人流大数据,运营商已经做的比较成熟了。但是还需要往深做,曾经运营商准备负责人流大数据的平台建设,给旅游部门非常需要做景区人流量的监测,我们可以看到人流量的分布、走向等等,但是他更需要什么?他更需要的是,这些人流量带来的价值是什么?怎么调整旅游未来的规划和策略?这个可以让熟悉旅游规划的专业人士来做。每个领域,比如金融、舆情等等,每个都有细分的行业,有一批的合作伙伴在做专业的事情。在这方面运营商可以做一定的开放,纳入整个生态里面,而且运营商有足够的能力主导这个生态,从而做很多运营商大数据和垂直行业的知识、技术的结合。
再来看客户资源,运营商把握的是一些大的客户或者跟他对口的信息服务,大量的长尾客户都在一些垂直的合作伙伴手上,客户资源也有很好的合作基础。比如很多五百强是我们的客户,我们可以帮助运营商去营销他的数据,打造一些产品,共同去做营销。未来运营商3.0的合作,希望是这样一个方式,首先大家是开放共赢的,在开放共赢基础上,我们要有一个很轻量化的合作成本。比如我们跟很多运营商接触的时候,我要买他一些数据,他没有现成的平台,没有现成省份的数据,都要根据我的项目去定制化集成,一上来就几百万上千万,作为一个独立项目,很难覆盖这么大的成本。如果未来运营商把这些东西都能够融合打通,提供接口给对外的一些合作伙伴,他们就能够很快调用,就可以把这个成本做很大的节省,有专业化的公司帮助运营商把这个大数据推广到更多领域之中,未来这个市场可能就不是运营商自己在做,而是几何级的市场爆发。
我的分享大概就是这样,谢谢大家!