毕尔巴鄂对阵皇家社会:两支近邻球队将于西甲联赛 “巴斯克德比”中为捍卫荣耀而战贝壳第三季度营收226亿元 经调净利润17.8 亿元 同比下降17.46%AI营销,让科技巨头尝到了大模型商业化的甜头安恒信息范渊在乌镇峰会谈AI:以工具视之、以工具用之、以工具治理之诺基亚与微软再合作,为 Azure 数据中心供货延长五年天岳先进发布业界首款 300mm(12 英寸)N 型碳化硅衬底三星介绍内部安全团队 Project Infinity 攻防演练项目,高效修复 Galaxy 手机平板漏洞上海市将推进低空飞行服务管理能力建设,2027 年底前累计划设相应航线不少于 400 条岁末,海尔给您备好一套“小红花”为什么说Q10K Pro是今年最值得入手的电视?看完这几点就明白了!“小墨方·大不凡”!Brother“小墨方”系列彩喷一体机全新上市黄仁勋:AI智能需求强劲,“物理定律”限制英伟达芯片增长诺基亚与微软再合作,为Azure数据中心供货延长五年国家数据局:到2029年基本建成国家数据基础设施主体结构中国已发展成为全球最大的互联网市场,拥有全球最多的网民和移动互联网用户中国铁塔:计划按照10:1的比例合股美国FCC正式划定5.9GHz频段用于C-V2X技术在AI领域奋起直追!苹果要对Siri大革新 2026年正式发布日本机构公布量子专利榜单:本源量子、国盾量子位居全球第1中国联通:拟向华为、中兴展开5G网络设备竞争性谈判采购
  • 首页 > 企业IT频道 > 大数据

    让大数据接地气:用户画像在360商业数据部的应用实践

    2017年06月06日 14:22:00   来源:界面

      随着互联网逐渐步入大数据[注]时代,企业和消费者的行为不可避免的发生了改变和重塑。最为突出的变化是,大数据使得消费者的行为“可视化”,而伴随着大数据应用的进一步深入探讨和创新,个性化技术成为重要落脚点,于是“用户画像”的概念应运而生。对企业而言,利用海量数据精准生成的“用户画像”,可以使得营销推广更加的精准、高效,这也成为企业营销不可或缺的技术手段之一。

      作为营销推广行业的领军企业,360推广基于自身全场景覆盖的产品资源和强大的行为链大数据优势,通过大数据的创新应用,创建标签体系,结合系统关键技术,形成精准的用户画像,助力广告主实现精准高效的营销。

      接下来,就为大家深度解读360的用户画像,探秘360用户画像的核心优势及其面临的挑战!

      1. 用户画像

      用户画像就是根据用户的各种行为抽象出的一个标签化的用户模型(见图一),简而言之,就是给用户贴标签。

      图一 用户模型

      企业收集到的数据一般是多方来源的,且复杂而分散,如何将这些数据归一化到一个对目标有效的标签体系,是构建用户画像需要解决的问题。

      1.1标签体系

      人的行为异常复杂,构建一个有效的用户模型,往往涉及到多个维度、大量标签的复杂结构设计。360用户画像标签体系包含50万+量级的精细化标签,有结构化和非结构化两种标签结构。

      结构化标签

      有层级关系的标签体系,标签是比较规整的树或者森林,有明确的层级划分和父子关系。不同的标签维度,往往带有不同的时效性,例如性别、年龄等是一个不会短时间改变的属性,我们称之为中长期用户属性,例如购买兴趣等,是一个短期的意图,我们称之为中短期兴趣标签。

      中长期用户属性标签:主要包括人口自然属性,例如性别、年龄等,以及地域标签、设备信息等,这类标签层次结构不深,有明确的标签值集合,且标签值比较稳定(见图二)。

      图二 中长期标签体系

      中短期兴趣标签:主要是指用户兴趣标签,包括行业兴趣、电商兴趣、品牌兴趣、APP兴趣等(见图三)。这类标签一般具有短时效性,用户兴趣标签变化较快。

      图三 中短期标签体系

      这类标签体系一旦构建完成,相对稳定,结构清晰,类目之间有父子关系,层次较深。图四是行业兴趣标签体系的部分结构。后续章节会以此结构为例来展开介绍关键技术。

      图四 行业兴趣标签体系

      非结构化标签

      无层级关系的分散标签,例如用户个性化标签、APP标签(见图五),标签集合不固定,且数量庞大,粒度较细,更新快。

      图五 非结构化标签体系

      1.2 360数据优势

      数据是构建用户画像的关键,发挥各家数据所长,至关重要。360拥有丰富且多样性的众多产品,给我们提供了多方的数据,为从多维度完整的刻画用户模型提供了强大的数据支持。

      海量数据:360用户产品覆盖 5.14亿PC端用户,移动端覆盖7.99亿用户,具有96.6%市场渗透率。

      数据多样性:多方数据源,包括自身数据、客户数据、第三方合作数据等。

      Ø 自身数据:360用户产品涉及多个领域,例如360搜索、360浏览器、360安全卫士、花椒直播、手机助手、360os、360免费Wi-Fi、360儿童卫士等

      Ø 客户数据:客户自有的第一方数据,例如官网访客、下单、关注微信、关注微博、安装移动应用客户端等数据

      Ø 第三方合作数据:来自于外部合作伙伴的标签化数据等。

      强大的跨屏能力:通过PC、无线、LBS坐标等多触点触达用户,拥有强大的跨屏能力(见图六),拥有完整的用户行为链数据。

      图六 数据跨屏

      强大的数据处理能力:拥有强大的数据仓库,每天处理数据超过500T,具有海量数据处理能力和实时计算能力。

      1.3 360用户画像的应用

      用户画像的应用主要包括以下几个方面:

      (1)营销决策:基于用户画像对人群各维度的刻画,洞察目标受众的偏好,指导媒体进行投放优化,提升营销效果。如在化妆品检索用户中,分析发现25岁以上的女性居多,且大部分是北京、上海、广东等经济发达地区的上班族,从而帮助化妆品行业的广告主实现目标人群的高效触达,提升营销效果。

      (2)个性化推荐:根据用户的兴趣偏好、购买行为等,向用户推荐感兴趣的信息和商品。推荐信息的点击率高或者转化率提升反映了推荐比较准确,其核心就是用户画像准确。

      (3)广告投放:利用用户画像,更加精准的定位目标受众,进行产品营销、广告投放等。比如母婴产品,主要针对女性、孕期、育儿人群进行广告投放,提高产品转化率。

      360用户画像在以上几个方面也得到了充分的应用,下面举例说明360用户画像在商业数据产品商易和DMP中的应用。

      1.3.1用户画像在商易的应用

      360商易是360公司首款智能大数据营销决策平台,精确定位目标受众人群,分析受众人群的自然属性以及触网行为,反映行业及品牌的市场现状,为广告主投放和市场营销提供真实、准确、可靠的决策支持。

      比如广告主希望知道自己网站或竞品网站的受众大概是什么样的一群人,商易可以帮做什么呢?商易受众分析流程如图七所示。

      图七 商易受众分析流程

      以斗鱼TV为例,由分析结果可知经常访问斗鱼的用户多为19-24岁的男性学生,并且对数码、美食非常感兴趣,如图八所示。如果广告主想要更加精准的、ROI更加高效的广告投放,可以投放区分度较高的兴趣类目人群;如果广告主想要扩大影响力,让更多人群有机会认识自身品牌,可以考虑投放样本覆盖率更高的类目。

      图八 斗鱼tv受众人群人口属性分析

      1.3.2用户画像在DMP中的应用

      360 DMP 提供灵活的组合筛选条件实现人群细分管理,从用户的行为轨迹到兴趣偏好等维度,自由组合圈定目标人群,在投放展示、搜索、品牌、应用下载广告时,能够快速而精准的定向到某一类特征人群,从而帮助广告主获得更高的 ROI,有效降低营销成本。

      以花椒指标为例,大直播时代,各路直播产品层出不穷,市场竞争激烈,因此花椒直播希望在获取更多新客的同时有效降低激活成本。对于直播较为感兴趣的人,经常会访问一些直播类网站、搜索相关关键词,以及下载行业相关APP,因此有这些行为的人都是花椒直播的潜在客户。依托360用户画像,DMP帮花椒直播寻找了那些可能对直播类APP感兴趣的人,并将其制作成人群供花椒直播进行投放,花椒直播APP激活率提升近3倍!

      图九 花椒直播定向投放效果

      整个移动端采用定向投放后(+本站微信networkworldweixin),在转化成本、CTR、CPM上都有显著的提高,具体指标如图十所示。

      图十 人群定向在移动端的效果提升

      1.4 难点与挑战

      一个优秀的用户画像系统的构建和应用存在以下难点与挑战:

      (1)用户实体的标识,一个用户可能拥有多个设备,怎样实现终端设备多对一的合并;反过来同一个设备可能有多个用户,比如家庭成员共用一台电脑、一个ipad,这个设备代表了多个实体的特征,很难区分。想要完整定义一个用户实体很难,在业务中不过多关注这一点,主要关注寻找出受众群体。

      (2)用户标签的定义,比如男女标签,不仅仅是指生理上的男女,还包括互联网行为上表现出来的男女等。标签必须和业务场景绑定,这样在构建用户画像的过程中,需要和业务部门沟通,搜集业务方需求,指定满足业务需求的标签体系。

      (3)数据处理能力,海量数据中,存在大量非结构化数据,且用户行为比较分散,为此我们进行了规范化的数据仓库建设。

      (4)用户画像的挖掘建模,用户标签的准确率需要不断进行优化,需要结合自然语言处理技术、机器学习、深度学习等方法不断优化效果。

      (5)用户标签的验证,有些标签如年龄等,可以用标准的数据集验证标签的准确性,但是有些标签是没有事实标准的,如兴趣、用户忠诚度等,只能在具体的业务上,进行效果验证。

      在深入了解了360用户画像的内容之后,确实是有种不明觉厉的感觉。诚然,在技术不断革新发展的过程中,360用户画像还面临着一些难点和挑战,但我们有理由相信,360会不断创新技术能力,持续完善用户画像系统的构建和应用,为助力企业实现高效精准的营销添砖加瓦。

      都说外行看热闹,内行看门道。那么,360的用户画像是通过什么样的技术方式来实现的呢?

      敬请期待下篇《发挥大数据价值:精准的用户画像是怎样练成的?》

      关于作者:

      向园,360商业数据部算法工程师,北京航空航天大学模式识别硕士,从事DMP用户画像的挖掘和广告定向的模型与算法。

      杜冉冉,360商业数据部算法工程师,中国海洋大学硕士,从事数据挖掘和广告算法。

      关于360商业数据部:

      360商业数据部专注于360自有海量数据的深度挖掘及分析,在保护个人隐私及数据安全前提下,多维分析用户需求和偏好,运用数据挖掘和人工智能技术,以及场景化应用全面提升商业价值,已形成包括360商易、360DMP和360分析在内的数据营销产品体系。360商易基于海量数据洞察人群画像及品牌现状,为营销决策提供支持;360DMP对数据进行整合管理,精准圈定目标人群,提升转化效果;360分析支持推广效果评估及流量分析,实时优化投放。该大数据产品体系,结合360点睛实效平台,共同为广告主提供大数据精准营销闭环服务。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。