什么叫碎片化的生活ID

热门标签:
集奥聚合带你解密大数据ID-Mapping
  谈到大数据,有一个非常基本但又关键的环节就是ID-Mapping(Identifier -Mapping)。ID-Mapping通俗的说就是把几份不同来源的数据,通过各种技术手段识别为同一个对象或主体,例如同一台设备(直接),同一个用户(间接),同一家企业(间接)等等,可以形象地理解为用户画像的“拼图”过程。一个用户的行为信息、属性数据是分散在很多不同的数据来源的,因此从单个数据来看,都相当于“盲人摸象”,看到的只是这个用户一个片面的画像,而ID-Mapping能把碎片化的数据全部串联起来,消除数据孤岛,提供一个用户的完整信息视图,同时让某一个领域的数据在另一个领域绽放出巨大的价值。
  ID-Mapping有非常多的用处,比如跨屏跟踪和跨设备跟踪,将一个用户的手机、PC、平板等设备的上的行为信息串联到一起。再比如这两年非常热的程序化交易,它的一个重要环节就是要把当前广告请求的用户和第一方DMP平台里的用户历史兴趣数据匹配起来。可以说,没有ID-Mapping,程序化交易就变成了盲目投放,它的实时竞价,精准投放的优势也就不存在了。
  ID-Mapping既然有这么大的作用,那么应该如何做好ID-Mapping呢?这个环节不是一个简单的按照Key匹配的过程,集奥聚合作为领先的第三方大数据公司,研发了多项ID-Mapping 的独家技术,用新的匹配技术和算法模型来重塑了ID-Mapping过程。据粗略评估,集奥聚合ID-Mapping系统有能力把十几个数据源的 56亿ID(Identifier,即标识符)匹配到一起,准确率达到 95%以上,有效用户总量提升了30%,平均每个用户的标签量提升200%以上。值得注意的是,这里的Identifier是指标识符,而并非Identity(身份信息),集奥聚合可在完全脱敏,不(也无需)识别、指出用户姓甚名谁的身份信息的情况下合法地将标识符对应至某匿名用户。
  简单来说,集奥聚合ID-Mapping体系有三个层面。
  第一个层面是物理Mapping
  这是最单纯基本的层面,也就是如何精准地记录和标识一个用户,例如利用硬件设备码生成一个统一的设备码,利用一些强账号来标识用户等等。这个层面上主要的技术难度在于ID的稳定性、唯一性和持久性。
  第二个层面是基于用户行为做迭代滚动Mapping
  由于原始数据存在噪音,同一个用户的多份数据、多种ID之间是“多对多”的关系。那么哪些ID是可信的呢?
  我们设计了一个置信度传播的机器学习图模型来帮助确定哪些身份ID是可信的。
  算法示意图如上,每个节点是一个UID或QQ号或GID等标识的潜在的“用户”
   一开始节点之间关系的概率是随机的
   其中总有两个ID的关系是强置信的prior
   迭代收敛后,哪些ID是归属于同一个用户的标识符被识别出来
  大体来说,这个算法的过程是给每一个ID,以及两个ID,如IMEI和邮箱之间的pair关系都有一个预设的置信度。而所有的ID根据两两关联构成了一张图,那么每个ID的置信度根据这张网的结构传播给相关联的ID,同时也从其他ID那边接收置信度,而pair关系的置信度不变。当算法迭代收敛时,高置信度的ID就是可信的。同一个子图内的ID就标识了同一个用户。用类似的算法,我们也可以评价每个数据源的质量等。
  第三个层面是基于用户兴趣做相似用户的合并
  如果说层面二主要还在判断标识一个用户的ID是否正确,那么层面三致力于把行为相似的用户给合并起来。
  例如,某一个用户的设备多次连接同一个Wi-Fi网关,但是每次链接都会随机更换ID,那么相当于这个用户的数据“分裂”在多个不同ID下。那么如何把这些ID合并成同一个用户呢?
  除了上述做法之外,集奥聚合开发了相似用户合并技术。基于用户的上网时间偏好、网址访问偏好、点击行为偏好、浏览行为偏好、APP偏好和社交账号偏好等,为每个用户提取了上千个特征之后,进行相似用户的聚类。
  聚类中选择类中心附近的用户,再加上一些辅助准则判定,就可以把用户合并起来。
  经实际测试,可以把用户ID总量减少80%,同时保持用户合并的准确率在91%以上。使用的历史数据时间窗越长就越精准。仅此一项就能让用户的标签密度提升 500%。
  也许你看还想看
责任编辑:陈近梅
贵州大数据产业政策
《贵阳市政府数据共享开放实施办法》已经2017 ...
贵州大数据产业动态
2017年,贵阳白云区提出打造“大数据+大诚信”...
贵州大数据企业
11月28日,2017贵阳大数据及网络安全攻防演练 ...
前不久,在2017博鳌国际物流论坛上,贵阳货车 ...日,上海有孚网络股份有限公司(以...1月8日,浪潮与哈尔滨人民政府签署产业落地合 ...一个ID多次触达 这么酷炫的开屏广告背后的原理你看懂多少
稿源:厂商
移动互联网时代,广告形式花样百出,槽点热点满天飞,消费者被纷繁杂乱的信息日常轰炸。广告如何做到“不被讨厌”且影响消费者心智,已然成为了摆在品牌marketing部门的新课题。今天看到一则H5 简直是移动互联网广告的一股清流。为什么这么说?和你知道那些妖艳的广告还真的不太一样。说实在,以消费者为中心的移动时代,已经从选择消费者转变为被消费者选择。品牌如何接地气的圈粉?如何抢得消费者碎片化的注意力,考验的不仅是品牌的广告创意,更多时候,是考验品牌选择传播媒介的眼力。移动互联网最宝贵的资源是什么?消费者的注意力。什么是移动端广告最具有曝光力且不被打扰的广告形式?毫无疑问,是开屏广告。问题来了,传统的开屏广告存在成本高、覆盖小、周期短、人群重合度高等诸多问题,有没有升级方案?关注消费者触媒场景 重视媒体组合的“波纹效应”知乎上有一个讨论话题“抢占移动互联网广告营销阵地,开屏广告能否会成为品牌营销新神器?”(https://www.zhihu.com/question//answer/)有网友提到“开屏广告站在强曝光的层面,的确有着其他移动广告不可比拟的优势,但从广告本身的形式而言,并不具备可以提升转化率的特质,又如何破解?”诚然,追求品效俱佳是每一个品牌爸爸的梦想,预算要花在刀刃上,既要有传播KPI,也要有转化ROI。推心置腹的说,这难吗?很难。就没有解决的方案了吗?或许有。怎么破?尝试在投放方式上做优化。对于品牌广告主而言,在推广产品时,最重要的是什么?是给消费者营造出使用场景,甚至是“品牌比我更懂我“的认知感受;品牌被赋予人格化,由消费者的个性来凸显品牌的独特性。通过广告内容和文案实现创意的具象化表达;而对于传播渠道,则是选择与目标消费群体的个性、兴趣、触媒轨迹等多维度相匹配的的媒体,让消费者“代入感”落地到细微处。什么叫“带货广告”?无论是走心还是走肾,关键在于让目标消费群无时无刻感知到品牌、产品的存在,简单讲就是“多次触达的刷存在感“,直到引发购买行为。“场景”的重要性品牌爸爸都知道,但如何选择具有“代入感”的媒体组合却是一个难题。也就是说,媒体组合的是否能发挥“波纹效应”,决定着产品是否被着色上“代入感”;媒体组合的形式越丰富,叠加互补的效应发挥的越大,层层递进的传播,就能在消费者脑中逐渐勾勒出越清晰的画面,也就越容易产生代入感。从PC端沿袭而来的程序化投放,或许是一剂提高“筛选媒体、匹配优质流量”效率的良方。但,仅仅做到开屏广告程序化还不够,需要再进一步,做到跨媒体跟踪和ID 数据融合才是能真正扩散“媒体组合波纹效应”的关键。试想这样一个场景,总价在 15 万的城市级SUV启动一波促销campaign,通过人群定向找到匹配标签的目标人群,在他们常常使用的视频类、新闻类APP中投放开屏广告;通过爬虫技术抓取到他们在社交媒体上曾经评论过热门剧集《白夜追凶》,同步在悬疑类剧集中出现产品TVC。因为投放媒体形式的不同,静态的开屏广告突出核心的促销信息,动态的TVC广告体现品牌调性和描绘驾驶体验。在投放广告的频次控制上也遵循消费者行为心理学,第一次投放由开屏广告的强曝光引发关注,通过TVC的诉求表达加深兴趣,KOL撰文解析功能卖点、强调优惠额度、一键购买来激发渴望;最终,这样一群热爱运动、爱看社会新闻、深夜追剧的年轻人有了另外一个标签”SUV车主”。由客户变用户,从过去单一广播式叫卖,已经变成通过广告创意、媒体组合,甚至是KOL电商来整合实现;一个ID,多次触达,达成这一系列操作,需要数据和算法的支持。
免责声明:本文为厂商推广稿件,企业发布本文的目的在于推广其产品或服务,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用等行为的建议。请读者使用之前核实真实性,以及可能存在的风险,任何后果均由读者自行承担。
有好的文章希望站长之家帮助分享推广,猛戳这里
本网页浏览已超过3分钟,点击关闭或灰色背景,即可回到网页

参考资料

 

随机推荐