校园T7/T9用户t9拨号是什么意思思

天翼校园套餐维系和用户价值简析_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
天翼校园套餐维系和用户价值简析
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩8页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢大数据分析----如何分析一个微博用户最常被人称呼为什么?
微博用户各项基础数据:
基础数据:注册姓名、注册昵称、注册手机号、注册地址、注册城市、注册性别、注册年龄、注册婚姻情况、注册学历、注册爱好
2、& 物理数据:定位、IP地址、MAC地址、手机品牌机型、操作系统
随机数据:微博内容、浏览内容、搜索内容、评论内容、私信、别人@给他的内容、提到过他的微博、传发他的微博的人、@给别人的微博
4、& 关联数据:粉丝、所关注的人、经常访问的微博
5、& 活跃数据:登录次数、停留时长、跳出率、点击次数、注册、购买
6、& 习惯性数据:登录时间段(几点到几点)、周几、上午下午晚上
作业一:如何分析一个微博用户最常被人称呼为什么?
常用称呼(X)=注册姓名(Y)
常用称呼(X)=注册昵称(R)
常用称呼(X)=评论内容中提到自己时用的称呼(Z)&次数(A1)
常用称呼(X)=粉丝提到他时用的称呼(W)&次数(A2)
常用称呼(X)=传发他的微博的人提到他时用的称呼(V)&次数(A3)
常用称呼(X)=私信中提到自己时用的称呼(U)&次数(A4)
常用称呼(X)=私信中对方提到他时用的称呼(T)&次数(A5)
常用称呼(X)=他@给别人时提到自己所用的称呼(S)&次数(A6)
分步骤分析:
1、常用称呼(X)拆解
拆解一:核心关键词拆解,注册姓名(Y)=姓+名,以注册姓名张三为例,常用称呼(X)=张三、张、三
拆解二:相关词拆解,常用称呼(X)=各相关词,以注册姓名张三为例,常用称呼(X)=小张、老张、张先生、张女士、张***、张阿姨、张奶奶、张爷爷、张叔叔、......
拆解三:扩展词拆解,常用称呼(X)=张总经理、张经理、张部长、张主任、张总、张董事长、阿张、阿三、张教授、张老师、三子、小三子、小三、三哥......
2、统计分析:
统计一:R、Z、W、V、U、T、S是否包含以上关键词
统计二:以上关键词在R、Z、W、V、U、T、S出现的频次,并按频次高低排序
注册姓名(Y)
注册昵称(R)
评论内容中提到自己时用的称呼(Z)
粉丝提到他时用的称呼(W)
传发他的微博的人提到他时用的称呼(V)
私信中提到自己时用的称呼(U)
私信中对方提到他时用的称呼(T)
他@给别人时提到自己所用的称呼(S)
我们可以将以上数据合计,通过合计直接获得出现频次最高的称呼,我们姑且可以用这个作为其最常用称呼,但是实际情况下会有偏差。
3、偏差校验
因情景不同,所以各个称呼在不同情景下权重不同,如私信里会有人问,您贵姓?而发微博时可能就不会很正式的提自己的身份和名字,因此需要对数据进行偏差校验。同时还有一些词的干扰,如微博内容:张老师让我转告你,下午三点开会。这里的张老师就不一定是博主本人。
偏差校验方法一:抽样调查
随机抽取一定数量R、Z、W、V、U、T、S中包含各词的实际意思与对应关键词是否相符,如果不相符,我们统计出有多少是不相符的,然后分析R、Z、W、V、U、T、S的误差率
我们从所有科目中各抽取一定数量样本Q,在没有找到合适的方法前姑且用百分比来计算误差,就是指样本中提到博主身份的次数P与样本数Q相比所占的百分比,然后得出校验值N=O(合计)&P/Q,最后得出博主最常用的身份(N)。
提到博主身份的次数(P)
校验后得出的值(N)
得到以上数据后,为使分析模型更科学,可以采用扩大抽样样本来核实校对。如果大家有更好的分析模型可随时与我交流,谢谢!
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

参考资料

 

随机推荐