钢铁元帅官网出手速度是怎么算的?除了思维i敏...

计算广告关键技术:他们怎么什么都知道?大数据文摘作品 转载具体要求见文末作者|面包包包包包包&修改|寒小阳&&&&龙心尘&上一期我们一起探索了(点击查看计算广告小窥(上)),本期文章是我们为读者带来的计算广告小窥专题的第二个部分大数据文摘会在明天,为大家分享最后一个部分的文章内容,供有兴趣的读者感受学习(上)(中)(下)全文目录引言广告=&互联网广告:您好,了解一下互联网广告=&计算广告:指哪儿打哪儿!计算广告四君子:谁在弄潮?计算广告关键技术:这孙子怎么什么都知道?广告系统架构:要啥自行车,这里有宝马手把手系列之教你搭建一个最小广告系统:mieSys&&5. 计算广告关键技术:这孙子怎么什么都知道?一句话解释关键技术:没声音,再好的戏也出不来广告作为一项商业活动,是需要资本来滋养的作为整个产业链的金主,只有广告主花钱做广告,使资金流动起来,整个广告行业才能正常运转所谓关键技术,就是那些能让广告主觉得这钱花的值,让媒体网站觉得这钱挣的快的技术具体都有哪些呢?下面我们一一来表5.1 合约广告关键技术:受众定向计算广告发展到合约广告阶段,媒体网站依靠受众定向技术给用户打标签,在实现了媒体网站广告位的时分复用的同时,还提高了广告主的投入产出比,极大的激发了广告主在互联网上做广告的积极性因此,受众定向是合约广告中的关键技术我们知道,只要描述物体的维度足够高,那么世间万物都是独一无二的在广告系统中,标签就是描述用户的维度媒体网站为了精准的刻画用户,标签的种类和数量自然也不会少为了更加直观地了解受众定向技术,我们从用户上下文和广告三个方面讨论打标签的思路和一般方法用户标签:主要用性别年龄收入地理位置教育程度和用户行为等标签来刻画用户,从而回答你是谁的问题上下文标签:主要用网页的地域主题和频道等标签来刻画用户当前所处的媒体网站环境,从而回答你在看啥的问题广告标签:主要用广告主广告创意广告计划和广告关键词等标签来刻画广告的相关内容,将广告内容与用户和上下文进行匹配后,从而回答你该看啥的问题5.1.1 用户标签关键技术对一个用户来说,性别是不会轻易变的,但是用户的喜好和兴趣却是时刻都在变化的根据标签属性的变化频率,我们这里私自将用户标签分为静态和动态两类静态标签主要指年龄性别地理位置收入和教育程度等这种不变或者很长时间之内都不变的标签,行话叫人口属性;动态标签则是指用户的浏览搜索和点击等能够反映用户短时喜好和兴趣的行为标签,行话叫行为定向(BT:Behaviroal Targeting)下面我们针对静态和动态这两类标签分别讨论一句话解释静态标签和动态标签的关系:价格围绕价值上下波动静态标签(人口属性)在计算广告小窥[上]中,我们曾简要地提到过一种受众定向的方法:通过对点击日志的分析,媒体网站发现点击过女性护肤品的用户又点击过媒体网站上其他女性品牌在女性用户对女性品牌可能更感兴趣的合理假设下,判断这些用户的性别为女,男性用户同理现在我们可以更加清楚的认识到,上述媒体网站所打的标签是静态标签中的性别,使用的是基于规则的方法,即:满足了某种条件,就是某种人这种基于规则的方法简单并且易于实现,但也存在着致命的缺点:基于规则的方法对数据非常敏感,若数据本身存在噪音(如误点击),那么标签的品质也将大打折扣这可如何是好?简单的不行,那就来点复杂的嘛用机器学习模型来实现(自带音效:当当当当,当当~~)假设我们已经知道一部分用户的真实性别,那么就可以用机器学习中有监督的二分类模型来预测用户性别首先,我们需要对原始数据进行清洗,合理地处理缺失值和奇异值,并划分训练集交叉验证集和测试集;其次,要在业务的指导下做特征工程,利用统计或模型的方法构造特征,并进行特征选择和特征组合;然后,我们要选择合适的模型(如SVM等),设置合适的评价标准并进行模型的训练;最后,通过模型调参和模型融合,获得性别预测模型动态标签(行为定向)一句话解释行为定向:唐伯虎喜欢如花多一些,还是凤姐多一些?如果一定要比较一下,那唐伯虎是喜欢如花多一些,还是凤姐多一些?这个看似荒谬的问题,正是行为定向要解决的如果唐伯虎是异性恋,那他应该是喜欢凤姐多一些的,否则是如花这也就告诉我们,在行为定向中,判断的标准至关重要下面我们借助一个例子来分析该用户的动态标签究竟是什么有数据显示,某用户在过去的三个月时间中,点击广告的标签和次数如下表所示:标准单反爱好者跑鞋爱好者饮料爱好者护肤品爱好者点击25421对上述数据进行分析,我们可以轻而易举的得到***:该用户的标签应该是单反爱好者,因为他的点击行为集中在这个标签上但是,这个***是我们以用户的点击行为作为标准得来的,如果以用户的浏览和搜索行为做标准,***也是单反爱好者吗?我们再来看一下相关数据标准单反爱好者跑鞋爱好者饮料爱好者护肤品爱好者浏览15200标准单反爱好者跑鞋爱好者饮料爱好者护肤品爱好者搜索71653是不是出问题了?以点击和浏览为标准,该用户标签应该是单反爱好者,但是以搜索为标准,标签应该是跑鞋爱好者如果该用户的标签只能有一个,那该选哪一个呢?为了解决这个问题,我们从数学角度分析一下好了嘿嘿,数学噢,前方高能预警!我会尽量让这个过程变得简单,大家跟上我的思路哈Step1. 泊松分布一句话解释泊松分布:猜猜我在哪儿~~~我们先来介绍下泊松分布啊啊啊啊!一上来就是数学,我不听我不听我不听,泊松分布是什么鬼?咳咳,那,那就先不丢公式了,咱们看图解决问题好了,下面是泊松分布绘出的曲线图,实际工程中要解决的问题就是找到图中的最高点,如下图:这个肉眼找最高点的过程不要太简单了!!!我们可以看到:图中最高点的纵坐标大约为0.36,而对应的横坐标是1OK,你就算会用泊松分布了哦!那个,感兴趣的同学们,可以一起来看看对应上图的泊松分布的公式公式相对于图,是有那么点点复杂啦不过,我们只需知道t影响泊松分布的形状,一个t对应一个泊松分布就可以了这个场景下要做的事情就是找到对应泊松分布图像的最高点Step2. 一个结论一句话解释这个结论:一个萝卜一个坑我们先说一个结论:在一个标准下,所有用户占有的标签,在所有标签上的概率分布是满足泊松分布的对于这个结论,有兴趣的同学可以参见Stanford Introduction to Computational Advertising讲义Page-81,我们在这里就直接拿来用了而所谓标准,就对应泊松分布公式中的t,在我们这里的场景下与用户行为有关这张图的横轴代表用户拥有的标签数目,纵轴代表兴趣标签数目为x的用户数目,比方说有1个标签的用户有500人,有3个标签的人有5000人从这张图中我们可以很清楚的看到,用户在所有标签上的分布是满足泊松分布的但是这里有一个问题,大量用户所呈现出的这种泊松分布,和单独用户的兴趣标签之间有关联吗?我们说,关联不大,因为一个是随机过程,一个是随机事件,想要得到每个用户的兴趣标签,其实是一个复杂的任务下面我们从统计和投票的角度入手,来看一种用户打标签的方法Step3. 最佳标准一句话解释最佳标准:盲人摸象盲人摸象比喻以偏概全,现在我们想要知道大象全貌,把每个人摸到的拼起来便是了在广告系统中,搜索点击和浏览三种行为数据都只能从一个侧面反映用户的行为,要想完整的刻画一个用户,我们需要将这三种行为融合起来之后找到一个最佳标准提到融合,较为常用的方法是投票,我们可以写出下列公式:简单解释一下:ti是标准,分别代表了搜索点击和浏览行为;i是标准的权重,即该标准对于完整描述用户行为的贡献我们用机器学习中的广义线性模型对该问题进行建模,模型训练完成后可得各标准的权重i,从而预测出最佳标准tStep4. 最终求解通过广义线性模型,我们找到了最佳标准t现在,我们根据该t画出相应泊松分布,如下图:回顾Step2中的结论:在一个标准下,用户在所有标签上的概率分布是满足泊松分布的现在最佳标准下的泊松分布我们已经画了出来,该用户在所有标签中的概率分布也应该符合这个分布的还是老步骤,我们找最高点所对应的标签,即标签5,所以该用户的动态标签是标签5,问题完美解决在学习了泊松分布和机器学习之后,媒体网站终于完成了用户标签的工作,看着那圆圆的饼图,流下了激动了泪水,哽咽着说嗯..终于..终于可以卖钱了..没错,流量可以变现了,互联网广告一脚踏进合约广告时代但是仅仅知道你是谁,粒度还是太粗,卖不了好价钱要是知道你正在干嘛就好了媒体网站嘴里嘟囔着,突然脑海中灵光一闪,大叫一声:(图片来自网络)5.1.2 上下文标签关键技术一句话解释上下文标签的做法:吃的是URL,挤的是标签我当然知道他在干嘛!我有日志啊!我有他正在访问页面的URL!啊哈哈哈哈哈!有了用户标签的经验,媒体网站处理起上下文标签来就显得轻车熟路了,总共分两步:第一,根据用户当前页面的URL,抓取用户当前浏览的页面内容;第二,提取页面内容的关键词,作为当前页面的标签通过URL获得页面内容是一个典型的爬虫应用,与搜索引擎的爬虫不同的是,广告系统的爬虫只抓取用户请求的页面,而非全网页面鉴于上述原因,广告系统使用半在线抓取系统,该系统有三个特点第一,仅对用户发起请求的页面进行抓取,节省了时间和成本;第二,将{URL:标签}存储下来,当其他用户发起相同页面请求时,直接返回标签结果,避免重复抓取第三,考虑到某些频道页面内容可能会更新(例如旧浪体育),还可设置合适时间,周期地更新已存页面的标签在抓取到页面之后,如何提取标签也有几种常见方法最简单的是利用规则,在URL层面上人为做映射,例如对应的页面标签就是旧浪体育若用户是通过搜索发起的页面访问,还可以根据搜索词作为页面标签当然,在广告系统使用范围较广的方法还是机器学习中的主题模型,得到页面内容在几个主题上的分布,从而判断页面标签例如,页面内容在体育财经和游戏三个主题上的概率分布分别为:体育财经游戏0.850.100.05我们可以很容易的看出的标签是体育这里值得注意的是,如果想要加工出体育财经和游戏这种可解释的标签,通常需要采用有监督的主题模型能用的数据都用了,能打的标签也都打了,知道了你是谁和你在看什么之后,媒体网站这才感觉踏实了些下面的工作就简单了许多,把标签卖给广告主就可以了,也算是一劳永逸,深藏功与名至于用户会看到什么,那是广告主的地界,就不管媒体网站什么事儿了5.1.3 广告标签关键技术普通的广告标签就是广告本身的属性,如所属广告主广告大小广告类别和目标人群等,当广告和用户两两匹配时,该广告就会展示给用户但是,这里我们想说的广告标签是在程序化交易中的个性化标签在计算广告小窥[上]中我们提到:程序化交易是广告主为实现个性化营销举行的海天盛筵品尝过个性化营销的甜头之后,广告主就想:既然这些人是回头客,那各方面表现和这些回头客很像的人,有没有可能也是我的回头客呢?世界那么大,我得去找找这种人look-alike一句话解释look-alike:比葫芦画瓢这个技术的名字还挺洋气呢,英文的,看起来像?说白了就是比葫芦画瓢,找到那些看起来像回头客的新用户,行话叫新客推荐这里一定要注意了,千万不能翻译成看起来像,那样显得逼格不够,就叫英文的,look-alike~关于look-alike的具体实现,市面上没有统一的做法,毕竟我们正在经历这样一来我的心也放下了,因为即便我下面都是胡扯也不一定是错的look-alike的核心是按着回头客的样子去找新用户那简单呀,看看回头客的标签是什么样子,对着去找相同的不就行了?没错,这算一种方法,并且是一种基于规则的方法但是直觉告诉我们这样做粒度太粗,没有充分考虑到广告主因素,同时经验也告诉我们,基于规则的不如基于模型的效果好,所以我们还可以得出一个基于模型的做法:将某用户是否是潜在用户建模成一个机器学习中的二分类问题,利用回头客数据训练模型,并在新用户上做预测,是就是1不是就是0,也挺好理解的受众定向关键技术我们就介绍到这里了,现在我们来回顾一下为了更加精准的刻画用户,我们从用户标签上下文标签和广告标签三个方面来介绍受众定向虽说角度不同,但总的说来,不外乎两种方法:基于规则和基于模型在受众定向技术的支持下,互联网广告进入合约广告时代在经见了在线分配的大坑之后,媒体网站发现合约不可保,便使用竞价方式售卖流量,指定广告主那在竞价广告中,又有什么关键技术呢?请看下一小节:竞价广告关键技术:点击率预估5.2 竞价广告关键技术:点击率预估郭德碗:聊(bi)了(bi)了这么久,想必衣食父母也都累了&于 兼:是有点儿&郭德碗:能坚持看到这儿的人不多&于 兼:东西太难&郭德碗:那就歇了吧,计算广告小窥到此结束!&于 兼:给我回来!像话嘛这个!&郭德碗:还想怎么着啊?&于 兼:说好的点击率预估呢?大伙都冲这个来的&郭德碗:真有冲这个来的?&(有!)&郭德碗:怎么不提钱跟我说呢?&(吁~)&郭德碗:好了,玩笑归玩笑,驴鞭归于兼,下面呀,我..&于 兼:您等会儿,那玩意儿归我干嘛呀?&郭德碗:嘿嘿嘿&(吁~)&郭德碗:你们都懂?&(吁~)&郭德碗:仁者见仁,污者见污哟&(下去吧~)我知道很多同学是冲着点击率预估来的,所以不能让你们白来不是,免费送您一小段儿,别跟我提钱哈哈等最后聊到最小广告系统,帮我贡献几次点击就行,我也好收集一些高质量数据,训练模型自己玩儿言归正传,下面我们将从是什么为什么和怎样做三方面来介绍点击率预估5.2.1 点击率预估是什么点击率一句话解释点击率:0.1%既然聊到点击率预估,那我们先来看看什么叫点击率点击率这个概念我们是第一次提起,但其实我们早就知道它了我们在计算广告小窥[上]曾经提到:自从广告上了互联网,广告的面貌就焕然一新造成行业巨变的原因,是因为互联网广告的效果可以被衡量如果接着往下说,以什么标准来衡量呢?没错,最常用的衡量标准就是点击率点击率(CTR:Click-Through Rate)是指的是媒体网站上某个广告的点击量/展示量之所以使用点击率来衡量广告效果是有原因的,先来看分母:分母是某广告的总展示量在计算广告小窥[上]中我们曰过,广告展示机会是广告主通过竞价获得的,展示机会越多,意味着广告主的出价越高,所以总展示量可以用来表征广告主的广告投入再来看分子:分子是总点击量,而点击行为代表了用户的注意力,说明用户渴望进一步了解广告内容因此点击率越高,意味着广告主在相同投入的情况下,收获了更多的用户注意力,完美诠释了广告主做广告的初衷,所以点击率是广告主和媒体网站常用来衡量广告效果的标准我听过一个数字,广告平均点击率为千分之一,也就是每展示1000次广告才会收获1次点击,所以点击率预估中数据都是很稀疏的点击率预估一句话解释点击率预估:80%了解了点击率,我们再来看看什么叫点击率预估从字面上理解,点击率预估是预测媒体网站上某个广告的点击量/展示量,然而这样理解并不是很准确,我先给出我的理解:点击率预估,是指预测特定用户点击特定广告的概率,例如小明点击某信二手车广告的概率是80%为什么对媒体网站广告点击率(0.1%)的预测,会变成了对用户点击某广告概率(80%)的预测呢,接着往下看啦5.2.2 为什么要做点击率预估一句话解释为什么要做点击率预估:钱在竞价广告阶段,广告主与媒体网站之间以按点击付费(CPC)的方式结算,因此我们可以用下列公式来表征媒体网站在某次广告活动中的收入:媒体网站收入 = (点击率 * 展示量) * 单次点击价格 = 点击量 * 单次点击价格我们知道,展示量和单次点击价格这两部分都是广告主参与竞价后才能决定的,与媒体网站无关,所以媒体网站的收入就与点击率直接挂钩在收益最大化的驱使下,媒体网站有提高点击率的动力点击率的定义是点击量/展示量,展示量又是广告主通过竞价决定的,因此媒体网站只能想方设法提高点击量对于媒体网站而言,他所拥有的资源就是页面上几个固定的广告位和海量的用户为了提高点击量,一种简单明了的想法就是让展示的广告尽可能多的被点击,即指哪儿打哪儿为了实现这个理想,亟需解决两个问题:首先需要知道用户感兴趣的广告有哪些,其次需要让用户尽可能多的点击这些广告第一个问题叫做广告检索,是指媒体网站根据用户的定向标签或其他方式检索出符合用户口味的广告候选集合这部分内容是搜索引擎的核心,在这里我们就不展开讨论了我们来看第二个问题,假设我们已经得到了一个符合用户口味的广告候选集合,如何能让用户更多的点击呢?很简单,把用户最可能点击的广告放在最显眼的地方,为了定量描述用户最可能点击的广告,这便引出了点击率预估的问题因此我们说,点击率预估并不是来预估媒体网站上点击量/展示量,而是预测某个特定用户点击某个特定广告的概率OK,那预估完干什么呢?刚才不是说了嘛,把最可能点击的广告放在最显眼的地方呀!最显眼的地方一句话解释最显眼的地方:你也是柳岩的球迷?为了较为直观地描述用户的注意力分布,我找了一张LinkdIn的用户注意力热力分布图(图片来自网络)图中,颜色越红代表用户注意力越集中可以看到,用户最关注的是页面的上半部分,其次是右半部分,最后是下半部分这种注意力分布基本我们日常的浏览习惯,即如果能在页面靠前位置找到我们所需的信息,一般就不会再关注页面其他地方了解了注意力分布,我们来看一下某度搜索页面上的广告位分布某度广告位主要分布在北区东区和南区三部分,以LinkedIn页面中的用户注意力分布来推测,用户在某度页面上注意力分布从高到底分别是北区东区和南区假设某度共有10个广告位,那么将用户最可能点击的10个广告按照点击概率由高到低顺序分别排在北区东区和南区然后还干嘛?没有了,万事俱备,只欠点击不知道您听明白了没,我来帮您捋捋为了提高媒体网站的收益,我们结合业务场景不断简化问题,从提高媒体网站点击率入手,到提高总点击量,再到获得广告候选集合,预测出了用户点击广告的概率仅仅预测点击概率媒体网站还赚不着钱,因此媒体网站根据点击概率在页面广告位上对广告进行排序所以为什么要做点击率预估呢?都是为了钱!都是为了钱!都是为了钱!5.2.3 点击率预估怎么做一句话解释点击率预估怎么做:使尽浑身解数,只为更懂你自计算广告学诞生以来,点击率预估就是一个在学术界和工业界被广泛研究和实践的课题剥去种种具体场景,点击率预估的本质其实还是一个机器学习中的二分类问题一般来讲,媒体网站点击数据的数学分布是非线性的为了拟合这种非线性关系,学术界侧重于模型的研究,工业界侧重于特征的构造,双方优势互补,已取得了相当丰硕的成果下面我们将先介绍展示广告和搜索广告这两种互联网广告的主要形式,然后阐述二者在点击率预估问题上的不同之处,最后介绍一些点击率预估的方法展示广告展示广告(Display Advertising)是一种以图片+文字的方式进行广告宣传的互联网广告形式从广告触发方式来看,展示广告是媒体网站根据用户历史行为所做的推荐,对用户而言广告是被动接收的,如下图搜索广告搜索广告(Sponsored Search)是一种以标题+超链接的方式进行广告宣传的互联网广告形式从广告触发方式来看,搜索广告是媒体网站针对用户当前检索所做的广告匹配,广告是用户主动发起的,如下图根据上面我们对展示和搜索广告的描述,我们可以对两种广告形式的点击率预估有一个浅显并直观的认识:展示广告的点击率预估可以看作是一个推荐问题,根据历史记录推测用户对哪些广告更感兴趣;搜索广告的点击率预估可以看作是一个检索问题,根据用户当前的查询来做广告匹配前者推荐后者检索,问题性质的不同也决定了点击率预估所采用方式的不同点击率预估方法有关展示广告和搜索广告的实现算法和应用细节都是各家互联网公司的商业机密,由于场景的不同,各家对点击率的预估也是八仙过海各显神通作为一个没有实战经验的小屁孩儿,想要较为流畅地阐述这个话题,还是力不从心,毕竟眼界太窄太年轻为了保证文章结构的完整,这部分还必须要写,那么我就抛开业务场景,仅从机器学习角度来和大家聊一聊我所知道的内容写的不好,还请各路大神多多指教,如有不当指出,请严厉指出,我定感激不尽!上面我们提到过,从用户浏览网页到广告获得展示,要经过三个阶段:用户定向广告检索和广告排序用户定向和广告检索就不多说了,最终在广告库中可以找到符合你口味的广告,即万里挑十在广告排序阶段,需要将这十个广告位放置在页面上,通常做法有两种,一个是基于规则,一个是基于机器学习我们这里从机器学习的角度入手,但是各位千万不要忽视了规则的能力聊到机器学习,主要就是两方面,特征和模型下面我就根据我所了解的内容,重点介绍一下线性模型+海量特征的方法,然后简单介绍一下点击率预估的发展&1&线性模型 + 海量特征用于点击率预估的数据主要是日志数据,一般会有点击行为(点击为1,没点为0)广告信息(广告位广告主id广告标签和广告描述等)用户信息(用户id和用户标签等)上下文信息和时间戳等有了这些原始数据之后,需要对数据进行清洗,然后利用统计或模型的方法构造特征,进而做特征选择和特征组合,最终特征的数量级大约在10亿-100亿维完成了特征工作之后,在模型方面,较为经典的点击率预估模型是线性模型Logistic Regression,由于LR在通过sigmoid之前是一个[0,1]之间的浮点数,利用LR的特点,我们可以将这个浮点数作为用户点击该广告的概率,把广告按照这个概率从高到低放置在相应广告位上,就完成了广告排序为什么要造出维度这么高的特征向量呢?我的理解是这样的对于点击数据来说,点击行为与其他特征之间的关系是非线性的,为了拟合这种非线性关系,我们依然可以从特征和模型两方面入手通常来说,非线性模型的效果要更好一些,但是效率太低,不适合工业界的现实场景,所以快速简单的线性模型就成为了模型的首选那线性模型如何拟合非线性关系呢?这就需要在特征层面做文章,利用特征工程的方法来构造出高阶特征,同样可以实现非线性这个思路理解起来还是不难的,如下面两式对比:&2&点击率预估的发展为了构造出维度如此巨大的特征向量,特征工程几乎占据了70%的项目时间,并且主要是靠努力的程序员人工来实现的那有没有自动选择特征的方式呢?ADKDD14有一篇Facebook的paperPractical Lessons from Predicting Clicks on Ads at Facebook提出了一种使用GBDT自动选择特征的方法,用每棵树上的叶子节点来表达特征,比如{1:2, 2:3}指的是第一棵树上第2个节点和第2棵树上第五个节点,根据每棵树的节点个数用one-hot表示即可多说一句,GBDT选特征的方法已经经过实践验证,在Kaggle-Criteo点击率预估大赛中,冠军的解决方案便是GBDT+FFM的方法获得的说到FFM,它是FM的一个变种FM(Factorization Machine):因式***机是最近比较火的一个模型,这个模型可以挖掘出特征间的非线性关系,并且可以在O(n)的时间内完成计算,非常吸引人最后就是深度学习了,在视频图像和语音领域有较为突出的成果最新的听说MSRA出了一个152层的网络,OMG国内在广告领域应用深度学习最早的应该是百度凤巢,低于10层,经过多轮迭代之后效果初显我自己也在探索阶段,期待能有好的结果,这里就不多说了点击率预估环节到这里就结束了,以上内容不知是否和您心意部分内容可能需要一些机器学习背景,对此感兴趣的同学可以加入我们的QQ群(初学者,行业同学和研究者),我们共同讨论好累呀,卖个萌再往下面写吧(图片来自网络)5.3 程序化交易关键技术:出价策略在上半部分中,我们曾经介绍过程序化交易中的参与者,除了用户外,主要还有代表媒体网站利益的SSP代表广告主利益的DSP和小三ADX通俗来讲,SSP是管仓库的,ADX是管传话的,DSP是管花钱的,现在我们要开始聊程序化交易中的关键技术,您觉得我们应该把目光放在谁上面呢?已经讲到现在了,我们要收起情怀,统一思想,当然是要重点关注DSP啦!你可能会想,花钱谁不会啊,这要啥技术?没错,花钱是没什么难的,但对于广告主而言,花钱做广告是一种投资,本质和风投股票文玩楼盘高利贷没什么区别,追求的就是高的投入产出比,真刀真***的动起钱来,弄不好会走火入魔的这钱,您还敢花吗?敢啊!要是不敢我还怎么写博客嘛,哈哈哈哈哈~~~花钱不要紧,只要能挣就行了呀!那我们就来聊聊如何才能挣的比花的多吧5.3.1 出价原则上面我们提到,广告主花钱做广告实际上是一种投资行为,既然是投资,就要对风险进行评估具体到DSP来说,投资是指广告主投钱给DSP,让其参与实时竞价,期望获得良好的广告效果(点击/购买/注册/下载等);风险是指钱花了,但由于效果太差,没见着收益为了规避风险,获取较高的投入产出比,DSP在出价时需要进行风险评估,即预估本次广告展示机会所能带来的收益,以此作为出价的参考在出价时,要注意以下几点原则,可能并不全面,还请行业内的同学补充预算限制:广告主一次就给这么多,超了算你的时间限制:到时间花不完就收回去了花钱为主:都说了是投资,能花了就别留着见好就上:出价与流量品质成正相关这些出价原则理解起来没什么难的,但我想要着重说一下第四条见好就上,这才是最关键的部分如何定义流量品质,又如何出价呢,好戏马上开始5.3.2 如何定义流量品质?所谓流量品质,就是在此时此刻此情此景,用户点击广告能为广告主带来的收益,主要分为两部分:一是点击率,二是点击价值点击率的预估就不多说了,和媒体网站上点击率预估是类似的,只不过在实时的场景下要求会更高一些点击价值是什么意思?刘鹏老师在计算广告中这样解释道:(有部分修改,括号内容为我的解释)点击价值可以***为到达率转化率和转化单价三个量的乘积到达率是指实际打开广告次数与点击次数的比例,这与广告主网站的页面你打开延迟关系最大,与媒体的属性特别是误点情况也有一定关系;转化率指的是到达广告主页以后,有多少比例产生了广告主定义的转化行为(购买/注册/下载等);转化单价是指广告主指定的转化费用(即DSP做一单能挣多少)上述三个变量中,到达率和转化单价都是很好统计的,只有转化率的预估是比较困难的转化率预估的方法可以参照点击率预估,但是由于转化数据要比点击数据少得多,除非是在有充足行业数据支持的情况下,否则用机器学习方法建模有较大困难实践中比较可行的办法基本上都是简单统计与运营经验相结合来估算转化率5.3.3 如何出价?终于进入到了最核心的出价环节按照见好就上的原则,出价与流量品质成正相关那到底是采用线性策略好,还是非线性策略好呢?我们来仔细分析一下线性出价策略我们在CTR预估阶段提到过用户注意力,广告位这个物理因素对点击率的影响是十分显著的我曾看到过一个数字,同样一个广告,把它放在第一位所获得点击率是放在第二位时的两倍若采用线性出价策略,DSP在出价时就有必要出两倍于第二位的价格去参与竞价这个思路很好理解,感兴趣的同学可以参照KDD12的paperBid Optimizing and Inventory Scoring in Targeted Online Advertising非线性出价策略非线性策略是我想说的重点,主要是想借着这个机会介绍一下限制条件下的优化问题以及其解法,这对于我们做科研或者工程项目都是很有帮助的,下面我们通过KDD14Optimal Real-Time Bidding for Display Advertising一文来了解一下非线性出价策略的来龙去脉以下内容是我对这篇paper的个人理解,可能并不到位,既然写出来就不怕大家笑话啦,有错就改嘛嘿嘿&1&. 文章大意实时竞价的场景中,在预算限制条件下如何设计出价策略是我们关注的焦点为了实现这一目标,分为三步第一,将现实问题用数学方法建模为限制条件下的优化问题,并通过拉格朗日乘子法,求得出价策略的数学表达式;第二,利用品友RTB出价算法大赛的数据拟合出价策略中的参数;第三,验证结果,发现了一个有意思的结论:相比少量高品质的展示机会,那些大量低品质的展示机会同样可以具有较好的广告效果,值得出价这个发现对于那些预算不够,同时又想做广告的小广告主来说,简直就是福音&2&. 建立模型在一切开始之前,让我们先考虑清楚要解决的问题是什么,简单来说就一句话:选择合适的出价策略,在预算的限制下实现广告效果最大化,用数学语言描述就是下面这样:我靠!这一堆是什么玩意儿!你TM在逗我?淡定看不懂就对了啊哈哈哈哈!下面我来做一下简化,告诉你这个模型在我眼中长什么样b()ORTB=argmaxb()一大坨&!subject to&又一大坨&!&B这下是不是好多了?反正我第一次看到这个模型就长这样,把积分部分当作一大坨,就很容易看懂了这个模型一共有两个公式,我们一一来看b()ORTB=argmaxb()一大坨&!第一个公式是一个等式,等号左边是我们想得到的出价策略函数b()ORTB,等号右边是argmaxb()&跟上一大坨,这里argmaxb()的意思是:当后面一大坨取最大值时,返回在最大值情况下的那个b()将等号左右两边连起来,这个等式所表达的意思就是:当后面一大坨取最大值时,返回在最大值情况下的那个b()作为我们要求的出价策略b()ORTB这个思路是不是有点眼熟?没错,在前面合约广告关键技术受众定向中,讲到用户动态特征时我们对泊松分布的处理方式有些类似综上所述,对于这个等式而言,我们要做的工作就一个:求最大值subject to&又一大坨&!&B第二个公式是一个不等式,subject to是受限于的意思在这里,又一大坨&!&B想要表达的就是一个限制条件,在等式求最大时插上一脚还记得我们在高中时学过的线性规划吗,一样的道理现在我们的任务已经明确了:在限制条件下求等式最大值那么这个数学任务和我们的实际问题:选择合适的出价策略,在预算的限制下实现广告效果最大化是怎么匹配上的呢?这就需要去看那两大坨了那一大坨全都是各种符号,我们看不懂,所以需要一张符号对照表,如下图为了方便,我再把模型公式再贴一次有了符号定义和模型,我们开始聊(啃)一聊(啃)这两大坨吧先看第一坨,我们从右往左看dx:x代表一次bid request,是ADX发给DSP的竞价请求标识XXX,男性,20-25岁,跑鞋爱好者,广告位为首页,即一次广告展示机会之所以是dx而不是x,是因为我们关注的是整个广告推广计划中所有的竞价过程,而非某一次竞价px(x):广告展示机会的概率密度分布,我的理解是在全网所有的竞价中,满足我DSP要求的或者是我能收到的bid request所占的比例因此,px(x)dx的物理意义是我能收到的展示机会(x):是赢得此次竞价所能带来的收益(KPI),本文用CTR来衡量,CTR越高,收益就越高b((x),x):对于此次展示机会,在能带来收益为(x)的情况下,我所出的价格bid(b((x),x),x):对于此次展示机会,在能带来收益为(x)的情况下,我的出价bid能获胜的概率是多少因此,的物理意义是对于本次我所收到的这个展示机会来说,在该机会能带来收益为(x),我出价为bid的情况下,我能打败对手获得此次展示机会的概率的物理含义是我出价为bid,赢得这次展示机会后,所能获得的收益NT:一次广告推广活动中所有的bid request有了上面的解释,我们可以很容易的得出第一坨的物理意义:对于一次广告推广活动中的所有竞价,我使用b()的出价策略所能获得的收益和等式连起来,即:对于一次广告推广活动中的所有竞价,我使用b()的出价策略所能获得最大收益时所对应的b(),就是我们想要的出价策略有了第一坨的经验,第二坨啃起来就容易多了前面都不变,只有到最后把其物理意义为:对于这次广告展示机会,我出价为bid且赢得这次展示机会所花费的预算所以对于整个广告推广活动而言,所有的出价要小于预算就这样,我们顺利的将预算限制写进了数学模型里好了,分析完两大坨积分的含义之后,我们合起来解释一下该模型(ORTB)所表达的物理意义:在整个广告推广活动中,在出价总和小于预算的限制条件下,当广告收益取得最大值时所对应的那个出价策略,就是我们梦寐以求的出价策略b()ORTB再来对照一下我们的任务:选择合适的出价策略,在预算的限制下实现广告效果最大化这下匹配了吧!完美!(图片来自网络)&3&. 模型求解截止到目前,我们已经得到了模型表达式,由一个等式和一个不等式组成接下来我们就要开始求解了:求最大值最大值有什么好求的?让导数等于0之后带入极值点不就完了?你说的对,如果只有一个等式我们是这么求的,但问题是我们现在除了一个等式,还有一个不等式,这种情况下怎么来求最大值呢?用拉格朗日乘子法通过拉格朗日乘子法,我们可以将不等式乘一个参数后和等式写进一个公式里(化简过程已省略),得到如下结果有了这个公式,我们就可以对它进行求导等于0了,可得如下结果:通过化简,可得出价函数b()与胜率函数w()的关系:也就是说,我们想要的出价函数b()与胜率函数w()有关,那我们就来看看他们之间到底有什么关系通过对数据的统计,可以画出出价函数b()与胜率函数w()的关系图像:从图像中我们可以看出,出价函数b()与胜率函数w()的关系是非线性的,并且这个曲线的走势和y=xc+x很像,我们来对比一下,这里c=3没错,的确很像基于此,为了达到消元的目的,作者做了一个出价函数b()与胜率函数w()之间的假设,仿照着y=xc+x得到下面公式:将出价函数b()与胜率函数w()的9式关系带入到倒数为0的7式中,化简可得:就这样,我们得到了我们的出价策略bORTB()的表达式(公式13)我们来看看这个公式里有什么这个公式是由,&c和组成的,其中c和都是常量,只有一个变量c是出价函数b()与胜率函数w()之间的系数,是拉格朗日乘子,而是每次广告展示的收益,按CTR高低来评判我们来验证一下:CTR越高,由该策略算出的出价也就越高,符合我们的预期,大功告成我们来梳理一下思路在建模环节,我们已经得到了我们所需的模型:一个等式+一个不等式我们的任务是要求等式的最大值,通常方法直接对等式求导等于0即可,由于我们这里是一个限制条件下的优化问题,所以需要用到拉格朗日乘子法,将限制条件写进等式中,构造出一个新的公式(公式6)对于新的公式,我们就可以用求导等于0了(公式7)在化简过程中,我们发现了出价函数b()与胜率函数w()存在着数学关系(公式8),为了消元,我们按照实际数据的分布构造出出价函数b()与胜率函数w()的表达式(公式9),将公式9带入公式7,继续化简就得到了我们的出价策略:bORTB(),剩下的工作就是根据数据去拟合和c即可,这里就不多说了这里需要强调的是,这种限制条件下的优化方法在统计与机器学习中是很常见的,例如SVM的推导过程,感兴趣的同学可以试一试,其实并不难&4&. 结果分析既然有了公式,那我们就来看看ORTB的出价有什么特点吧我们可以很直观的看出,我们所得到的出价策略是一个非线性的横坐标代表了广告展示计划的品质,ORTB会对低价值的展示机会出高价,这样的结果能为我们带来什么,谁会去要那些低价值的展示机会呢?我们来看下面这张图在此图中,我们盯着一条曲线看,比如蓝色的(1/32)随着增加,收获的点击量是增加的,意味着越高,我们的收益越高对于我们获得的出价策略而言,越高,我们的出价是越低的,也就意味着这次展示机会的价值是很低的这样的结果值得我们深思,我们以为低价值的展示机会是不值钱的,但数据说明,这些看似不值钱的展示所能带来的回报还算不错特别地,在=1e-05时三条曲线的几乎重合,而红色代表有钱的广告主,蓝色代表穷广告主,虽然预算差了16倍,但是获得的收益是相同的,这个结论对于预算有限的小广告主而言,是个天大的好消息:虽然我们钱不多,但只要我们出价合适,依然可以收获很好的广告效果,四两拨千斤,极大的调动了小广告主参加程序化交易的积极性我们知道,二八原则是客观存在的,在广告主中也不例外,如果能吸引这80%的小广告主参与程序化交易,玩家一多,需求自然更多为了满足金主的需求,势必会推动相关计算技术的发展,这对于计算广告的未来而言,是一件好事讲完了非线性出价策略,程序化交易中的关键技术也接近尾声了出价策略之所以重要,是因为就是DSP赖以生存的看家本领,没有这些真本事,DSP是走不了多远的到此,计算广告关键技术就讲完了,啥也不说了,给自己鼓个掌吧(图片来自网络)历时大半个月,中间又加上过年,终于把这章给写完了,没想到这一章的内容要比上半部分全文都要多在本篇计算广告小窥[中]这孙子怎么什么都知道中,我们从理论的角度探讨了计算广告各阶段的关键技术:在合约广告中,我们讨论了受众定向技术,从用户上下文和广告主三个方面简单介绍了打标签的常用思路和方法,为计算广告实现精准营销打下了坚实的基础;在竞价广告中,我们讨论了点击率预估的来龙去脉,感受到了互联网人的智慧,为媒体网站流量变现提供了直接保障;在程序化交易广告中,我们通过学术论文了解了当下学术界领先的DSP出价策略,近距离地感受了一下科研的魅力曾有人叹息到我们这一代最聪明的人竟然都在这里思考着怎样让人们去大量的点击广告,真衰我个人不认同这种说法,因为在计算广告这样复杂的场景下,相关技术和解决方案的水准必然是顶尖的,稍加修改即可解决其他场景下的疑难杂症,这恰似军工技术反哺民用,又恰似女生随手甩一个不要了的护肤品给男生,那可都是宝受篇幅所限,原定于本篇要完成的第五章和第六章只好放在计算广告小窥[下]广告系统架构:要啥自行车,这里有宝马中来写了在下篇中,我们将介绍一个通用的广告系统架构,在领略在线和离线过程的同时,还将见到时下工业界最火热的技术,譬如Nginx,Hadoop,Spark等在计算广告领域的位置与应用除了广告系统架构,我还将介绍一个我自己搭的最小广告系统mieSys,可以先放出来给大家玩一玩,链接是http://115.159.33.50/使用方法:用户点击页面中广告,等一段时间后刷新页面,在页脚处会显示用户的兴趣标签和性别,在第一行五个广告位中会展示符合用户口味的广告需要注意的是,由于目前缺少点击数据,CTR模型并不准,为了保证演示效果,暂时只能用离线代替在线,所以您在点击过后预计要10分钟(用户多的话甚至更长)才能看到页面效果,我后期会进行优化,还望轻拍,效果图如下,第一张为默认页面,第二张为结果页面这个系统是我用大概20天的时间搭成的,目前来说基本的功能都有,但还是太简单,并且算法没有优化,我会逐步的往上面添加模块和算法,目前思路已有,就差各位为我提供点击数据了[嘿嘿嘿嘿???]如果您发现mieSys挂了,不是用户太多就是我在调程序,在系统成熟的时候我会选择开源,愿意与有兴趣的同学多交流哦对了,至于为什么起名为mieSys,因为我女朋友属咩,呵呵哒~好了,我们计算广告小窥[下]再见!&&后 话对相关内容感兴趣的同学,还请参阅刘鹏和王超老师所著计算广告,有更精准的定义描述与更详细的讲解到这里,计算广告小窥[中]就结束了接下来的部分还会介绍一套通用的广告架构,并亲手实现一个最小广告系统计算广告小窥[下]将在明天在大数据文摘陆续推出,敬请期待作者的话:提笔写这篇博客,我的内心是惶恐的原因很简单,作为一个资历尚浅的研究生,是没有资格对计算广告这样一个伟大的行业领域和学科来评头论足的之所以这么做,一是总结自己已掌握的知识,二是降低同学们的学习成本本人能力有限,更缺乏实践经验,文章内容多为书籍和论文的读后感,若有不当或者错误之处,还望各位同学指出,我定悉心求教在此,向编写计算广告的刘鹏和王超两位老师致谢,向各位paper作者致谢长按以下二维码将直接跳转至QQ加群或者通过群号码进群关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘|bigdatadigest),并在文章结尾放置大数据文摘醒目二维码无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送文章名称-待授权公众号名称及ID给我们申请白名单授权未经许可的转载以及改编者,我们将依法追究其法律责任联系邮箱:&&作者介绍[关于原作@(曾宪超)]海淀区明光村计算机职业技术学院,研二学生关注计算广告点击率预估和竞价算法,关注机器学习和深度学习,初学者&&往期精彩文章推荐,点击图片可阅读计算广告的四种形式:谁在弄潮?数据分析真的能驱动用户快速增长吗?案例如何用数据驱动产品和运营数据科学中专业化意味着什么该作者最新发布网友推荐的文章最新发布的文章@ 钢铁元帅为什么有些牛逼的玩家一开打士气是满地直接放合围包抄_百度知道批判性思维是创造思维过程_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
批判性思维是创造思维过程
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
你可能喜欢如何评价胡清平和他的 iCourt?
一开始是法律英语培训起家的吧,当时感觉颇山寨。但现在进军诉讼可视化又有刮目相看之感了。不知道大家怎么看?
关注了他的公众号和微信,但没上过课微信朋友圈里整天这里培训那里上课如果只是把诉讼过程列个图表搞个ppt,完全不能理解有什么好吹牛的跟工厂流程图一样只能给客户普法法官看得顺眼点你说对打赢官司的影响力有多大嘛~我觉得跟脑白金差不多效果期待知情人士打脸=======&===================看完鹤卿的***通篇没点干货,除了说这个课好,很好,老师好牛有理想就没别的。你说你有时间一定去还问我为什么?我为什么要知道你要去的理由。如果参加培训就是这样的效果,我觉得还有很大大的提升空间啊。期待打脸
“i-Court是律师的法学院”,请先理解胡清平提出的这个口号,然后才能理解i-Court的本质。i-Court是胡清平大概在2013年下半年左右开拓出来的一个东西(时间可能记不太清了),在此之前,我对胡清平的印象,大概也就只是2012年左右关注了他的新浪微博,那时他的微博名字叫”法律猎头胡清平“。我当时之所以关注这个微博,主要是因为临近毕业,想看看猎头们想找的是什么样的人才,仅此而已。但他后来基本没怎么发消息,而我也不怎么玩微博了,淡淡的对他也忘了。毕业后来到深圳工作,去年年底,我们律所给我们提供了一个i-Court可视化课程的培训(是公开课程之外的专场,所以在他们的微信号上看不到),我软磨硬泡跟老板求了一个名额,参加了这个培训,感觉很有收获。这个培训,说简单也简单,无非是教你用软件(visio等)做个图,除此之外,还附带教教excel。但我依然要说,这个培训diao,很diao,非常diao。为什么呢?因为他做到了其他人想不到的事情。(注意,不是做不到,只是想不到)以”可视化“这门课程为例,他其实并不是教你做PPT,而是教你用visio画图。画图的意义也并不在于”炫“,而在于让你用图表的形式传递你的观点。做过律师的都知道,在面临复杂案件的时候,法律关系分析、案件事实认定、法律研究、证据收集与整理……真的是会让任何一个人抓狂!那酸爽,谁来谁知道。但与之相对应的是,庭审时间是有限的,而且法官在开庭前基本是不会阅卷的,在此前提之下,如何确保庭审效果?或者换句话来说,如何在有限的时间内,让法官理解并接受我方观点?或者说得再直白一点,如何把律师的脑子放到法官的颅骨中去?传统律师的方法,是写代理词。但代理词只能庭后提交,没有办法在第一时间给法官以直白的印象。而且, 冗长的法律文书本身就长了一副苦瓜脸,真的很难让人有兴趣去看,即便是法官。但以i-Court课程中提供的样式来看,其实官司还可以这么来打。苹果诉三星外观专利侵权案此案的要点就是,三星手机的外观设计有没有抄袭iPhone。对于传统律师而言,打这种官司的要点就在于疯狂罗列专利***吧。但苹果律师告诉我们,官司还可以这样打:在庭审过程中,苹果律师上了这样的一张图:法官瞬间就硬了有木有!这尼玛,谁一看都会觉得是三星在抄苹果好吗?互联网的”有图有真相,无图言杰宝“,在庭审中,其实也同样适用。法官也是人,法官也喜欢看小黄图(雾……)说实话,要不是i-Court提供了这么一个思路,还有那么多个成功的案例,有几个律师想得到这么玩?即便想到了,又有几个律师敢在庭上这么玩?法律,是一个很封闭的圈子,内行人出不去,外行人也进不来,律师这一行,尤甚。这个圈子,天生的排斥新技术。不要说excel、visio,就我所见,有的老律师连word都不太熟。如果遇到复杂的案子,什么整理证据啊,做卷宗啊,全特么的,靠人力!效率多低?在这个时候,i-Court站出来,告诉你,其实有个软件,可以帮你。其实有一种思路,你可以借鉴……在这个时候,作为一个年轻律师,你高不高兴?激不激动?所以我要说,感谢i-Court,是他们让诉讼变得如此好玩。
学习本身意义其实不大,更像一个交流的平台。见仁见智了。
这么说吧,我一个同学,没做过一天律师,硕士一毕业就去icourt工作了,整天在朋友圈发图去了哪儿哪儿,天南地北,满满正能量。说实话,看起来略像传销,当然这么说有点不负责,但是我有点疑问,您一天律师也没做过,凭借ppt上学到的知识,就能给律师上课了?不信。怕被认出来。有点虚,匿了。更新一下,据说那位同学每天特别忙,年薪20万,硕士学历。第一年工作。他的同学给他打***,不是在工作,就是在睡觉。嗯,所以干这个还是超级累的。
非常抱歉这么迟才来更新。实在是特别忙,中午订了KFC节省了去食堂吃饭的时间赶快上来写一些自己的看法。今天更新的内容肯定是有限的,对不住楼下留言占座的朋友。但我会慢慢把想说的写出来,算是给自己和诸位等待更新朋友的交待。其实“如何评价胡清平和他的icourt?”这个问题有两个层面,一个是“如何评价胡清平”,一个是“如何评价胡清平的icourt”。胡清平其人。胡清平是万法通学院的创始人,这个学院的主要方向是教育培训,尤其是法律英语方面的培训极其实务(还有一个前期免费的拳头产品下文详述)。我有幸报名了法律英语“最后一次”面授课程,和很多老师(律师)有了近距离的接触,尤其对专业又帅气的乔焕然律师印象深刻……说远了,回到胡清平。因为万法通学院的教育背景和胡清平的创始人身份,我私下里称他为胡老师或者胡校长。我个人认为,胡老师是一个理想主义者,是一个可爱的人,和他在一起会感到非常放松。他的那些有趣、轻松、引人入胜的培训技术在法律培训领域真的是别具一格。在各场培训中,计算机和法学双学位的胡老师总是会讲到“技术驱动法律”这一梦想,也会让我们就“Law is a craft.Law is an art”展开讨论,还会自嘲和老外互学语言结果回国的老外被认为汉语中带有湖南腔。关于如何评价胡老师,我自认没有什么资格,这里找到一个链接,故事性和可读性很强,大家可以自己了解:。下面进入icourt。icourt 面世不久(一年半?记不太清楚了,查完资料再确认。但他的前身是前期免费的“商业律师(法务)集训营”,有了很多年头我免费蹭过多期),主要针对的是诉讼业务。但说实话,我现在已经不太了解了。我只参加过其中的第四期“可视化技术”专场,因为更新和升级的速度太快,后面的一些课程没有参与就无法妄评了。就我参加的这期icourt而言,是远远超出我的预期的。他贴近法律工作者(包括我在内的一些法律小白和一些令我仰视的法律高手)的真实需求、提供系统且经验证的问题解决方案,是站在业务能力相当成熟律所和法官的肩膀上加之自己团队的不断完善和挖掘,创造出的截至目前为止,我所参加过的最好的法律培训(也可能是别的法律培训我参加的较少)。十一期间加班,趁机小更一下。icourt不是万能的,这是我们讨论的起点。就我理解,法学院的学习重点在于“法学知识”,icourt的学习重点在于“操作技能”。关于法学知识(输入,what)法律人,要么学过几年法律,要么考过了司法考试,要么在法律行业工作,更多人兼而有之。如果仅从法学知识本身来说,icourt没有什么作用。他无法帮你夯实理论基础,也帮不了任何人通过司法考试。如果想获得法学知识上的精进而选择icourt,此君必定令人侧目。关于操作技能(输出,how)知识通过使用来体现价值。如何使用,某种程度上决定了效能,即所谓“事倍功半”或者“事半功倍”。但是如何使用知识,国内法学院的老师们恐怕没怎么教。怎么写起诉状答辩状代理词,怎么搜集证据排列证据提交证据,怎么说服自己说服当事人说服法官?这些,老师没太用精力教,却是工作中最常用的技能。需求和供给出现了不匹配,为了达到平衡,要么消灭需求,要么提高供给。聪明如楼上诸位,你们如何选择呢?icourt提供了解决这类技术问题的方案。据我目前所知,icourt主要是针对诉讼的培训,现在有图表、出庭、证据、谈判这么几个课程。这些课程以“说服力”为核心,让我看到并学会了一种经过实践检验的新方法,对我而言,他就有价值。当然,条条大路通罗马。解决技术问题,icourt并不是唯一的选择。只是,在这个时间,我只看到了icourt可以立即填补我的需求,我只体验到了他的效果。以上是我的浅显看法。
个人非常赞同暂时得赞最多的某“匿名用户“的回答。下面也来附会一下相似观点,在本帖中以楼主自称吧。确实,以楼主的观点看,胡清平及其主打的icourt确实没什么好牛的。说实话,楼主也不喜欢这个人,所以喷楼主个人情绪化严重,回答不客观,楼主也默认你说对了吧。总而言,胡的课程,一是新颖,二是内容少,三是见不得光,四是没什么可神气的。not long ago,楼主know about lawspirit by chance,当时只是知道有这么个东西,没深究,也没更多关注。后来,有次见到胡本人,胡被旁边的人呼为大神,”终于见到胡清平大神了“(旁边某人的原话),楼主甚为惊诧,怎么回事,这个胡某人是何方神圣啊,还是大神,楼主一头雾水。没办法,楼主身在信息闭塞的大武汉,对胡搞的若干法律培训课程从未耳闻,这个确实是楼主信息闭塞,关注行业动态是应该的,可惜在武汉不花心思关注是看不到这类信息的。事后,楼主知道lawspirit、万能法学院、还有什么icourt原来都是一个人搞的。本来对lawspirit是有些敬意的,结果看到后面种种情况,对胡清平老师的好感就全无了,赚钱就赚钱吧,不要把理想做晃子,也不要把理想当盾牌好吗。胡推出的可视化诉讼、法律MBA、法律互联网思维等课程,有一些了解,但没上过。如果喷楼主,没上过课程,凭什么跑来乱喷,好吧,如果你这样问,楼主还是默认你是对的,不凭什么来喷,只是吐糟句个人观点,都告诉你了没听过他的课程,下面的话,不爱看别看。关于白手起家做培训模式,很多人都会想到先以公益或不以公益为名,做些免费的,这些免费课程质量还不错,然后攒些名气后,就开始以理想、公益等等为名变法敛财,其实想赚钱,一点问题没有,楼主只是看不惯,挟着种种理想、公益,甚至在法律圈还有正义的名义去敛财,真心看不惯。胡的培训机构,发展模式不是这样的吗。受不了那些跟他一起大呼小叫说理想的人,特别是部分做律师的,你们什么心态呢。与此相关的,天同律所,楼主也不清楚为什么天同跟胡走得很近,但天同的理想楼主还是比较认同的,至少天同在拓展自己的商业模式中,让不少人受益了,而且是免费受益或以较高性价比的方式受益的,而胡清平的课程,真是鲜见有任何免费的东西发出来。即使是今天,纵观万法通的网站,能找到一点免费的东西吗,能有一块是分享给大众的吗,论其社会价值,比众多以盗版为生的各类网站小太多了,原创的东西是就不能大众分享么。再观百度icourt,搜索”如何评价胡清平和他的icourt?“,出现的第一条是胡清平的微博,好吧,楼主知道胡买了百度的词条广告了,买就买吧也不是不可以,再多百度下icourt,真是很难发现有什么可以免费下来的链接,或是其它能下载的有关课程内容的网页。嗯 ,反盗版这块,胡做得很扎实,胡的受众也做得很扎实。这背后透出的信息不是各立门户互不相犯的架式么,互联网在你们这块起的作用真是太小了。楼主又不禁想起当年,复试时冒险掏出手机把复试的卷子拍出来以互联网的方式给后来的师弟师妹们一份完整准确而非回忆版参考资料的心情,感恩回馈。如果胡粉以知识产权等理由来喷,楼主真想吐出几句脏话,莫非你们是没用过盗版xp、win7、office、kingsoft,没看过盗版电影,没买过盗版书籍,没下过盗版资料,如此等等的吗。知道这结盗版的东西是怎么来的吗,做人要懂得感恩和回馈,明白吗。众观其它各种培训机构,鲜见有课程密不透风还对网友分享赶尽杀绝的,而课程的受众又是那么的不愿分享,面对你们心里的各种小九九,辩解是没有意义的,因为楼主这确实是在喷口水。关于胡清平及其icourt为何能在圈内获得众多呼声,楼主想分析两点,一是中国的律师行业极不健康,圈内的大佬固步自封,对新事物不敏感的情况太多了;二是一个文科生,面对一个理工男的炫技,真的很难不招招惊呼。先说第二点,这点比较直观,文科生出身居多的青年律师,在技术方面可以说很多都是一遍空白,看到一些文本的内容通过若干小技术来呈现就惊呼得不得了,就像楼主看着怎么也看不明白的数学、会计论文感觉其十分高大上一样。这种心理是正常的,但那些技术的的确确算不上什么,技术是为法律服务的工具,不值得那么一大群法律人大呼小叫的,法律人们有点尊严好么。关于技术与内容的关系这里就不再废话了,故第二点讲到这里算。关于第一点,律师行业的极不健康,这里也不多作讨论吧,这是个大话题,一时半会说不清。楼主且举一例以示不健康冰山之一角吧,楼主曾经的共事者之一,我们在讨论一个建筑施工的案子,当事人是施工方,发包方是中建系统某包,施工合同各种明***暗箭,苛刻至极,楼主当时感吧老百姓的艰难、行业的不公平,国资背景的企业对小民企实在太狠了,然后那同事真是一句一个惊喜,这么狠的合同,以后用来当范本给客户用,让客户对客户的客户碎骨吞渣。该同事不是开玩笑的,后来在正式场合也多次提及此想法,真是汗滴禾下土啊,这是个律师该有的想法吗,有丝毫正义感可言吗。有多少律师有这种想法呢?呜呜,楼主无法统计。至于圈内大佬,首先还是限定一个范围,本帖所言大佬指的是国内非一线城市的大多数中小型律所的合伙人,绝不包括某十几个业内最佳的所里勃勃野心的大佬,这些狠角色的大佬人员虽少但赚钱很多,思维活跃程度是不于年龄成反比的。那些顽固的大佬里面最顽固的一部分也不在讨论范围内,这些极顽固分子对所有的新事物都不怀好意,包括胡的icourt课程,但也是少数;真正群体庞大且有影响力的是一大群自以为比较厉害,不主动学习新技术但同时又对送上门或口口相传的新事物很感兴趣并且自认为很新潮的大佬们,一般都是所里新晋的合伙人或低级别的合伙人,他们对新事物不敏感而导致了技术的落后和观念的陈旧,但同时怀有一颗进步的心,于是被人口口相传说某课程好的时候,就趋之若骛了,不去体验一把好像就不好意思在圈内八卦了一样,这个心理跟法学院的学生不说反对死刑就不好意思自称学法律的一般,实际被动性大过主动性也未可知。这一点,是胡的课程做得不错很关键的一个原因,但同时胡的课程在质量上确实不算下乘,毕竟吸引了那么多律师,只能说胡是个聪明人,虽然与他所标榜的理想并无关联。基于大多数有影响力的律师观念陈旧,法律市场资源分享不均,法律相关技能知识也极分散的非公开,于是这些律师们见到新颖的icourt课程便惊羡得不行,这点极大的抬高了胡课程的地位。从本质上讲胡的课程不过是一个半吊子理科男给一群技术白痴的文科生的炫技而已,这些听课的律师但凡对理工知识有一点兴趣也不致于捧icourt如圣课。换个角度,如果律师行业的经验和知识的分享能够开放一些,icourt课程还有立足之地吗,这些知识一是量小二是有限三是受众少,并不能如同其它行业,比如数学的深刻可以无穷研究(这个受众更小,没有培训空间,但考试教育这块可以持续发展)、英语培训受众极大考试又大、会计培训受众大内容多考试也多、司考培训受众一般但知识量大且更新快、驾驶培训受众大资源珍贵、it培训更新快、设计培训成本高、体育类成本更高,等等(这些举例是楼主日常所见的,并未研究过),胡的课程成活力与其它培训相比是有先天不足的,只能严格控制知识的传播途径,否则会死得很快,可算是见光死的一类培训吧,所以胡的icourt课程不如其法律英语培训有长久的生命力,也是胡严格限制课程被分享的最重要原因,这种小家子心态与当前的律师行业高度重合,也是中国目前律师行业严重不健康的一大原因。由于律师们的顽固、自封加小气(说到律所小气,楼主想小举一例,楼主曾在一家金融公司做事,这公司里在行业知识的共享上做得很充分,常有培训,文件也都是共享的;而后来再律所,其实还是家不小的所,所在团队的律师就不是这个情况,与工作相关的模版都是一个个发给楼主,丝毫没有将行业知识传授的欲望,具体到案子时,不由楼主参与的案子除了打印之类工作外都不让楼主碰,这还是一个团队的队友,律师行业这种小气封闭状态不在少数吧。忘了,接触客户的机会更别提了,搭便车甚至有意捎一程去开庭或见当事人的情况更不用提了,绝无仅有。做过律师的,此情可待能成追忆吧。),胡课程的脆弱生命力还是可以得到很好的维系的,没办法,一个不开放的行业总是会让好人变成小流氓,小流氓变成大流氓,然后老流氓笑得很开心(夸张比喻,不喜随喷)。综上以概括,楼主想说,律师行业的帮传带教、媳妇熬成婆的漫长成长历程,不是这个行业的特色和优良传统,而是行业不健康发展所积垢的敝病。有话语权的律师们,不要以熬出来了自鸣得意可好,这不是件好事。由于律师圈的封闭,icourt在圈内取得的成绩暂时无人超越,圈内也无相似业务推出。这种课程的生命力到底能持续多久,又会遇到什么样的挑战和机遇。楼主认为icourt课程的不公开和律师行内严重的对抗非协作性是其能有今天的水平的主要原因,这种封闭开课的模式,最大的弱点便是惧怕同类业务的公开推广,一旦有相似课程公开传播,icourt系列的课程离关门就不远了,因为内容实在是太有限了。而另一方面,法律服务市场对这种课程的需求只是因为市场本身的滞后发展,法律服务的水平跟不上时代,因为需要这种培训,且对这种培训有耳目一新的感觉。但整个法律服务市场对这类课程的最大需求还完全没有开启,在什么情况下这块市场才能真正打开呢。楼主认为,若官方,即法院,能够在案卷制作和判决书中鼓励或认为多元化的表达方式时,便是这类培训市场真正开启之时,届时培训需求急剧扩大,胡的课程由于起步早,根基好,照样具有很大优势,同时这块市场开放,更多的相关业务便会开展起来,各方力量进入,竞争也会随之形成,对胡的挑战和动摇也逐步开始,此时便是一个机遇与挑战并存的市场,无论胡会怎样,律师培训业务会健康起来。对于胡的个人,楼主真是不喜欢,虽然他是聪明的。楼主在一家律所工作的时候,看到中世律联的纪念日历,翻了几本不同年份的,发现胡的出镜频率是相当的高,真不知道一个做培训的整天跟律师的联谊会混在一起是什么感觉,几乎跑遍全国各地场场不落的气势。不得不说胡这种勤奋的赶场混脸熟的方式对他推广的培训课程有很大帮助,杠杆效应非常明显,参加联谊交流会的律师一般都还是当地有影响力的,不知道的还以为胡是什么特殊嘉宾,其实他只是个勤奋的酱油仔而已。如果楼主去赶这些场子的话,以楼主的低调和不好意思,定是不合影或是找个人影挡起来,露面多不争光啊。对icourt课程楼主基本不熟悉,还是想吐糟几句。“诉讼的本质是信息的传递。”上过胡课的同学们是不是对这句话很熟悉,其被强调次数之多,以至于在好几篇“干货”帖里都见到被引用。于是楼主又不开心了,诉讼的本质真的是信息的传递吗,也许是吧,可是这样来概括本质,楼主真的想再概括一翻如下:教育的本质是信息的传递;哲学的本质是信息的讨论;文学的本质是信息的创作;美术的本质是赤裸的信息;交通的本质是物质的传递;医疗的本质是信息和物质的传递;科研的本质是信息和物质的发现;而互联网的本质的确是信息的传递。胡宣称的那种貌似新颖的表述,让一群文科生在炫技的理工男面前一下子迷失了,都来不及仔细想想就全盘接受了。对于这种虽然正确但普遍又没有特征的概括,真的不值得像发现新大陆一样玩味。而icourt课程关于对说服法官的一再强调,实在另楼主心塞,不知法官看到这些把自己当工具的课程后心情是否能畅快。说服法官,明显是把法官不当人看,庭审上面坐的是个有头脑有思维有判断的人好吗,又不是个锤子,你说得快说得多就判你赢了。在楼主看来,中国法官的业务水平比大多数律师还是要强很多的,从精力从职责要求上都比律师强,而律师们陈述观点的时候会掂量下发言的责任吗,从来不会,但是法官陈述意见的时候都会谨慎有加,这是律师们用尽说服之术就能改变的方向吗。icourt课程让律师们觉得在庭审自己就是神一样,太过强调律师的万能性了,这是律师们的幻觉。楼主希望那些表面上对法官唯唯诺诺的律师,在心里也能多尊重些法官,会赚钱不是本事比法官强。对于同学所言,楼主表示很羡慕你的KFC,并希望你能多多去食堂吃饭,虽然KFC也很有营养,你这样省时间暂时还是不值得的吧。另外,既然你会祷告,也不知道你替谁祷告些什么,楼主也附庸一下,愿世间的律师能常怀正义,秉存良心,不忘初衷;开放心态,待人以诚,共筑行尊。阿门。_________----------------------______________------------------______________--------------------_______ @鹤卿 鹤同学好,果然国庆期间小忙之中又有更新了,可是这次更的内容貌似与君之前表述的分享icourt课程的意思有不小差别。本次更新的内容除了一味点赞外,并无任何内容,实在无法得知君所学课程的精妙之处。关于鹤同学所述“关于法学知识(输入,what)关于操作技能(输出,how)” 的句式,大胆猜测是icourt的点型授课句式,简单洋气,似乎很炫。但是,这种形式的表述,难道不是如非主流一般炫目之下九零后都长大了,再无主流了,笔者想说,形式真的没那么重要,不值得升到炫目的高度。关于法学知识(基本功)关于操作技能(刀剑笑)。
作为一个法律新手,因为机缘上过几次icourt的课程,也稍想发表一下自己的观点。对于胡老师,正如他百度中自己说的,是一个真正的商人,不过这个商人用理想包装了自己。不过,我作为一个年纪不大资历尚浅的小朋友似乎对年长者并没什么发表言论的资格,就暂且不谈。对于icourt,首先价格来说4000+的价格的确不便宜,在我看来也完全没有性价比。但是为什么如此多人会这个价格还趋之若鹜,在我看来有一个目前社会普遍价值观的问题。在现在中国的畸形设定下,人们越来越认为贵的就是好的,免费的则不加珍惜。同样,在icourt前身即商事训练营时期,胡清平的培训是免费的时候,很多人不加以珍惜,作为一个聪明人,他很快就抓住了这其中的要领。其次,icourt的课程,从最开始的图表训练营到现在所谓的十门课,我越来越看不到icourt的诚意,excel,visio,ppt,思维导图或者是IMAC(苹果电脑)这些的使用方法,说实话,对于我们这些从小使用电脑的年轻人来说,根本就是上手就会的事情,律师经验的思维积累才是做好图表这些的关键。可是对于很多的四十多岁,并不熟悉互联网的法律人而言,的确很吸引人。对于从业律师而言,我相信大家普遍有一个感受,就是师傅不教你怎么玩转这个游戏,每个律师都有自己的套路和生存方式,即没有规则可言。这样一个半封闭式的环境,一旦出现了天同这样的标杆性的律所运营方式后,所有人都想学习也是很正常的。一边是万分苦恼的摸着石头过河,一边是最先锋的高院法官和律所教你他们的工作方式,你选哪个?------------------貌似说了好话,对的,icourt自然有它的优势而言,但是这些优势不在于icourt本身,而是它身后的天同,最高院法官以及它聚集的越来越多的律所主任,高级律师们。律师界的尔虞我诈,遮遮掩掩,从原先我教一个徒弟,可能就增加我一个敌人的思想戒备,在icourt这个舞台,有了金钱和荣耀的诱饵,纷纷拿出来炫技,性价比高了啊(这里讲的可能稍有过分,希望老律师们谅解)。再次,作为一个商人***信息不对等是一本万利的事情,icourt就这么几个人,他们做的事情就是把不公开半公开的信息买来再卖出去。就想上面说的,icourt本身的意义在于它背后的这些人,所以它除了本身的课程外还有一场场的主任年会,就像是一种拉帮结派。所以2014年,icourt成立所谓的前一百人的股东,虽然不清楚这个构成方式是如何,但是莫名被架上股东的结果就是,这一百位股东一定会不遗余力的传销icourt,手法精妙。(另外就我课程上很多接触到的律师,最积极的那部分都是急于从原来的律所跳出来,想要自己成立律所的人----构建人脉关系网)最后,还是想抱怨一句,作为互联网存在的一代,看不过眼的事情就在于为什么现在任何事情都要拉上大数据,用户体验或者是O2O,好吧,近年来这几个词的确火到不行,但是我相信随着互联网一代的成长,信息进一步的透明化,技术男炫技这件事不会让大家这么崇拜了吧,毕竟技术只是工具而已,律师这个行业靠的还是我们一步步的成长和经验的积累。顺手给大家科普一下 用户体验,所谓用户体验说白了就是怎么样让你感觉舒服用的顺手,并不是什么高深的东西,都是一遍遍人为测试后得到的结果,所以有了前人的经验总结形成的规则自然会让人感到舒服,问题在于前人们不太愿意免费给啊~话说,诉讼律师的水还是真的深啊,希望法治进步吧。
上过这个课程,先说评价,可能适合律师在当事人面前装b,也适合讲述案件,引导其他人一起讨论,也适合思维混乱,逻辑不清的人理清逻辑,除了上述几种人外,其它的法律相关人士不适合这个课,大几千,上个司考培训班巩固下知识都好过这个啊。这个课程没有搞清楚什么是打官司,一个案件你图表做得再漂亮,事实不会变,适用的法律不会变,法官做过成百上千的案件,其实不需要你以自己立场列图表给他,他有自己的思路,不是那么容易被带跑的。而且课程里充满了对图表作用的夸大,一个根本不需要列图表的案件,列了一个图表,自以为简明地把案情重点表述清楚了,实际上一句话就能搞定。至于那个做图表的课程更是无力吐槽,这种课程淘宝几块钱都能买吧。总之,情怀卖得好,忽悠做得好,等你花了钱才发现是骗子已经晚了。
一直关注iCourt,是长期的旁观者,而且上了几门课程。为避免不必要的争议,匿名回答这个问题。为什么iCourt课程能火起来?我觉得还是因为满足了大部分听课用户在专业和业务上的核心需求。图表只是iCourt的一门课程,还有出庭、大数据、写作、谈判等十多门课程。图表课不光教你使用Visio等软件,还教你如何将法律关系和事实进程以最恰当最简洁的方式用图表表现出来,而后者才是重点,这点上我赞同
的回答。图表不光能满足上庭的需求,和不懂法律的客户谈的时候,甩出一张简洁漂亮的图,有没有用,你自己琢磨。写作课程也是同理。法学院的教育和行业实践脱节,绝大多数法学院毕业生写不出合格的诉状。当然,有人会说,进了律所会有人教,但那得先有师傅愿意花时间带你而且师傅自己懂行。事实上,国内现在提交给法院的大多数诉状在专业上都是不及格的。举个最细小的例子,你真的确定你知道诉状的诉请中的利息主张的完美表达形式?任何课程(包括你上过的法学院)都有社交的附带属性,但iCourt并没有某匿名回答影射的什么水深之类的情况。胡清平在和天同合作之前自己已经创业很多年了,胡的创业史见:;胡几年前创办iCourt的时候就已经从天同离职了;而天同也在做自己的培训项目无讼学院,这是天同官微对自己培训项目的介绍链接:。另外,如果你知道胡正在做的iLaw系统是怎么回事,也就会大概明白胡的布局了。看大家有什么评论吧。我再随时更新。谢谢观看。------------当然如果你是刚入行的小律助,一个月才挣几千块,确实不推荐你自己掏四五千去上一个周末的iCourt课程,应该让你的老板花钱派你去。
大律师吹大牛、小律师吹小牛。
已有帐号?
无法登录?
社交帐号登录

参考资料

 

随机推荐