为什么全世界国家城市数据库都在鼓吹大数据?

成功护送危急病人到抢救室,病人家属下跪感谢。
警犬趴在车窗上不肯离去,让送别的战友热泪盈眶。
声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
  对于大多数管理者,做预测是工作的一部分:HR决定聘用人选,是预测谁工作最出色;营销人员选择分销渠道,是预测产品在哪里最好卖;风险投资人决定是否投资某家初创企业,是预测它能否成功。为做好种种商业预测,越来越多企业现在求助于计算机算法——这种技术能以惊人速度完成超大规模分析过程。
  算法能让预测更准确,但也会带来风险,尤其是在我们不理解这些算法的情况下。诸如此类广为人知的例子不胜枚举。
  Netflix为了更精确地了解用户看电影的口味,曾拿出100万美元征集内容推荐算法,很多数据科学家组队参赛。然而,这种算法只在用户挑选DVD时能较为准确地推荐,随着Netflix的用户转向在线电影,其偏好与算法的预测结果就会出现偏离。
  另一个例子是社交媒体。现在很多社交网站通过算法决定推送哪些广告和链接,如果设计算法时过于侧重点击量,“骗点击”的内容就会充斥网站。虽然点击量上升了,但整体用户满意度可能直线下降。
  这类问题可以避免。我们曾帮助各类机构设计、应用算法并开拓新数据源,在此过程中发现,问题根源通常并非算法本身有漏洞,而是使用不当。为避免犯错,管理者须首先了解算法的功能和局限:它能解决哪些问题,不能解决哪些问题。
  为何“聪明”算法反误事?
  越来越多证据显示,将算法“人格化”更易让人们接受。例如在自动答复系统中,真实人声要比模拟人声的传达效果好。然而根本问题在于,人们通常像对待人类同事一样对待算法和计算机,可算法和人类有两大不同:
  算法极其“单纯”。在最新的《复仇者联盟》(Avengers)电影中,钢铁侠托尼&斯塔克(Tony Stark)设计了人工智能防御系统奥创(Ultron)。奥创的任务是保卫地球,但它完全按字面意思解读任务要求,认为拯救地球的最佳方法就是毁灭人类。在很多方面,奥创就像典型的算法,完全按命令行事,不顾及其他问题。如果使用算法时不够谨慎,我们就会遇上麻烦。
  社交网站如果突然充斥骗点击内容,就可能是落入了类似陷阱。这些网站目标明确,即提供对用户最有吸引力的内容。在设计算法时,网站管理者将这个目标替换为:找到用户最愿意点击的内容。这个指令逻辑上并不算错,因为人们显然会点击感兴趣的内容。但由于只根据潜在点击量筛选内容,网站迅速充满无聊和带攻击性的内容,导致声誉受损。人们会理解网站管理者希望“最大化优质内容点击量”,而非“即便损害质量也要最大化点击量”;相反,算法则只按字面意思执行指令。
  算法是个黑箱。在莎士比亚作品《恺撒大帝》(Julius Caesar)中,一名预言者警告恺撒:“当心3月15日”。这句话意思明确:恺撒最好有所防范。但同时又让人完全无法理解:当心什么?为什么?恺撒对这个信息非常困惑,于是把预言者打发走,宣称:“他是个梦呓者,我们走吧。”最终,3月15日确实是恺撒大帝倒霉的日子,他在这天被刺。问题是预言者提供的是不完整信息,而且没法猜到缺失的是什么,也不知道这条信息有多重要。
  和莎翁笔下的预言者一样,算法有时能非常准确地预见未来,但不会告诉你事件背后的原因。算法可以通读《纽约时报》文章,告诉你哪篇在Twitter上会火,但解释不了人们为什么要转发;算法可以告诉你哪位员工最可能成功,但不能告诉你哪种特质对成功最重要。
  为更好地管理算法,认识到上述两项局限是第一步。现在我们再看看还需要做什么。
  明确所有目标
  每个人都有自己的目标和计划,但很少有人会不择手段。为了某些未明言的软性目标,我们会做出权衡取舍:例如为了明天的声誉放弃一部分今天的利益,或为实现组织内部平等付出短期代价。但是,算法只会一门心思追求给定目标。因此在设计算法时,你必须明确想要达到的所有目标。
  如果你在意某个软性目标,就要明确指出、清晰定义,并设定其在总体目标中的权重。由于软性目标较难衡量,实施算法所得结论时要特别留意。
  谷歌在使用广告展示算法时,就遇到了一个软性问题。哈佛大学教授拉塔尼娅&斯维尼(Latanya Sweeney)在一项研究中发现,如果用谷歌搜索典型黑人名字(如“Latanya Farrell”),会看到调查逮捕记录的广告,而搜索白人名字(如“Kristen Haring”)则不会。为实现广告点击率最大化的目标,谷歌不断调整算法,结果是令姓名带有某些特征的人名誉受损。之所以出现问题,是因为搜索此类姓名的人点击犯罪记录的可能性更大,使犯罪记录出现的更频繁,形成了一个不断自我强化的循环。这大概不是谷歌想看到的,但如果软性目标缺失,算法就无法规避这一结果。
  为找到软性目标,我们特别注意给每个人机会说出任何顾虑。我们发现,人们经常通过表达担忧来提出软性目标,所以明确征求意见能促进开放和高质量的讨论。让人们坦率表达观点,把平时私下说的话摆在桌面上,这点很关键。这让很多问题浮出水面,不过我们遇到最多的还是公平问题,以及敏感局面处理问题。
  明确核心目标和其他考量后,设计者可以让算法做出权衡取舍。为此,设计者通常须列出多项目标,并按重要性排序。
  尽量避免短视
  一家受欢迎的快消品公司从中国低价采购,然而销往美国。该公司运用算法预测哪些产品最好卖,销量迅速提升。但良好势头只维持了几个月,消费者开始要求退货。
  尽管算法未能成功预测消费者的反应,但惊人的高退货率本可以预见到。公司当然关注质量,但在设计算法时,没有明确将质量设为影响消费者满意度的重要因素,而过于关注销量。调整后的新算法既能准确预测产品销售情况,同时也能预测产品的受欢迎程度和可持续度。公司现在推出的产品在亚马逊等平台上获得极高评价,退货率大幅下降。
  这家公司最初设计算法时落入了常见陷阱:算法关注当下掌握的数据,而这些数据通常与短期结果相关,这造成算法本身有短视倾向。在短期利益和长期成功及企业整体目标间可能存在张力,这对于人类不言自明,对算法则不然,除非你明确告诉它。
  解决这个问题的方法是,在设置目标时明确定义长期目标。而在按照算法的预测采取行动时,管理者也要考虑算法的建议是否符合长期目标。
  过于关注点击量而导致内容质量低劣的网站,其采用的算法也有短视问题。算法根据当下目标(让用户点击链接)推荐内容,却未能考虑更重要的长期目标,即用户满意度和黏性。
  市场推广活动同样可能存在短视问题。以服装品牌Gap在谷歌上一次失败的广告宣传为例。依靠谷歌强大的广告算法,Gap网站访问量在短期内剧增。问题在于,Gap的目标是增加销售额,而非增加网站访问量。为实现目标,广告平台可以从合作支付公司等不同渠道收集销售数据,然后将其纳入算法。
  此外,网站访问属于短期现象,而市场推广的长期目标则包括品牌形象的下游效应,以及回头生意。完善的相关数据虽然很难找到,但严格的数据审核会很有帮助,因此管理者应完整列出与当前项目相关的内部和外部数据。在与谷歌的合作中,Gap的营销人员可以先列出所有目标,如高销量、低退货率以及顾客好评等,然后给出具体衡量指标,如商品退货量、在线评论和“Gap”一词搜索数等。谷歌的算法随后可以综合考量每项因素的相对重要性,据此给出预测。
  选用合适数据源
  简言之,要选择合适的数据源,应注意以下两点:
  数据应尽可能全面。企业常有的误解,是把大数据看作“大量的数据”,例如从1万名客户扩展到100万名。但这样只理解对了一半。设想你把数据做成表格,每行对应一名客户,那么客户人数即为图表长度;而你掌握的每名客户的情况,即每行中的数据,决定了图表宽度。虽然数据总量能够提升预测准确度,但数据宽度才能让大数据发挥全部威力。做预测最关键的就是信息的全面性。事件的每个新细节都是一条线索,能够补充已掌握的情报。文字记录就是典型的“宽”数据,每个字都可以成为线索。
  数据多元性很重要。从上文可以推出,数据应尽可能多元,即各个数据源相关度低。这能让算法的预测能力再上台阶。可以把每组数据看作一个朋友的推荐:如果朋友口味太相似,那么多几个朋友推荐也不太有价值;反之,如果每个朋友视角不同,带来的价值就大得多。
  了解算法的局限
  知道算法不能告诉你什么和知道它能告诉你什么同样重要。人们很容易受误导,以为某项预测在不同情境下依然成立。算法就是利用已有数据在稍有差异的情境中做预测,这些差异可能包括人员、时间等,对象事件也可能不同。本质上,你在寻求把某项结论移植到另一个情境中。因此聪明的做法是,列出算法可能在新情境中失效的原因,并评估这些潜在原因。例如,某个算法根据外部网站评论和违规历史,预测波士顿哪些餐馆可能违反卫生法规。而换到佛罗里达州的奥兰多,该算法效果可能就没那么好,因为那里天气更热,食品安全问题与波士顿有差别。
  同样要记住,相关性不等于因果性。假设某个算法预测,较短的Twitter发言比较长发言转发率高。这绝不是说你应该缩短Twitter发言:这只是一项预测,而非建议。这项预测成立,是因为较短的Twitter发言更可能具备很多其他特征,使之更易被转发,而仅仅缩短你的发言,并不必然满足那些条件,所以不一定能得到更多转发。
  eBay曾多年通过谷歌打广告,发现看到广告的人比没看到的人更可能消费。但eBay忽略的是,这些展示次数达数百万的广告,并不必然是人们访问其网站的原因。毕竟,这些广告针对的本来就是eBay用户。为区分相关性和因果性,eBay进行大规模试验,随机选择广告展示对象,结果证明大多数情况下广告不起作用,因为看到广告的人已经知道eBay,无论如何都会在上面消费。
  算法有很强预测能力。但在做因果推论时,你必须多加留意,因为算法不能取代对照试验。不过在有些方面,算法能取得惊人成功:发现人类观察不到的细微规律,并利用这些规律形成准确洞察,助力决策。留给我们的课题是:了解算法的风险和局限,并通过高效管理,释放它的巨大潜力。
  迈克尔&卢卡(Michael Luca)乔恩&克莱因伯格(Jon Kleinberg)森迪尔&穆莱纳坦(Sendhil Mullainathan)| 文
  迈克尔&卢卡是哈佛商学院商业管理助理教授,乔恩&克莱因伯格是康奈尔大学计算机教授,森迪尔&穆莱纳坦是哈佛大学经济学教授。
  王晨 |译 蒋荟蓉 |校 时青靖 |编辑
  本文有删节,原文参见《哈佛商业评论》中文版2016年8月《你要管理你的算法》( Algorithms Need Managers, Too)。
  《哈佛商业评论&大思路》
  编辑|马雪梅xuemeima@hbrchina.org
  公众号ID:hbrchinese
  长按二维码,订阅属于你的“卓越密码”。
欢迎举报抄袭、转载、暴力***及含有欺诈和虚假信息的不良文章。
请先登录再操作
请先登录再操作
微信扫一扫分享至朋友圈
搜狐公众平台官方账号
生活时尚&搭配博主 /生活时尚自媒体 /时尚类书籍作者
搜狐网教育频道官方账号
全球最大华文占星网站-专业研究星座命理及测算服务机构
主演:黄晓明/陈乔恩/乔任梁/谢君豪/吕佳容/戚迹
主演:陈晓/陈妍希/张馨予/杨明娜/毛晓彤/孙耀琦
主演:陈键锋/李依晓/张迪/郑亦桐/张明明/何彦霓
主演:尚格·云顿/乔·弗拉尼甘/Bianca Bree
主演:艾斯·库珀/ 查宁·塔图姆/ 乔纳·希尔
baby14岁写真曝光
李冰冰向成龙撒娇争宠
李湘遭闺蜜曝光旧爱
美女模特教老板走秀
曝搬砖男神奇葩择偶观
柳岩被迫成赚钱工具
大屁小P虐心恋
匆匆那年大结局
乔杉遭粉丝骚扰
男闺蜜的尴尬***
******:86-10-
***邮箱:中国领先的IT技术网站
51CTO旗下网站
论证:为什么大数据是下一个浪潮?
今年上半年互联网热出现一个新动向,就是入口和应用场景的争夺已到了短兵相接、贴身肉搏的激烈程度。巨头们争夺的最终目标是数据资源。数据已成为 DT(数据技术)时代的核心要素。世界经济论坛报告曾经预测: “未来的大数据 将成为新的财富高地,其价值可能会堪比石油”,成为战略性资源。
作者:来源:安信证券| 11:22
数据成为 DT 时代的核心要素。
今年上半年互联网热出现一个新动向,就是入口和应用场景的争夺已到了短兵相接、贴身肉搏的激烈程度。巨头们争夺的最终目标是数据资源。数据已成为
DT(数据技术)时代的核心要素。世界经济论坛报告曾经预测: &未来的大数据 将成为新的财富高地,其价值可能会堪比石油&,成为战略性资源。
被低估的影响:大数据将指引人类走向智能社会。 一方面大数据&量&和&质&的双提升奠定人工智能的基础,另一方面数据驱动颠覆传统计算机算法,导致人工智能出现突破性进展,而人工智能又进一步加速了大数据价值的挖掘和应用,使人类社会进入了向智能社会 发展的&正循环&。
政府:推动大数据应用的最关键力量。
政府拥有最多且最具应用价值的核心数据,一方面大数据已经上升至各国国家战略,政府推进大数据开放已经是大势所趋:
美国等发达国家纷纷布局大数据产业,推出大数据相关政策。大数据对整个世界的影响力呈现快速增长趋 势,将引发新一轮大国竞争。
另一方面我国对大数据的政策支持力度上不断提升,大数据战略将上升至国家战略,
国务院已经下达各部委大数据工作任务行动时间表,大数据发展紧迫性和必要性可见一斑,同时也意味着我国大数据发展面临历史性机遇。
数据价值正在被不断发现。 互联网早期有句名言 &在网上,没有人知道你是一条狗。
&如今有了大数据,在网上,不仅有人知道你是一条&狗&,而且还知道你是一条什么样的&狗&,爱吃什么、什么时候睡。大数据除了具有挖掘商机、精准营销、 决策支持、提高效 率等发现价值功能,还有创造价值的功能:能创造新的消费体验、创造新的商业模式和创造新的消费需求。
大数据产业链: 一是数据收集, 其途径:
1、自行收集。如今年 1 月工行&融e 购&商城正式上线,其目的是希望通过发展电商来获得大数据方面的主动权;
2、与第三方合作。如平安银行携手 eBay 推出&贷贷平安商务卡&;
3、&线下数据&转变为&线上数据&。传统行业的&线下数据&转变为&线上数据&将是 DT 时代的血液之一。 &线下数据&就是传统行业的优势。
二是数据处理,数据处理包括鉴别、整理、归类以及建模分析、挖掘利用等,数据科学家可能成为未来最热门职业。三是技术支撑,包括硬件和软件两部分。
大数据与产业的聚合效应。 大数据与生物医药、农业、电信、视频、 互联网金融、工业互联网、车联网、信息安全等产业的结合将产生巨大的化学反应。
1. 大数据: DT 时代的核心要素
1.1. 大数据是未来社会的核心资源
大数据是&互联网+&的核心要素。 互联网的未来在于连接一切,从连接人与人向连接人与服务、人与物、物与物扩散,
使得海量数据的生产和连通变成现实,成为大数据应用的基础。 尤其在传统行业,信息及数据是被忽视的, 缺乏有效的手段进行充分利用, 互联
网与传统产业融合的重要目的在于将潜在信息和数据的价值进行释放, 因此,评价&互联网
+&的指标绝非是简单的信息化,而是对企业的整体生态系统进行数据化, 让企业的一切业务都变得可以分析, 进而更好的识别市场和用户。
从某种程度上来说, 数据是现实世界在虚拟世界的一个&映像&, 可以通过数据挖掘对&虚拟映像&进行分析,
进而对工作流程、商业模式、产品设计产生巨大的影响, 服务于产业本身。 正如马化腾所说,&互联网 +&代表的是一种&信息能源&,能够促使互联网
与传统产业不断融合。
数据逐渐成为整个经济社会的核心资源。十八世纪的农业社会,经济整体以农业为主,十九世纪制造业起步, 1950 年 GDP 大部分是制造业,
而未来数字经济占据经济的主体地位已经成为必然的趋势。全球经济从农业经济到工业经济再到信息经济演变的驱动力来自于
技术的突破,技术在改变生产力和生产关系。信息要素全面升级,尤其是云计算正在变成基础设施,数据在变成整个经济社会的核心资源。
1.2. 被低估的影响: 大数据将指引人类走向智能社会
1.2.1. 大数据&量&和&质&的双提升奠定机器智能的基础
第一,万物互联造就了数据&量&的阶跃发展。 从人类文明出现到 2003 年,人类总共才产生了
5EB(ExaBytes)的数据。计算机出现后, 尤其是近年来移动互联网和物联网的出现, 数据产生的速度和规模开始急剧提升,
过去几年产生的数据比以往 4 万年的数据总 量还要多。预计随着互联网与产业的加速融合,未来数据体量的增速将呈现指数上升态势。 IDC 预计
2020 年全球数据使用量将达到 40ZB(ZettaBytes),需要约 429 亿个
1TB的硬盘进行存储,届时中国产生的数据量将占到全球总量的 21%。
第二,数据逐步趋向与由&端&产生, 从&质&上讲兼具多维性与完备性。
数据的产生一定会在云、端、网这三个视角产生。 2014 年全球互联网用户有 30 亿, Facebook 有 22亿注册用户,月活跃用户超过
13 亿人口。我们在 2014 年全球智能手机出货量突破 13 亿,连网设备超过 300 亿个。 未来可能会有
80-90%数据基于用户智能终端和联网设备产生,由于这些数据连接人体、连接环境、连接物体、连接思想,
将原来看似无关的维度(时间、地域、食品、做法,成分,人的身份和收入情况等)联系了起来, 构成了今天的非常
生动的数据社会的景象,这种数据连接起来才能流动共享,真正实现数据的社会经济价值。
1.2.2. 数据驱动颠覆传统计算机算法, 导致人工智能出现突破性进展
互联网的发展为训练机器模型提供了足够多的数据量,而这种数据驱动算法以深度学习为代表,不但颠覆了传统的计算机算法,也使得人工智能出现突破性拐 点。一个典型的例子是 2005 年 NIST 对全世界各家机器翻译系统评测的结果中,从未做过机器翻译的Google,
不仅一举夺得了各项评比的第一名,而且将其它单位的系统远远抛在了后面,而 Google
系统和其他系统主要的优势就在于使用了其他对手近万倍的数据量。
而国内人工智能代表公司科大讯飞近几年在采用深度学习算法,利用大数据训练后,近几年其语音识别和手写识 别错误率均保持 30%-50%的下降。
1.2.3. 大数据与人工智能相互促进,实现发展的正循环
人工智能是解决大数据的数量和效率之间矛盾的关键
传统的机器学习通过标记数据进行有监督学习,随着其处理数据量的增大, 需要外界的支持和帮助也就不断增加, 且计算结果准确性也会受到影响。
因此越来越多的数据将成为负担,也更容易达到极限或产生错误结果。人工智能的突破性技术&&深度学习是从未经标
记的数据展开学习,更接近人脑的学习方式,可以通过训练之后自行掌握概念,且输出结果会随着数据处理量的增大而更加准确。同时,深度学习在加速回归定律的 指引下会使得进化过程中产物(输出结果)获得指数级增长,当深度学习的效率变得更高,就会吸引更多 的资源向它聚合,使其发展更为迅速。
大数据利用人工智能实现大数据应用的正循环
百度首席科学家吴恩达层提出 : 从优秀产品到大量用户,再到海量数据,最后返回优秀产品是一个良性循环,但最后一个环节&海量数据到优秀产品&会出现问题,因为当数据积累过多时,就无法对这些数据进行完整和准确的处理。
以百度为例,
百度的数据处理自上而下分成开放云、数据工厂和百度大脑三个层级,最底层的开放云收集数据,数据工厂对数据库进行管理,最上层百度大脑的模拟神经网络通过 机器学习高效的输出结果,从而实现行业应用,百度大脑就是在最后一个环节体现出巨大价
值,带来更好的信息处理能力,从而产生更加广泛和深入的行业应用,比如百度大数据此前在医疗、交通和金融领域的应用。
&【编辑推荐】【责任编辑: TEL:(010)】
大家都在看猜你喜欢
热点热点访谈关注头条
24H热文一周话题本月最赞
讲师:5人学习过
讲师:29人学习过
讲师:5人学习过
精选博文论坛热帖下载排行
本书全面介绍了应用PHP进行网站开发的各种技术和技巧。全书分为20章,内容包括PHP的运行环境配置、表单及表单元素的应用、CSS与JavaScript...
订阅51CTO邮刊我们需要的不仅是数据,还有数据的前因后果和背景知识。如果缺乏对人们现实生活的实地调查,大数据没有什么意义。
在短短的几十年里,“技术天才”与社会的关系已经改变:他们从关在屋里的孤独者变成救世主,从反社会者变成社会的最大希望。许多人现在似乎相信,理解我们这个世界的最佳方式,就是坐在电脑屏幕前分析我们称之为“大数据”的海量信息。关于这一点,我们只要看看 “谷歌流感趋势(Google Flu Trends)”。2008年,当谷歌推出这项服务时,硅谷的许多人将它鼓吹为表明大数据将很快淘汰传统分析方式的一个标志性产品。但他们错了。“谷歌流感趋势”不仅没有提供流感传播的精确描述,也无法实现大数据鼓吹者的美梦。这是因为,如果没有“厚数据”(丰富的、具有前后关联性的数据,它们只能通过丢开电脑、深入实际生活才能获得),大数据就没有意义。电脑极客们曾经因为不能适应社会生活而被嘲笑,他们被告知应该“多出去走走”。实际上,如果大数据的信徒们希望理解这个他们也在参与塑造的世界,他们真的需要多出去走走。谷歌的失败与算法无关“谷歌流感趋势”的目的是:找出人们在流感季节常用的搜索词,然后实时跟踪这些搜索词的使用高峰期。这样,谷歌就可以在新流感爆发之前发出警报,而且预警时间要比官方疾病防治中心的预警时间早大约两周。对很多人来说,“谷歌流感趋势”已经成为大数据的一个典型代表,它表现了大数据的巨大力量。在畅销书《大数据:一场改变生活、工作和思考方式的革命》中,作者维克托o迈尔o舍恩柏格和肯尼斯o库克耶宣称,与政府滞后的数据相比,“谷歌流感趋势”是更有用、更及时的流感指示器。然而,著名的《科学》杂志本月刊登一篇文章告诉我们,自2011年8月以来,“谷歌流感趋势”几乎每周都会高估流感的盛行率。而在2009年,就在“谷歌流感趋势”推出后不久,它竟然完全没有察觉猪流感的爆发。事实上,人们在流感季节的许多常用搜索词与流感无关,而与流感的通常爆发季节----冬季密切相关。许多人争论道,“谷歌流感趋势”的失败缘于大数据的不成熟。这种观点没有切中要害。当然,调整算法、提高数据收集技术将会让下一代大数据工具变得更有效。然而,大数据鼓吹者真正的狂妄之处不在于对一套不成熟的算法过于自信,而在于盲目地相信坐在电脑屏幕前捣鼓一些数字就可以充分理解世界。厚数据才能真正认识世界大数据仅仅是大量的“薄数据”,它们是通过对人们的活动和行为进行跟踪而获得的。我们最常去的地方,我们在网上搜索的东西,我们每天睡了多久,我们有多少联系人,我们所听的音乐类型等等。这些数据是通过你浏览器中的“cookies”、你戴在手上的FitBit腕带或你手机上的GPS来收集的。这些信息无疑是重要的,但我们不能通过它们来获得对人的完整理解。如果你对一个领域高度熟悉,有能力填补信息空白并想象人们的行为原因,那么“薄数据”将是有用的。换句话说,如果你能够想象并重建人们的行为的发生情境,你所观察到的行为才是有意义的。如果缺乏对行为情境的了解,就不可能推出任何因果关系,也不可能理解人们的行为原因。为了真正地了解人,我们不久需要大数据,而且需要厚数据。厚数据不仅包括事实,而且包括事实的前后联系。比如说,美国有86%的家庭每周会喝掉6夸脱以上的牛奶,但是她们为什么喝牛奶?他们是怎么喝的?一块包含三种颜色、绣着星星和条纹图案的布,这是薄数据;一面在风中飘扬的美国国旗,这是厚数据。基于“我们做了什么”,大数据对我们进行简单化的理解;厚数据则试图通过我们与周围世界的联系来理解我们。只有理解人与周围世界的联系,人们才能从整体上认识这个世界。大数据要丢下电脑,走进生活如果说大数据擅长观察人们的行为,那么它不擅长的就是理解人们对每样事物的背景知识。我是怎么知道每次刷牙时该用多少牙膏的?我是怎么知道何时该进入另一个交通通道的?眨眼是表示“真有趣”还是“我的眼睛进了东西”?这些都涉及人们的内在能力、无意识和背景知识,它们控制着人们的大多数行为。跟周围的事物一样,这些不可见的背景知识只有在观察者主动去看的情况下才能被发现。不过,它们却对每个人的行为有着重要影响。它能够解释事物与人的联系,以及事物对人的意义。人类学及社会科学中有大量观察和解释人类行为的方法。研究人员不但观察人的行为,而且考查他们所处的情境和他们拥有的背景知识。这些方法有一个共同的特点:它们要求研究者深入混乱而真实的人类生活。没有哪一个单独的工具能够成为理解人类的超级武器。尽管硅谷有许多出色的发明,不过我们对任何数字技术的期望都应该有个限度。“谷歌流感趋势”真正教给我们的是:不能仅仅问这些数据有多“大”,还要问这些数据有多“厚”。有时,走进真实的生活会得到更好的结果。有时,我们必须要丢下电脑。
顺便附上 天羽电商联盟 六万电商高层选择基因传播微信公众号:goodis-zero
欢迎前来交流与分享。
本文来自微信公众账号提交,由微讯啦收录,转载请注明出处。
微信扫码 分享文章

参考资料

 

随机推荐