第一篇:互联网大数据时代的来临
互联网大数据时代的来临
互联网大数据时代的到来,已成为人们不可阻挡的趋势。我们进入以“互联网+”为代表的信息时代,信息化已经成为全球性、全局性、战略性的变革力量,正在深刻影响着经济、政治、军事、文化和社会等各个方面,深刻改变着人们的生产生活方式,也在推动着区域发展和行业竞争格局发生重大变化。信息时代所带来的一切重要变革,不仅来自于技术创新,更源自理念创新。从某种程度来说,没有共享,就没有互联网,海量数据只有在共享的前提下,才能够称之为大数据。只有以共享理念为引领,并将其贯穿到质检工作的各领域和全过程,善于用信息技术和互联网思维指导质检改革发展,才能给质检事业插上腾飞的翅膀,让质检工作始终适应形势变化、走在时代前列。
大数据的价值不仅在于数据本身,而在于数据所反映问题的真实性和科学性,采集和存储大量数据,只是大数据应用的第一个阶段,对所占有的数据进行深入分析,实现开发利用,从中发现新知识、创造新价值、提升新能力,取得实实在在的工作成效,才能够真正实现数据的价值。在掌握海量数据,实现互联互通的同时,我们应针对事业发展的具体需求,认真思考探索,如何才能最大程度地实现大数据的有效利用,使之能够为决策提供依据,为风险提供预警,为公众提供服务,真正成为破解改革难题,促进事业发展,助力转型升级,提高决策水平的尖兵利器。在以后的工作中快速有效地发挥互联网大数据对质检事业发展的推动作用。
互联网大数据时代的到来同时也为我们的生活带来了巨大的改变,大数据是如何影响我们的生活,简单的说,它会让我们的生活更加困难或者更加容易取决于你是否拥有分析大数据的技术。毫无疑问要想在大数据中理出头绪不是一件容易的事情,如果不具备分析数据的能力,大数据会让我们的生活、工作更加困难。例如每逢“双十一”,“剁手党”都面临痛苦的抉择:打折的商品实在太多,买什么才好呢?最终一不小心,信用卡刷爆,买了一大堆自己不需要的商品,只得含泪吃半年的“康师傅”。但是更多的时候,大数据会让我们的生活变得容易,因为科技的发展比数据的积累更迅速,过去几年已经发明了许多分析数据、处理数据的方法,这些方法已经为我们服务。
毫无疑问大数据正在改变着我们的生活。过去几年无论是医疗、健康、交通、公共安全,还是生活、购物、旅游、娱乐都已经逐渐建立起了大数据的分析系统,无论是国家还是企业对大数据的投入都数以亿计。大数据的应用也从早期的数据密集型行业(例如电信、金融、能源、科研、互联网),逐步向非数据密集型行业扩张。一个路边的奶茶店需要大数据吗?当然需要。借助微信平台,只需要扫一扫二维码,奶茶店就会获得粉丝的关注。有了这些数据不仅可以开展打折促销,还可以通过互动了解用户口味,推出新品。
在大数据时代,数据不再是静止和陈旧的,任何被遗忘在服务器中的数据,都可能被重新利用,从而发现其中与我们、与行为、与现象的相关性。维克托·迈尔-舍恩伯格说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,绝大部分都隐藏在表面之下。感谢科技的进步,今天我们已经能够看到冰山之下的绝大部分。
第二篇:互联网大数据报告
互联网大数据报告
互联网产业研究主要从报告中关于医疗、教育与个人隐私保护三个方面进行解读。报告指出预测医学的兴起将是大数据在健康领域的终极运用;同时探讨在线教育如何确保学生的隐私不受侵犯等问题;在保护个人信息方面,技术轨迹正在转向采集、使用和储存对消费者和个人并没有直接联系的数据。
大数据与医疗保健服务
数据一直是医疗保健服务中的一部分。医疗保健服务供应商使用电子病历,极大地提高了可供临床医生、研究者与病人使用的数据量。医疗保险的偿付机制正开始从相互分隔、具有潜在不协调性的“按服务收费”(“fee-for-service”)模式转变至基于更佳健康状况的付费模式。总而言之,这些趋势正在帮助形成一个“学习型”医疗保健系统,在此系统内,临床数据将迅速反馈给患者并指导治疗有效进行。
大数据可以确定饮食、运动、预防护理和其他生活方式因素对健康的影响,使得人们不必向医生寻求医疗保健意见。大数据分析能够帮助确定临床治疗、处方药剂以及公共卫生干预对于特定或广泛群体的效果,并对传统研究方式提供参考。从支付角度来看,大数据能够保证给患者提供治疗的医生有优秀的临床记录,同时,治疗的费用根据患者的康复效果而非治疗本身的次数确定。
预测医学的兴起是大数据在健康领域的终极运用。这项强大的技术可以同时深入解析一个人的健康状况与遗传信息,使医生更好地预测特定疾病在特定个体上是否可能发生,并预测患者对于特定治疗方式的反应。与此同时,预测医学提出了许多复杂的问题。传统意义上,健康数据的隐私政策都力求在临床信息被分享与分析的同时保护相关患者的个人身份信息。而逐渐地,基于特定群体或人群的数据将在临床症状出现前或出现后不久被用于确定疾病的类型。
但是,预测医学挖掘出的信息所带来的风险将超出单一个体,一旦出现差错,不仅遗传信息提供者本人,他的孩子以及未来的后代等拥有与他相似遗传信息的人都将会受到牵连。因此,将基因组数据与医疗保健数据相连接的生物数据库便成为了个人隐私在医学研究与治疗领域中的无法回避的前沿话话题。
目前的隐私框架在不久前才包括了正在使用的健康信息,这一框架或许不能很好地解决上述发展带来的问题并推动相关研究的进行。运用大数据来改善健康状况需要先进的分析模型来摄取包括生活方式、基因组、医疗与财务数据在内的多种信息。生活方式与健康状况之间的紧密关系意味着个人数据与医疗保健数据之间的界限已经开始模糊。而这些类型的数据却收到不同的、有时甚至是相互冲突的监管。当数据的来源多种多样时,同时遵守多个法律带来的复杂性随之增加,与此同时,医疗机构还会与不受上述法律约束的许多组织相互勾结,形成一整套利益链条,各种个人健康信息被一系列企业共享,甚至于违背消费者对个人医疗数据隐私保护的意愿而出售其相关数据。在此情况下,针对医疗保健领域的大数据部门的设立也就成为了迫切之需,此举同时有望进一步降低行业成本并激发发展潜力。
尽管医学技术不断变化,但健康数据仍然是我们生活中非常私密的部分。在大数据使得较之以往任何时候都更为强大的发现成为可能的同时,重新审视相关信息被所有医疗保健机构共享后的隐私保密方式也显得相当重要。医疗保健行业的领导者已经呼吁构建一个更为广泛的信用框架,使得不同来源、不同隐私保密程度的健康数据得以汇聚。这一框架需要附加隐私保护条款,并同时设计标准化数据结构以提高其跨平台适应性。在研究了健康信息技术后,总统科技顾问委员会得出以下结论:国家需要建立统一的数据标准与结构使不同类型的数据记录可以在受到控制的条件下方便访问。
在医疗数据保密框架逐步跟进技术发展的过程中,需要医疗保健与保险的供应商之间细致协商,而这份努力,将为未来的国民经济与公民健康的福祉奠定基础。
对学习的研究:大数据与教育
如今,上到大学,下至幼儿园,众多科技帮助并提升了学生在课内外的学习过程。获取学习资料、观看授课视频、评价教学活动、进行团队合作、完成家庭作业、参加课程考试,这一切都可以在互联网上完成。
这些基于科技进步的工具与平台给予了学生与教师更多的可能性。仅需数代的革新,这些工具就能提供实时的评估来使学习资料能够按照学生的接受速度来进行演示。不仅如此,教育技术还能扩大受教育人数、增进学生间的互动并使教学内容的持续性反馈成为可能。
除了个性化的教育,新的数据类型的运用使得研究者对于学习行为的研究能力有了质的飞跃。从大规模开放在线课堂等基于科技的学习的平台上获取的数据可以被精确跟踪,借助这些数据,我们能够进行对远超传统教育方式的探索,对学生学习轨迹的移动进行更为准确与广泛的研究。具体包括:深入了解学生在学习活动中的接收效果,根据不同的学习目标,选择合适的学习资料,并进一步地运用这些数据帮助那些处于相似状况的学生。目前,教育部正在研究如何运用这些科技,并已开始整合国家教育技术计划下在线教学平台所产生的数据,并计划成立虚拟学习实验室,为进一步的研究提供方法论上的指导。
教育领域的大数据革命同时也带来了一些亟待解决的问题:随着科技日益深入课堂教学,我们如何最好地确保学生的隐私不受侵犯。一方面,本地社区历来都是教育的主要提供者;另一方面,大量的在线学习工具与课程都是由盈利性企业提供。这就导致了在谁有权获得线上教育平台产生的数据及这些数据应当如何被使用的问题上备受争议。
在大数据时代保护儿童的隐私
今天的孩子们是从识字前就接触数字设备的第一代人。青少年是移动应用与社交平台上的活跃用户。当他们使用这些科技时,关于他们的精确数据,其中一些甚至包含敏感信息,就在网络上被存储与处理。这类数据既包含能够大幅度提升孩子的学习效果并为其开启全新机遇的可能性,但同时,也可能在他们成人时形成一份入侵型的消费者个人信息,或通过其他方式对他们之后的生活产生影响。
虽然年轻人一般与成年人一样乃至更加清醒地意识到数据会被商业机构使用,但他们的数据还是会经常地受到父母、老师、大学招生人员、军队征兵人员与社会工作者的审查。他们中的弱势群体,包括寄养儿童与无家可归的年轻人,他们通常没有得到成年人的指导因而特别容易遭受数据滥用与身份盗窃。在强有力的监视之下,年轻人苦苦寻找保护他们隐私的方法,即使他们无法限制别人对于分享内容本身的获取,许多年轻人仍然尝试着用多种方式将所分享内容的含义变得模糊、晦涩,使得只有特定的对象才能理解其中的意思。
因为年轻人是那么的年轻,他们需要适当的自由来探索与尝试而不至于因一时的疏忽在日后受到挥之不去的侵扰。儿童在线隐私保密法要求网站运营商与移动应用开发者在收集低于13周岁的儿童的个人信息时必须征得其父母或监护人的同意。而现在,我们对于儿童正在遭受什么“伤害”以及怎样的政策框架才能确保他们伴随技术成长是一种促成而不是阻碍都还没能得出一个确定的结论。
与医疗保健一样,青少年在与数字教育平台的交互中表现出的部分数据是极其私密的个人信息,这些数据包括对于特定学习方式的偏好和他本人相对于其他学生的表现。它甚至能够分辨出有学习障碍或注意力无法长时间集中的学生。根据学生在一天内的上线与在线时间,他个人的生活习惯甚至都可以被获知。教育机构应当如何使用这类数据来改善学生的学习机会?对于使用这些平台的,特别是处于基础教育阶段的学生,他们如何能够保证自己的数据是安全的?
为了回答关于这些数据的所有权与恰当使用方式的复杂问题,教育部公布了针对在线教育服务指南。随着越来越多的线上学习工具和服务可以为孩子们所使用,地区也正密切地关注着这些问题。学校与学区以未来合法的教育效益为目的共享受到保护的学生信息,并且在分享的过程中必须对这些信息保持“直接控制”。即使在这新的指导之下,如何在大数据世界中最好地保护学生隐私仍必须是一个持续的议题。
当局正致力于解决这些问题,并通过教育部加以实施,来使得所有的学生在享受大数据在教育与学习上带来的创新效益的同时免于受到其潜在威胁所带来的伤害。学生数据必须是安全且珍贵的,无论它存储在何处,它都不是一种商品。这意味着必须确保学生的个人信息与在线活动不受到不恰当的使用,尤其当这些信息是在教育环境下被收集的。
大数据与隐私
以物联网为工具的大数据打破了许多私人空间。家中的无线网络信号(WiFi)中可以显示出屋中的人数及其位置,也可通过采集功耗数据来显示出你在屋中的移动。当你走出房间时,在线面部识别技术也可以将你从图像中识别出来。始终开启的有音频和视频接口的可穿戴设备以及整个物联网设备的出现只会产生越来越多的信息采集量。在合法使用的传感器的海洋中,限制信息采集是一个巨大的挑战,几乎是不可能的。
这种无处不在的信息采集是由大数据技术本身性质所决定的。无论是产生模拟信号还是数字信号,数据都被重复使用着,并且以前所未有方式结合,这便激励着更多的数据采集。数据的潜在价值推动着“土地战”,机构的重点也转向尽可能多的采集和利用数据。公司不断地发掘他们已有的数据,同时寻找他们需要的数据来提高其市场地位。当今世界,数据存储的成本已经大幅下降,同时仍具有尚无法预测的未来创新潜力,所以采集尽可能多的数据是至关重要的。
大数据的另一个现实就是,数据一旦被采集,就很难保持提供者的匿名性和隐私性。虽然有研究希望在大数据的采集中模糊个人识别信息,或重新标识“无名氏”的信息。融合数据技术集资要比隐私保护技术方便许多。总之,这些趋势要求我们关注四十年中,告知与同意框架是如何为隐私保护提供支持的。在结构性过度采集的技术中,重新鉴定要比识别功能更强大,并将重点放在了信息的采集和保存上,个人的隐私就没有那么受关注了。总统委员会科学技术的顾问说:“告知与同意框架已经被大数据所带来的正面效益打败了,大数据所带来的是新的、并非显而易见但十分强大的使用价值。
预测大数据变革的下一篇章
对于现在绝大多数的普通交互来说,告知与同意框架充分保护了隐私。但是总统委员会的科技顾问表示,技术轨迹正在转向采集、使用和储存对消费者和个人并没有直接联系的数据。假若该框架被违背,比如由我们的家庭设备采集的数据,我们则需要重新关注数据的使用,这一政策转向正在被专家、学者广泛讨论。数据的使用情况是极为重要的,它对社会有利有弊,如“双刃剑”一般。
负责任地使用政策框架会带来许多潜在优势。将责任从个人转移到采集、保存和使用数据的实体,由于个人在目前市场中的位置,他们并不能很好地理解和抗争告知和同意框架。关注于使用责任制,也可以使数据的采集者和使用者对数据的管理及其可能产生的危害负责,而不是狭隘地将其责任定义为是否通过正常途径采集数据。
更多地关注责任并不意味着忽视收集的环境。对数据负责,一方面就是要尊重原始数据的采集。实际上,如同在消费者隐私权法案所阐述的尊重环境原则,这一规则并不令人惊讶。虽然数据的收集不能立即用在就业上,但技术的发展正在向这个方向转变。先进的数据标记技术可以已采集和用户授权使用的信息细节进行编码,从而使许可使用的信息可以一直跟随着数据。若是该技术得到良好发展和广泛使用,即使不能解决大数据中所有的问题,也可以用于应对一些关键挑战。
或许最为重要的是,为了更负责地使用大数据,我们应该将关注的重点放到如何平衡大数据所带来的效益和对隐私以及其它由于大数据采集信息的不可避免性而受到危害的价值。我们是否应该制定规则,不能在任何环境下使用没有得到使用授权的数据,即只使用得到使用授权的数据?对于医学研究中为了治愈癌症而使用的数据,和商业营销中对消费者的广告定位而使用的数据,我们应该如何区分和界定它们?
正如奥巴马总统在人权消费者隐私条例草案的发布会上所说,“尽管我们生活在一个能够比过去更自由地共享个人信息的世界,但我们必须坚决否认隐私价值已经过时。”隐私“从一开始就一直是我们的民主制度的心脏,而现在,我们比以往的任何时候更需要它。”这在利用大数据的时代更是如此。
结论与建议
大数据变革正处于其最初阶段。我们需要数年才能理解其完整的技术内涵、其对健康、教育、经济的强化作用,及更为关键的是,它影响着包括隐私权、非歧视、自我决定权的核心价值观。
即使是在当下大数据变革的早期,本评估报告的作者仍认为重要的结论已然出现,即大数据可以从多个领域的层面告知当局者该如何迈出下一步。特别是以下五个方面,它们将引发关于在大数据世界如何最大化利益和最小化危害的全民讨论。
保护个人隐私的价值:在全球协作的隐私保护体系中,通过在市场上对个人信息的保护来维护个人隐私的价值。
稳定/持续负责的教育:要认识到学校(尤其是 K-12)是使用大数据以提升学习机会的重要领域,同时也要对个人数据的使用进行保护,强化数位素养和技术。
大数据与歧视:防止大数据使用过程中可能带来的新的歧视方式。
执法和安全保障:在执法过程、公共安全、国家安全中,确保大数据的合理负责使用。
数据公共资源化:将数据作为公共资源,用于提升公共服务,投资于能够推动大数据革命的科学研究。
第三篇:互联网大数据背后的秘密
互联网大数据背后的秘密
9月11日晚,受邀周伯通招聘和120多名远道而来的数据大牛们,在宇宙中心五道口,和大家一起分享了互联网大数据背后的秘密。
非常感谢,当晚大家冒雨出席,对一些我在数据分析里面的前沿经验,很高兴现场很多朋友听后,跑来分享自己的心得体会,也跟大家做了很长时间的交流。会后应很多没能到场的朋友的请求,把当晚的部分内容分享出来,希望能对大家有帮助,同时也欢迎大家继续交流碰撞。
今天很多是创业公司或者BAT公司,大家把时间花在下面,美国做了一个研究,大部分数据分析师和科学家花很多的时间,只有10%时间创造很多的价值。那么势必我们会产生更少的价值,用更多的资源,我觉得企业急需要解决的问题。不应该把时间浪费在下面,要做大规模自动化。
第一,我们要把数据决策权给公司里大量的员工,在过去五年在Linkedin做得最有 价值的事情,数据决策的权利给了很多很多的Linkedin内部员工,我们用技术引导很多人,能用数据做迅速决策,做大量决策,这点是我们看到一个趋势。
另外一个趋势,美国发现数据分析变成自动的东西,已经不是一个人做高级模型还是机器建模型,慢慢就抽象出来有智慧和智能,这种智能会产生很大的价值。大家想想,中国以前有《孙子兵法》,《孙子兵法》讲一句话,妙算胜寡算。如果道理是对的话,每个人用数据做决策,这对我们的业务一定会有很大的价值和产出。
下面节省时间,尽量自动化下面,把时间放在上面去,这是每一个数据驱动里核心的竞争力。这种竞争力,我给大家举一个例子,Linkedin讲的三个东西,产生了大量的数据,数据又产生了大量的价值,价值变成市场,再次反哺,是三角形的关系。
今天我们要谈的也是这个,如何把刚才说的一些比较虚比较技术性的东西和今天业务相结合。这张图是一个我从互联网上拷贝下来一张图,它叫Life Cycle。这个是生命周期,每一个企业都会或多或少经历这个周期,每一个人都要经历这个周期。大家看看非常有意思,制造阶段、成熟阶段、成熟阶段、衰减阶段。我们用户群,第一个阶段往往是有革命性的感觉的人,想来用新产品的人,这是很少一部分人。然后主流的人开始应用,然后是滞后用户,最后是衰减。很多产品市场策略通过这个做。
今天我们做的各种营销产品有五个环,我这里面第一个环叫品牌认知,已经提到了;第二,市场运营、获取;第三,产品交互体验;第四,销售线索转化;第五,客户忠诚度、留存。大家看看最大化这五个词它的核心是什么?它的共性是什么?
谁知道什么是SOV?五环后面全是KPI全是数据?你在获取认知的时候,你在市场里当你有多少生意,基数是全世界的生意,您的生意在全世界占多少。
首先,PFP,什么意思?我们要为每一个转化要付多少钱。
PPC,每个点击应该付多少钱。
CPM,千人点击率暴光成本。
我们可以再写50个往下,我们今天的企业是否也提上日程开始关注转化点。
第二是成长,尽量低成本获取客户,迅速大量获取客户,社交网络提出这概念,把口碑做出来,推荐新客户这个产品,变成注册用户,最后变成专业的注册用户,比如Linkedin,第一点,他注册,他完成简历就是变成专业注册用户。
CAC,客户获取成本,我每一次获取客户是有成本的,这里面没有东西是免费的,我们获取成本是有成本,我们要付出精力财力人力。Cohort,我们需要理解客户,比如第一天进来的客户。成长里面有一系列的KPI,很多公司要关注它核心的东西。
再下来是Engagement,每天有多少活跃用户,MAU、PPV、UV,Engagement数据是最大的,登录的频次,哪个区域来的人,哪个渠道来的人,这也是最大最有价值的数据源。
再下面是Monntization,电子商务有多少付费,购物车的数量,ASP,你单价是多少。GMV,电商用这个词汇,整个销售额。再下面 MRR,Linkedin里面有一个最核心的值就是MRR,是一个Saas企业,是按年按月付费的,这点对Saas重复付费的企业是核心的营收指标。再下 面LTV,整个客户全生命周期的价值,这里边衍生成40、50个。
最后一点,就是Resurrections,用户流失怎么办?有多少睡眠的用户,有多少僵尸客户,再下面沉重的客户,不用的忽然被拉回来,再下面有流失的用户。大家想想,每一个这里边的KPI背后都有是什么?背后都有我们怎么做。
为什么我们有Doramnt Users,我们需要重新激活,如何激活,营销手段、电子邮件、广告把客户重新激活,为什么?因为保持一个客户成本远远低于获得新的客户的成本,基本贯穿
所有行业。再下面比如说Churend用户,Linkedin把利润弄得很薄,最早期5年以前刚去公司,每年假设一百个用户注册,转年只有一个用户还继续 付费,99%的人都离开。当我们离开的时候,100%的流失率变成50%变成20%的流失率,这种流失率的减低,在营收上是呈几何倍数的月销售额的增长。Linkedin的营业额,我去的时候6千多万美元,变成25亿美元,我估计今年能达到30亿,大家想想看增长超过40倍是怎么做到?把这个值做好,把
Churned降低了。所有KPI的背后都有一套打法无论从销售、工程、产品上都有各种打法,我想把核心理念跟大家分享。
Linkedin最大的营业额来自于企业级服务,卖给公司,卖给公司的过程,把公司视为用户进行转化。怎么做?
第一,通过营销手段,把公司和企业变成销售线索,销售线索变成机遇,再一拨的转化就变成销售,这个人就变成一个客户,买超过一次的人,这是一个漏斗,最后保持客户忠诚度。我相信每个企业来保持这个漏斗,分析漏斗的合集,说起来简单,运营起来复杂,Linkedin有800多个KPI,刚测试的时候只有100、200个,现在有800个,如何管理呢?很简单,我们需要在用户级别对数据进行规范。
以往出来的各种工具,比如说不管谷歌的分析,大概有30%、40%人用过,很传统工具它的分析对象不是人,而是物。比如说首页有多少注册了,都是围 绕物和内容来展开,这一点违背今天的核心概念,我们所有的分析一定要以用户为基础,才能把整个生命周期打通,漏斗的核心概念以人、用户为基础的方式。
第二点,整个漏斗本质就是要把一个非付费或者非活跃变成付费变成活跃过程,这里面核心有两点,第一点,我们需要 知道用户该怎么转化?我们叫定义。一个事我们是不能衡量,你很难改变它,这句话不是我说的,是管理大师说的,一个事物如果我们不能衡量,我们就不能改变 它,比如我想减肥,家里没有称。比如我想财务获得自由,我根本就不知道我有多少钱。比如说我想去一个地方旅游,我根本就不知道那个地点离我有多远,所有东 西必须有衡量才能增长,这是为什么分析很重要的原因。
Part 2 如何用数据提效
第一,增加新客户,我们需要知道分析每个渠道来了多少客户,谁是从哪个渠道来的,这是非常重要的起点,否则我们投放很多广告没有任何反馈。
第二,如何提高社交网络效率。比如在自媒体或者社交网络平台上,广告影响力是什么样的,非常有意思,衰减速度很快,衰减速度呈几何倍数增长,但是能持续两到 三天,这是分析出来,第一天转化率多少,第二天,第三天,第二天半就过了,另一个生命周期就开始了,下一个运营又开始。
第三,各个渠道的客户购买倾向。每个渠道来的人,一定有不同的行为,这是我们通过各种数据分析看到的结果。比如百度渠道来的,360渠道来的,比如好搜、比如谷歌渠道来的,他们一定有细微的差异,差异体现在用户转化效率,获取客户成本上面还有ROI上面,一般把流量做一下,这是远远不够的。
第四,客户区隔,定制营销方案。每一个客户有自己的属性,但是每一个客户都有相似性,全世界的人不是都要买苹果,有倾向性的客户放在一起,大幅度降低获取客户成本。第二,我们可以迅速把产品在这些客户里面进行复制,一复制产品增加营销销售额,同样的产品放在同样人群里面复制很快。
再有一点ROI,我们需要非常迅速持续的去衡量各个渠道来的用户转化和投资回报比,这一点,老美确实是做得非常 好。当时我在零售业的时候,他们每次发一次广告,要详细计算成本,包括印制传单成本,比如说营销设计成本,发多少广告,工本费,另外一点产品打折成本,各 种成本计算还有计算产品大约要卖多少件,大约要卖多少钱,所有这些东西都算完。最后算每个用户购买可能性,计算所有成本,才会把这封邮件或者offer发 出去,这样每一次提升运营效率,有运营效率就是挣钱,每一次营销都要挣钱。
再举一个例子,产品分析。在座的,谁不是互联网企业?互联网企业核心概念产品的体验,产品体验变成核心价值观,要想做出口碑来,产品必须要好,怎么 能好?我们如何知道产品做得好与坏,需要客户反馈,多少人为产品做过市场调研?三个、五个。做市场调研的企业还蛮少的,这是一种事实。客户也许给我们调 研,他会撒谎他会说得不太对,但是客户行为会反映他是否真正喜欢我们的产品,这就是数据会驱动整个产品设计一个核心概念。
首先,我们需要知道用户都在用什么。第二点,我们需要知道用户使用是不是非常流畅,这里又换到流和漏斗概念,从功能A到功能B,流失率有多少,这是 我们必须要关注。转化的效率,持久关注转化。在EBAY,我们观测从购物车到购买,我跟大家讲这个,每个小时的变化不能超过0.1%,0.1%的差异就需 要立刻检查到底发生什么,无论它升高或者减低了,大家想想对转化效率追求极致,导致挣钱核心原因,我们知道每一个原因,一百个进购物车只有50个人才交 费,慢慢出来能形成指导体系。
再有一个用户画像,知道用户属性。在美国核心关注在是男士还是女士,收入状态,住在什么地方,年龄等等,理解用 户画像会产生更多价值。在美国今天这部分产生价值远远低于用户使用行为产生的价值,为什么?用户画像的数据往往都是缺失或者静态都比较老的数据,用户行为 是动态,数量很大,我们迅速知道它的RFM。分析里面有一个RFM,F,代表来了多少次,M,花了多少钱,用三个指针构建一个模型。
下面理解用户趋势,判断一个用户,通过各种细微信号,得到他的倾向性,不是用一个指标预测,比如首页登录频次,购物车用的次数,搜索频次等等所有细 微指标慢慢加起来就会形成一个非常平衡的指标,这个指标就是倾向性。比如以前我们针对Linkedin企业用户那些公司,给最后销售看的数字就两个数字,大家看了850个指针,真正给销售看是两个数字,第一个数字用户购买,叫温度,温度越高购买可能性越高。第二,健康度,什么概念?用户用越多,就越健康,就用这两个维度对全世界的公司进行排名,发给每个销售人员,产生销售线索,就这两个值,热度和健康度,而且画的图,把所有客户放在一张图上面,非常健康的 用户却不购买,这边是非常高购买欲却不使用,还有这边既有高使用和高购买。经常使用不交费,如何让他付费,我们又把客户分成三个群,既不用又不购买这些用 户,我们又有另外一套打法,高加高,高加低,加低高,低加低。
再下面假设检验,这一块在产品做AB测试。AB测试是最简单的能验证产品性能的方法,一定首先核心KPI体系建 设完了,一个事物不能衡量,你很难增长它,首先要把核心指针定完,定完要迅速的把客户区隔进行各种检查检验,比如把成本A是这样的表现,成本B是这样表 现。刚才跟创始人聊了一下,没有一个产品是一次就设计好的,很多产品都是反复的迭代的把它产生出来,所以不停用数据设计它的效率,因为真正的老师是客户,客户用得好是产品设计得好,客户不喜欢是产品设计有问题,这是不断迭代的过程。
Part 3 如何增加销售、促进客户留存
如何用数据促进销售?我就想迅速讲。我们如何能判断一个客户是否买单?这是一个非常重要的问题。做了很多的活动,把人拉进来,怎么判断一个人能买?就是通过他对产品的使用,就能判断他是否会买。一个网站,一个人看了90个页面,另外一个用户就看两个 页面就撤了,看90个页面的人必然大于看两个页面,然后还要分析,用户用的哪个页面哪个功能会增加他的购买度?大家看看,经常搜索的人和一个点一两次广 告,搜索的人想要什么东西?搜索频次高有自驱力想买东西,我们要找到产品点。下面,针对B2B企业讲得很多,在Linkedin,我们分析完了发现公司各 个关系不一样,认识里面人的人,认识决策人。最后如何接洽,不是每个客户行为是完全一样,比如一个曲线是呈M型,一条曲线,早晨9点是低谷到中午上 去,12点下来了,然后又下去了,6点变成为零,这是什么样的公司的一种使用情况?M型曲线,早晨8、9点开始,中午吃饭减低,然后回去,下降。国企,企
业软件,一般针对于企业用户是这样用。再看一个,早晨8点这样,一上班这样,中午又上面。微信。
再看一个,这样上去,到夜里头还不停又下去了。玩游戏的,年轻人。他们看每个趋势是不一样的,人的行为在很浅的线,这些线,上来看这条线,这条线是 很多小线组成,叠加在一起成为M的曲线。我们把客户拆分出来,大家发现公司里面有很早起的人,还有很多高活跃企业用户,有可能是晚上才用,这里面慢慢把客 户区分出来,针对他们有不同的打法、方法。
最后一点,举Linkedin的例子。以前Linkedin去卖东西都得拍脑子,谷歌,一百万美金,今天就把它搞定了,后来通过数据分析,分析出 来,谷歌每年得花500万美元,实际上跟谷歌签的单子,五年2300万的和约,通过数据分析看到了使用频次是非常高,用户活跃度很高,雇了很多很多人,各 种汇聚,看去年招了7千人,都是从ABCD公司招来的,这些人干什么东西,你通过内部推荐招40%,剩下需要猎头或者HR,算来算去。客户每一次听这故事 就买单了,那是事实,是从数据里推演出来,我讲Linkedin的故事,我想大家自己的企业一定有自己的故事,故事非常美妙,数据讲通了,有一个好处就是 规模化。比如网站,去台湾讲是这个原因,去美国讲是这个原因,都基于数据,很简单。
第四篇:大数据时代来临读书月心得体会
一部似乎还没有写完的书
——读《大数据时代》有感及所思 读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固 有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!
更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量 和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢? 其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
合纤部 车民
2013年11月10日篇二:大数据时代书面记录与心得体会
大数据时代书面记录与心得体会 2015年5月12日,听取了大数据时代相关技术的技术讲座。当今,大数据的到来,已经成为现实生活中无法逃避的挑战。每当我们要做出决策的时候,大数据就无处不在。大数据术语广泛地出现也使得人们渐渐明白了它的重要性。大数据渐渐向人们展现了它为学术、工业和政府带来的巨大机遇。与此同时,大数据也向参与的各方提出了巨大的挑战。大数据,其影响除了经济方面的,它同时也能在政治、文化等方面产生深远的影响,大数据可以帮助人们开启循“数”管理的模式,也是我们当下“大社会”的集中体现,三分技术,七分数据,得数据者得天下。“大数据”的影响,增加了对信息管理专家的需求。事实上,大数据的影响并不仅仅限于信息通信产业,而是正在“吞噬”和重构很多传统行业,广泛运用数据分析手段管理和优化运营的公司其实质都是一个数据公司。麦当劳、肯德基以及苹果公司等旗舰专卖店的位置都是建立在数据分析基础之上的精准选址。而在零售业中,数据分析的技术与手段更是得到广泛的应用,传统企业如沃尔玛通过数据挖掘重塑并优化供应链,新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分析,为用户提供更加专业化和个性化的服务。大数据在个人隐私的方面,大量数据经常含有一些详细的潜在的能够展示有关我们的信息,逐渐引起了我们对个人隐私的担忧。一些处理大数据公司需要认真的对待这个问题。例如美国天睿资讯给人留下比较深刻印象的是他的一个科学家提出,我们不应该简单地服从法
律方面的隐私保护问题,这些远远不够的,公司都应该遵从谷歌不作恶的原则,甚至更应该做出更积极的努力。
生活,工作以及思维的大变革
——读《大数据时代》有感及所思
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。
第一个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。也就是说样本等于总体;第二个转变是对研究数据不会追求精度,而且追求混杂性,小数据时代下,追求精确度是合理的,因为我们收集的数据很少,所以要越精确越好,包括如今仍然也在使用这种办法;但是在某些时代,尤其是在大数据时代背景下,快速获得一个大概轮廓和发展脉络,要比精确性重要得多,既然选择了整体性,肯定要忽视细节和确定性;第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。
这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。这本书给我感触最深的就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结 果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。
过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。
在这个信息爆炸的时代,大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,把握住大数据时代变革的思想,才能在时代潮流中成为佼佼者,在思维上思路上略高一筹,才能在行动中占得先机!篇四:《大数据时代》读书心得
大数据时代,引领信息全球化
——读《大数据时代》有感
如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
粗浅认识之我见
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据;
二、更杂:不是精确性,而是混杂性;
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误
读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文
社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
浅薄之语抒我意
概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”其实,概念的界定要看研究者从哪个角度来研究它而定。
科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相
反,把数学算法运用到海量的数据上来预期事情发生的可能性。”舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。篇五:《大数据时代》读书心得
大数据时代,引领信息全球化
——读《大数据时代》有感
如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。粗浅认识之我见 舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据;
二、更杂:不是精确性,而是混杂性;
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。
第五篇:“大数据时代”来临,企业数据管理面临挑战
“大数据时代”来临,企业数据管理面临挑战
IDC研究表明,到2020年,全球以电子形式存储的数据量将达到35ZB,是2009年全球存储量的40倍。这其中企业数据正在以55%的速度逐年增长。人们不禁感叹随着信息化的逐步推进,我们迎来了大数据时代。
何谓“大数据”?哈佛大学社会学教授加里·金谈到大数据时曾说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”通过上述的话我们可以概括出大数据主要的三个特征:量大(PB级别的数据)、实时性(更短的时间处理数据)、多样性(非结构的文档数据为主)。
以金融行业为例,当前金融行业面临的一个非常大的问题就是海量数据的存储以及对海量数据的查询优化。传统的数据存储方案已经不能满足大多数金融企业的需求,例如目前很多企业正在建设的数据中心,典型的特点是海量级(千万及以上)数据量,随着数据量的进一步增大,查询性能急剧下降,甚至无法响应,严重影响了业务的连续性,为企业的高效运营带来了挑战。Hyperstor作为兴宇中科提供的一个操作简单的、综合的、性价比高的数据管理安全解决方案。它能够实现真正的CDP数据持续保护及实时恢复。从根本上保证了企业业务的连续性,满足了企业高效运营的需求,是理想的企业级数据安全解决方案。
正是因为大数据的这些特点,给现代企业带来了如何通过数据中心变革解决企业数据管理的问题?这一问题逐渐成为了现代企业发展所面临的关键问题,其在电信、金融等“数据就是业务本身”的行业身上表现的尤为突出,并且已经让很多相信数据之力量的企业正在或者正准备做出改变。
Hyperstor作为针对企业级数据管理存储备份的一体化数据保护解决方案已经在电信,教育等行业得到广泛应用,它能够解决金融,电信等行业多年以来在系统集成、数据管理、业务整合、新业务拓展、面向客户服务以及在成本控制和核算上的系列难题,相信该解决方案将给国内多个行业发展带来一个全新的面貌。
随着信息技术的不断发展和大数据时代的来临,企业未来的数据中心,将是高可靠、高安全、易扩展、易管理、绿色高效、资源共享的智慧云数据中心。能够灵活支撑业务发展,实现监控可视化、控制自动化、管理流程化,并最终帮助企业实现基于优化的基础架构的管理。
因此,企业必须通过优化自身IT设施,实现存储容量和可用性的最大化,实施灵活性设计以支持不断变化的业务需求等相关措施来迎接大数据时代带来的机遇和挑战。