大数据蓝海的历史使命

●○●大数据蓝海的历史使命

现在网络上信息如海,数据如山。如何便利快捷地找到自己需要的信息,如何利用如海似山的数据创造有竞争力的商业模式,如何掌控大数据进行社会管理和服务,正是今天个人用户、以网络业为首的企业界以及社会管理部门所面临的重大机遇和挑战。

在如何获取大数据的问题上,网络业正在逐步形成三种战略:前台为主、中台为主或后台为主。苹果公司实行的是典型的前台为主战略,即通过设计、制造和销售各类数据终端从源头上获取数据,通过自己开发的操作系统和开放平台来规范数据的标准,通过自己的云计算系统来汇集和存储数据。Facebook实行的是典型的中台为主战略,即通过Web 2.0平台的建设和运营获取标准化和结构化的数据,并通过标准接口和对第三方应用的开放形成庞大的共享数据流。亚马逊实行的是典型的后台为主战略,通过建立强大的经营后台获取丰富的用户数据,并通过对第三方电商开放获取电子商务行业的大数据。

以何为主并不意味着排斥其他,实际上真正有实力有理想的网络公司正在全面出击,实施着系统的大数据战略。谷歌曾经是个单纯的搜索网站,至今靠搜索仍创造着辉煌的业绩。但面对Web 2.0革命的挑战和隐约可见的大数据时代的来临,谷歌几经踌躇几经磨难毅然走上了转型新路。谷歌通过Google+将网站进化到平台,抢夺中台阵地;通过安卓移动操作系统和推出平板电脑,争雄前台市场;通过Sky Drive涉足云计算领域,试水后台。这看似复杂的全面出击的玩法如果从大数据的角度去理解,暗藏的逻辑和雄心昭然若揭。

在如何管理大数据的问题上,无论谁来做都难以回避三大挑战:个人隐私、企业利益和社会安全。在大数据争夺战中,个人、企业和政府是三大主角,打得难解难分。在理想上,大数据的获取和使用约束越少越好;在现实中,数据所有权和使用权却成为巨大的障碍,大数据难以做大。经过多年探索和实践,一些约定俗成的规矩逐渐形成,在一些国家已经上升到了法律层面。例如,个人隐私未经本人同意不得公开,非公开地获取和使用也得保护个人信息(姓名换成ID、地址换成邮政编码、屏蔽信用卡号码等)。随着网络服务的发展,企业间的数据平等共享和交换开始时髦起来。至于对那些靠百姓税金养活,存在的唯一目的是为百姓服务的社会管理部门,越来越多的国家立法规定必须向公众提供原始的、完整的、实时的数据。三大挑战依然存在,但最多只能迟滞而不能阻止整个社会走向大数据时代。

在如何利用大数据的问题上,正在出现三种局面:数据独占、数据共享和数据公开。无论在个人层面、企业层面还是政府层面,数据独占几乎是一种本能。大家凭直觉认为一旦把自己的数据拿出去共享或公开,一定会被别人占了便宜或者做出对自己不利的事情。这有一定道理,但代价是停滞在前大数据时代,无法有效利用大数据时代带来的机会和发展空间。

以苹果和Facebook为代表的Web 2.0平台正在使数据共享成为时尚。基于平台与应用之间的数据平等交换和共享,平台运营商和应用运营商都获得了过去无法获得的用户数据。当然,这种平等交换和共享是相对的,一个成功的平台可以汇集和整合数以十万计的应用所带来的丰富数据,进而形成大数据,而每个独立的应用获得数据却极其有限。但无论如何,这种交易是公平的、双赢的,尽管大赢家是平台运营商。

在数据公开方面,引导潮流不是个人或企业,因为他们受困于个人或企业的利益,代表公共利益并由公众税收维持的政府反而正在成为数据公开的潮流引领者和规则制定者。世界上几十个国家于2011年成立了自愿参加的开放政府联盟,其中的佼佼者是美国和英国,但也有像秘鲁、东帝汶、肯尼亚这样的发展中国家加盟。这个联盟的基本宗旨就是向人民提供尽可能多的数据,通过对数据的掌握和利用造福于整个社会。今天,由美国政府开发运营的大数据网站data.gov正成为有志于大数据时代建功立业的个人、企业和社会团体的朝圣地,这个网站体现了大数据时代所需要的基本特征:数以十万计的开放数据库,数以千计的数据分析工具,对任何第三方开放,欢迎来自其他国家、企业和个人的参与建设和创新。

大数据是个浩瀚的蓝海,无边无际,风很大,浪很高,水很深。主动参与进去未必能成功,而被动卷入则一定失败。在山重水复中寻找新路,注定是这一代的历史使命,无论他们是个人、企业还是政府。