CDT编辑注:本文为端传媒付费深度报道节选,阅读全文请订阅端传媒。

光鲜表象之下,中国大数据产业是在稳步发展,还是在野蛮生长?在法律法规缺失的情况下,个人隐私与数据使用如何平衡?大数据的广泛应用,是会带来便捷高效的生活,还是让威权变得坚不可摧?

端传媒记者 吴婧、戚振宇 发自北京、香港

大数据正以前所未有的力量影响著政府决策、商业活动乃至每个人的日常生活。业内预期,中国有望在2020年成为世界第一数据资源大国。图为2017年5月27日,贵阳举办的2017中国国际大数据产业博览会期间,一位参加者在数据分析中心。 摄:Lintao Zhang/Getty Images

本文要点:

1. 大数据主要握在政府部门、互联网巨头和移动通讯企业手中,应用领域包括医疗、交通、金融、社交平台、网络购物等等。

2. 中国大数据交易市场最受欢迎的数据来自互联网、金融、电信、医疗、交通和教育领域。交易形式主要有三大类:原始数据交易;按客户需求、以原始数据为基础分析趋势或结果;为交易双方提供中介服务。

3. 近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,已有超过20个中国城市建立了大数据交易中心,但交易量普遍不大,绝大部分正规交易平台都处于亏损状态。

4. 中国的大数据交易面临三大挑战:坚固的“数据壁垒”、参差不齐的数据质素、野蛮生长的数据黑市。

5. 目前中国的法律对于你产生的数据是否属于你并没有清楚的界定,但显然政府和企业都没有将数据所有权让予用户的打算。

6. 中国的互联网巨头和决策层都预感到大数据对社会管治带来的变革将是颠覆性的。习近平对国家大数据战略提出了“审时度势、精心谋划、超前布局、力争主动”的十六字方针。

7. “数据壁垒”是建立社会信用体系中最难攻克的关卡,对此,人民网总裁叶蓁蓁提出了“党管数据”的方案,认为须用行政力量强制打通数据壁垒。

在世界上任何一个国家或地区,“大数据”可能都没有在中国这般光彩夺目——最高层视其为重要的执政资源、社会治理变革的关键所在,作为国家级的战略部署强力推进;科技巨头们渴望透过它掌握用户行为、获取更大利润,不惜斥巨资对手中数据进行分析、挖掘和利用;普通民众则在数据带来的便利中自我陶醉——买着被精心推送的商品,看着被算法层层筛选过的新闻,随时随地扫码付账,却将个人隐私忘得一干二净。

政府、企业和民众,在对待大数据这件事上吊诡地实现了高度一致。大数据正以前所未有的力量影响着政府决策、商业活动乃至每个人的日常生活。中国也一举成为大数据领域的排头兵,不仅数据资源占有量即将成为全球第一,在数据分析和数据交易领域也走在世界前列,政策的扶持、宽松的监管和民众对于隐私的忽视,让大数据和人工智能、基因编辑技术等一起,成为中国实现“弯道超车”的核心所在。

图为中国第一家以大数据命名的交易所——贵阳大数据交易所内景。摄:彭丽勇/端传媒

[…]

近两年,从中央到地方,陆续出台了各类推动大数据发展的政策,贵州、上海、武汉、哈尔滨等城市纷纷建起大数据交易中心,至今已超过20个。

这些背靠各地政府的平台在获取政府数据接口时具有得天独厚的优势。一名交易所高管向端传媒透露,平台交易的数据介于政府公开数据和秘密数据之间。

在交易平台上,政府是卖方也是买方。因为不同地区、不同部门的政府数据尚未打通,A地交通部门会购买B地的交通数据作为管理参考,公安部门也会想从通信企业购买数据。

 

[…]

你的数据属于谁?

如何在政府和企业收集数据的同时,保护个人隐私?这是一条既难把握、又不断变换的界线。目前,中国还没有专门的法律法规来界定用户隐私。2017年6月起实施的《网络安全法》保护个人信息,包括但不限于公民的姓名、出生日期、身份证号码、住址、电话等。但在大数据时代,这个界定范围显得很单薄。

中央民族大学法学院副教授李扬曾指出,中国传统法律主要局限于公民隐私权的保护,但大数据时代,个人信息的边界日益扩展和模糊,仅依靠传统的隐私权的概念已难以保障个人信息。例如说,用户的消费习惯、最常打车的路线等算不算隐私权?

2016年4月14日,欧洲议会(European Parliament)投票通过了商讨四年之久的《一般数据保护法案》(General Data Protection Regulation, GDPR),该法案将于今年5月25日正式生效。法案要求:

设于欧盟内或为欧盟居民提供服务的企业或机构,如果收集、传输、保留或处理涉及 PII(Personal Identifiable Information,个人信息,如姓名、电邮、照片、IP 地址、照片、社交媒体帖子、医疗或财务信息),必须遵守 GDPR;
用户可以要求系统停止记录和使用自己的行为数据;
不能长期保存和使用用户的行为数据,保存时限为一年半;
在保护隐私的基础上,数据的归属权问题被进一步提出。

当你下载一个 App,对弹出来的安装条款点击“同意”时,App 的运营商便可获取你的相关行为记录,用作分析、精准营销,甚至在“脱敏”(指脱掉姓名、身份证号等能锁定身份的信息)后进行交易,此时,这些数据还属于你吗?

中国的法律对此尚无定论。去年3月通过的《民法总则》127条仅含糊表明:“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,但并未对数据的内涵和归属下定义。一些法律学者认为,用户只是数据的产生者,没有平台的运作和投入,数据就无法产生价值,因此数据的所有权应归平台所有,但平台在使用数据时有保护个人隐私的义务。

这种看法引起一些用户的不满:大数据源于对个人数据的收集,之后虽然通过技术加工处理,但所有权仍应归属于个人。如果购物网站利用我的数据开发了新产品,我难道不该从收益中分一杯羹吗?退一步讲,我总有权利知道自己的数据被如何使用了吧?

当然,在现今中国,政府和企业显然都没有将数据所有权让予用户的打算。

[…]

事实上,中国国务院在2014年就印发了一份《社会信用体系建设规划纲要》(2014—2020年),计划在2020年基本建立社会信用体系,届时每个公民、企业甚至政府机构都会获得信用评分,再配之以守信激励和失信惩戒机制,以达致总理李克强所说的——“让失信者寸步难行,让守信者一路畅通”。

在这套社会信用体系中,你将如何被评分?《连线》(Wired)杂志在去年10月的一篇长报导中,介绍了目前中国最大的个人征信平台之一、阿里巴巴旗下“芝麻信用”的评分机制,它大致包含五个方面:借贷记录、履约记录、个人特质、行为偏好与及人际关系,而这些数据主要都来自你在使用阿里巴巴旗下淘宝、天猫、支付宝等业务中的网络行为。

[…]

可以预见,大数据对于社会管治带来的变革将是颠覆性的。去年5月,阿里巴巴集团董事局主席马云,就在一次演讲中宣称大数据重新定义了计划经济和市场经济——“大数据时代的出现让人类进入了万物互联的时代,取得对数据进行重新处理的能力也远远超过过去,对世界的认识将会提升到一个新的高度,大数据让预判和计划都成为了可能。因此,我们需要对计划经济和市场经济进行重新定义,市场经济不一定会比计划经济更好。”

嗅到大数据将要带来巨大变革的,当然不仅是科技巨头。去年12月8日,十九届中共中央政治局的第二次集体学习,就将主题聚焦在大数据。雄心勃勃的习近平对国家大数据战略提出了“审时度势、精心谋划、超前布局、力争主动”的十六字方针,要求各级官员深入了解大数据发展现状和趋势及其对经济社会发展的影响,推进数据资源整合和开放共享,加快建设数字中国。