大数据时代的个人隐私保护

认识大数据

        在互联网刚兴起的时代,有一句话比较流行:“在互联网上,没有人知道你是一条狗。”没错,在那个时代,智能手机和平板电脑等智能设备还没发明,人们上网的唯一方式就是通过现在看来属于古董级别的老式电脑。网络的虚拟性和匿名性让人们感觉很新奇,也很神秘。你只需要一个网名,就可以驰骋网络世界而不被任何人认出来。你可以和远在千里之外素未谋面的陌生人谈笑风生,成为朋友。你甚至不确定跟你聊天的是人还是一条狗。

        然而,IT技术的发展速度之快完全超乎了我们的想象。随着大数据时代的到来,这种情况发生了极大的改变。我们在互联网上的一切都变得无法隐藏,甚至毫无隐私可言。为什么这么说呢?这里先卖个关子,我们先来看看什么是大数据以及大数据给我们带来了什么:

        早在2008年,“大数据”的概念就开始出现。到2011年6月,世界著名的管理咨询公司麦肯锡公司发布了一份关于“大数据”的报告,该报告对“大数据”的影响、关键技术和应用领域等都进行了详尽的分析。从此以后,“大数据”逐渐受到了世界范围内的广泛关注。也标志着大数据时代的来临。

        那么什么是大数据呢?根据麦肯锡全球研究所给出的“大数据”定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

大数据的应用实例

1.大数据助导航用户躲避交通拥堵

        高德地图是国内首家上线实时路况信息和躲避拥堵服务的手机地图。数据就主要来自于高德交通行业浮动车(行业运营车辆如出租车、物流车)和高德地图超过3亿用户出行数据的结合。除了基于自身用户往年同时段历史出行数据,还结合了全国多家交通管理部门的权威数据,从而提高预测的准确性。通过汇总实时的路况信息数据,为用户提供最合理畅通的导航路径即实时化的智能路线规划。高德地图数据统计显示,使用导航APP躲避拥堵功能出行,可节省15%~20%的时间成本。

2.京东用大数据勾勒用户画像

        京东数据的特征,就是一个“全”字。在庞大的订单量背后,京东的数据链记录着每个用户的每一步操作:从登陆京东商城浏览、选择商品、页面停留时间、评论阅读情况、是否关注促销到加入购物车、下订单、付款、配送要求,最终是否有售后和返修,用户的完整数据都被记录下来。

        即以每一位用户为中心组织数据。京东通过各种分析模型建立了“用户画像”,其中不仅有用户的年龄、性别、购物习惯,更有根据其购物行为分析出的大量数据,例如他是否已婚,是否有孩子,对促销是否敏感——用户画像让京东更懂用户。每个用户都可以在京东上看到针对自己的页面内容、产品推荐、优惠促销,京东甚至有计划把大数据和自提柜的配送模式结合起来,预测用户将要购买的产品,提前送到他附近的自提柜,用户一旦下单,就可以马上付款取货。

3.大数据技术助力特朗普赢得美国总统竞选

        特朗普聘请的大数据公司Cambridge Analytica。它擅长基于OCEAN(五大类性格,开放型、严谨型、外向型、亲和型、神经质型的简称)模型,通过人们的在互联网上的足迹,大数据分析人的心理和性格,细分目标受众,创新政治推广方式。该团队利用OCEAN模型,将美国国民分为32种不同性格的人,锁定人群仅限17个州,发现偏好买国产车的美国民众可能就是特朗普的选民;注重为选民建立心理档案,根据数据分析结果向重点区域选民进行精准投放竞选广告,最终助特朗普胜出。

4.Google用大数据预测流感爆发

        “谷歌流感趋势”(Google Flu Trends,GFT)未卜先知的故事,是大数据应用的经典案例。美国有个很牛的部门叫CDC,也就是疾控中心,这个部门统计美国本土各个地区的疾病就诊人数然后汇总,最后公布出来。但是呢,这个公布的数据的结果一般要延迟两周左右,也就是说当天的流感的全国就诊人数,要在两周之后才知道。Google公司于2008年11月启动的谷歌流感趋势(GFT)项目,就是利用他的搜索引擎,只需分析数十亿搜索中45个与流感相关的关键词,GFT就能比CDC提前两周预报流感的发病率。而且这个预测数据和CDC后来公布的数据基本吻合。也就是说,人们不需要等CDC公布根据就诊人数计算出的发病率,就可以提前两周知道未来医院因流感就诊的人数了。有了这两周,人们就可以有充足的时间提前预备,避免中招,避免了不必要的痛苦、麻烦和经济损失。

大数据带来的隐私泄漏隐患

        通过上面几个应用实例,相信读者可以看出一些端倪。就是大数据应用的数据来源基本都是基于对海量用户数据的采集,保存,分析,并进行数据挖掘,加以利用。比如你用浏览器搜索访问了哪些网站,用搜索引擎搜索过什么词、输入法打的所有字、下载过哪些东西、手机的一些会定位的软件这些都会在你的使用中不经意间窃取你的信息。软件得到信息传回服务器后台接着会对你的这个信息进行分析,然后对你的整个人消费习惯、兴趣爱好、收入特征、工作性质、甚至是性别男女、家庭住址、电话号码、上班途径哪些地方都统统的给你分析出来。

        在这些数据中,很大一部分涉及到了个人隐私信息,他们甚至掌握了一些连你身边的亲人都不知道的事情。而且这些大部分都是在用户自己本身不知道的情况下私自收集的。所以就像前面提到的那样,进入大数据时代以后,我们在互联网上的一切都变得无法隐藏,逐渐成为“透明人”。

        也许你会说,我平常不做见不得人的事,被他们知道也无所谓。对此,只能说,这种乐天的心态很好,但是套用一句网络流行语:“too young too simple”。如果收集的信息只是针对用户来定向投放广告,给你打打推销电话、发发广告短信,那也倒没什么。实际情况是,就目前的情况来说,谁也不能保证这些被收集的隐私数据的安全性。如果泄露出去被别有用心的人拿来做些非法的事情后果不堪设想。

个人隐私泄露知多少

        此前,曾发生过腾讯QQ群数据遭泄露事件,涉及7000多万个QQ群、12亿个QQ号。2016 年,发生了雅虎公司15 亿用户信息被盗,网易邮箱过亿用户数据被泄露等事件;进入2018年,数据泄露事件更是频繁,国外影响最大的当属Facebook用户信息泄漏丑闻:2018年3月17日,据《纽约时报》报道称,剑桥咨询公司获得了超5000万的Facebook用户数据访问权限,涉及数据量达到8700万条。数据泄露的源头是一款名为“this is your digital life”的APP,用于给Facebook用户提供个性分析测试。中国国内影响最大的当属华住用户信息泄漏事件:2018年8月28日,华住旗下多个连锁酒店开房信息数据正在暗网出售,包括汉庭酒店、美爵、禧玥、漫心、诺富特、美居、CitiGo、桔子、全季、星程、宜必思、怡莱、海友等在内用户数据泄露总数接近 5亿,打包价格为8个比特币。此事件原因据说为疑似华住公司程序员将数据库连接方式上传至GitHub导致其泄露。

        因此,可以说全球大数据环境下的很多人都身处个人隐私泄露危险之中。据中国互联网协会数据报告显示,78.2%的网民个人身份信息被泄露过,63.4%的网民个人网上活动信息被泄露过。

        严重的个人信息泄露成为电信网络诈骗愈演愈烈的根源。在山东准大学生徐玉玉9900元学费被骗光,郁结于心离世;清华大学教授被骗 1760 万元等 2016 年发生的几大典型案件中,也均是因为骗子准确地说出了受害人的姓名、家庭住址、身份证号等个人信息,最大程度地“取信”受害人,才能够成功得手。一些黑客在掌握了一定的个人隐私信息以后,还会通过社会工程学方法盗取用户的支付宝、微信等金融账号密码,以窃取钱财。

        2017 年两会期间,个人信息安全成为备受关注的焦点。全国人大五次会议发言人傅莹在 3 月 4 日新闻发布会答记者问中表示,互联网的发展和数据时代的到来,确实大大地方便了人们的生活,但同时也对保护个人信息提出了严峻的挑战,这恐怕也是一个全球性的问题。

个人信息泄露的途径

  那么这些信息到底是怎么被泄露出去的呢?根据相关安全机构的分析,主要是以下几个途径:

一是掌握了信息的公司、机构内部泄露的,大致分两种情况:1.内部人员为谋取私利,主动倒卖信息;2.内部人员操作不当,无意造成的泄露。

二是黑客通过技术手段窃取信息。大致分两种情况:1.黑客利用网站、服务器安全漏洞入侵数据库窃取数据信息。2.黑客通过设置钓鱼网站、WiFi、伪基站等引诱用户访问窃取信息。

三是用户因为保护意识不强,使用不当自己造成的泄露。

        针对上述泄露途径中的内部人员泄露和黑客入侵服务器造成的信息泄露,我们只能期盼国家加快个人信息保护的立法进程,明确刑罚,真正对不法分子形成威慑作用。

        另外,作为个人用户,在日常生活中有哪些需要注意的地方呢?我们应该怎样去避免因为自己使用不当造成的个人隐私泄露呢?下面是笔者根据自己的经验总结的一些保护个人隐私的八条建议,分享给大家提供参考:

保护个人隐私的八条建议

  1. 网络账号使用复杂的密码,定期更换,千万不要“一个密码走天下”。此方法不够人性化,造成记忆负担。折中办法:重要的账号使用复杂独立的密码,普通的网站账号使用简单通用的密码。如果你既要保证安全,又不想记密码,推荐使用密码管理软件:KeePass、LastPass、1Password。其中,KeePass为开源软件,且支持离线密码库模式。你可以把你的密码库备份到本地,或者网盘中。密码库是经过高强度加密的,别人即使得到你的密码库也无法查看里面的密码。
  2. 不要把包含个人隐私信息(手机号、银行卡号、身份证号、火车票、登机牌等)的照片、资料上传到网络,特别是QQ、微博、微信等。另外,使用网盘尤其是国内的网盘备份个人重要资料,切记不要直接上传,因为网盘中的内容对于其他普通用户来说是加密的,但对于网盘后台管理员来说,就没有保密性可言了,你无法保证管理员不会在无聊的时候进入你的网盘查看你的隐私资料。因此,建议将资料使用压缩软件加密打包后再上传。相对而言,国外的网盘更注重用户隐私,比如:Dropbox、Google drive、OneDrive、Mega等。特别推荐的是Mega网盘,数据上传默认有加密功能,安全性较高。
  3. 在网上注册的各种账号资料尽量不要使用真实身份信息,比如姓名、年龄、家庭住址等。网购时填写收货地址尽量写单位地址,必须写家庭地址的也不要具体到房号,收件后,贴有快递单的外包装不要随意扔掉,丢弃前将个人信息除去。
  4. 不要在公共场所连接奇怪的不加密的wifi热点,因为可能是不法分子设置的钓鱼wifi等你上钩!以盗取你的账号。不点击短信中的不明链接、不用微信或支付宝扫描未知二维码。
  5. 利用手机小号;有时候在一些场合需要留下手机号码,但是你又不想把自己的真实手机号码公布出去,怕骚扰电话之类的,这时候就可以留个手机小号。你可以免费临时申请,随用随抛,而且你可以在小号软件中将号码置于关机状态,使得别人无法打进来,完全不会影响到你的主号码的使用。
  6. 不要安装来历不明的软件,定期给手机和电脑杀毒;另外,虽然现在网上有很多针对苹果手机越狱和安卓手机ROOT的傻瓜教程或软件,但是如果你没有专业知识的话不建议你这么做。因为,这么做会开放系统管理权限,可以修改系统底层的设置,给病毒和木马有可乘之机。同样,安卓手机的一些来历不明的刷机包也不要随便刷,很可能留有后门。
  7. 手机APP只给开放必须的权限,不开放与它的功能不相关的权限。因为现在的APP开发商为了搜集用户个人信息,会让程序获取很多不必要的权限。比如一个新闻客户端,它会要求获取通讯录、电话、录音、相机等权限,这显然是不合理的,直接拒绝开放。
  8. 微信、微博、支付宝等应用要做好隐私选项设置,设置分组可见、关闭通过手机号搜索到我、关闭允许陌生人查看10张照片等,以防止不怀好意的人窥探隐私。

        以上这些只是基本的安全防范措施,最重要的是保持一颗警惕之心,俗话说:害人之心不可有,防人之心不可无。祝大家都能畅享大数据时代的智慧生活!

作者:haha  转载请注明出处

本文链接:http://geekenjoy.com/archives/773

发表评论

电子邮件地址不会被公开。 必填项已用*标注