数据安全自古有之,并不是一个全新的概念。冷兵器时代的战争就非常关注情报,通过情报可以了解竞争对手的强项和弱项,从而制定制敌的方法和手段。而数据保护就是针对这个情报采取的保护措施,确保自身的情报不被泄漏。但随着数据技术的发展,保密工作越来越难,数据安全包括个人隐私问题也是一个非常具有争议的话题。
1.1 数据安全是相对的
随着社交媒体的发展,我们在充分利用社交媒体带来的便利的同时,也在无时无刻泄漏着个人的秘密。当我们使用微博发送一条消息的时候,即使不标记自己的地理位置,别人也能通过你所发的内容定位你在什么地方。你在微博上发了一张照片,而照片背后的信息就会泄漏你的个人信息,因为每张照片都有EXIF信息1记录,当你在网上发布照片时,该信息已经被同步发送了,别人下载照片之后就可以轻易地用软件读取到所有EXIF信息,并根据该信息了解照片发布者的相关情况。当你把在家里拍摄的照片上传到网上的时候,看到照片的人就非常容易地定位你家的位置;当你把在宾馆拍摄照片上传到网上的时候,别人就能够知道你现在住在哪家宾馆。这些信息并不是保密的,而个人也是无意上传的。有些网站比较重视保护个人隐私,会自动删除上传照片的EXIF信息,大数网站只会对照片进行压缩处理,这就容易导致个人信息泄漏。只要使用社交媒体,必然会带来个人信息的暴露,这是使用社交媒体的便利所付出的代价。
现在很多网站都在使用Cookies来获取用户浏览网站的记录,从而分析个人的偏好,以便定向推送用户可能需要的信息。当用户使用百度搜索了一些关键词之后,该搜索记录将被浏览器记录,并在用户下次登录网站时推送与被搜索过的关键词有关的广告。比如,你使用百度搜索了汽车的品牌,当关闭了浏览器之后再次登录时,网页周边的广告就全是与刚才的搜索非常相关的内容。浏览器记录了你每次搜索的行为,然后当你再次使用该浏览器访问网页的时候,针对搜索过的内容提供对应的广告,这样的广告对你来说相关程度就非常高。
数据安全领域的所有权仍然是一个有争议的话题。比如,我们在各种社交媒体平台上传的个人信息,该数据的所有权是属于用户还是这些互联网公司的?如果是属于用户的,那么互联网公司有没有资格使用这些数据?如果是属于互联网公司的,那么互联网公司在使用这些数据时需要注意什么问题?互联网公司在什么样的情况下可以使用?在什么样的情况下需要征得用户同意才可以使用?个人信息所有权的问题在国内还缺少科学合理的立法保障,同时对互联网公司使用个人数据也缺少相关的检查机构的监管。这个争议在世界范围内都是难题,哪怕在互联网发展相对成熟的美国都存在公司未经用户同意随意采集和使用个人数据的情况,只有在发生了不良影响的时候,才通过诉讼程序来解决这一争论。这在全球范围内都是一个难以解决的问题。
现在有各种软件公司通过开发软件来获取用户的个人信息数据,特别是一些投票网站、购物网站、金融投资网站等,通过补贴现金的方式来吸引用户注册,从而收集个人信息,形成用户数据库。而有些快递公司的管理不到位,可能出现快递员拍照个人送货单上的地址留存客户信息,然后出售给第三方机构的行为,这种做法已经严重违反了个人信息安全方面的法规,所以需要有更加严格的监管方案出台。
着眼于企业的情况,企业所拥有的员工个人信息的所有权的归属问题也是值得探讨的。员工为企业工作,企业收集其个人信息以便为其安排工作岗位,并更好地服务员工,这看上去并没有不合理的地方。但这些信息收集上来之后,所有权归谁所有?是否还是属于个人的?企业在采集员工个人信息的时候是否需要做出重要的声明,告诉员工这些信息将用来做什么?这种承诺符合法律规定吗?企业是否会用这些信息做出对员工不利的决策或者行为?谁来监督?现在大家的个人信息安全意识普遍还不太高,但随着互联网的发展,大数据的不断被使用,人们的信息安全意识应该会逐步提高,获取数据的成本将会大幅度增加,因此对数据的使用范围和使用方法的监管将变得越来越严格。
当然,数据安全永远是一个相对的命题。京东、天猫等互联网电商巨头后台有着丰富的个人信息数据,这些数据用来研究消费者的喜好,从而在推送广告时能够更加精准,消费者所看到的广告就会更加符合个人需求,对广告的厌烦程度就会下降,互联网使用体验也会得到提高。虽然互联网电商巨头未经个人同意使用了用户个人信息数据,但并未对用户造成坏的影响,同时提高了用户的互联网使用体验。这在一定意义上来说是良性的,不仅仅对用户,也对社会资源的配置优化起到积极的作用,减少了社会资源的浪费。
1.2 数据安全管理靠机制
数据安全问题将会是未来长期困扰着大数据行业的话题,而且围绕数据所有权的争论也将持续。为了更好地保护数据安全,使数据不被非法分子所利用从而对个人安全、公司安全和社会安全造成威胁,国家需要制定相关的法律法规去约束。虽然法律法规的约束机制在事前有一定的震慑作用,但多数情况下靠法律来解决的安全问题都是事后惩罚式解决方案。如果公司的数据安全靠法律来解决,基本上已经晚了。企业要解决数据安全的管理问题,需要制定相应的机制,最好有过程中的报警机制,并在招聘管理、人员管理、控制方法、自动化预警机制、流程制度上制定相应的方案,才能更好地保障公司的数据安全,一旦出现问题不用通过法律途径来解决。这就是数据安全的机制设置。
在招聘管理上,重视能力的同时也要对个人的品行进行考察。品行端正的人做违法犯罪事情的概率会大幅度降低。
在人员管理方面,根据每个人的岗位职责规定相应的数据访问权限,可以在公司电脑中安装相关的监控软件,监控电脑的使用,对电脑使用的日志进行跟踪,并保留到公司的服务器端,特别是对敏感数据的处理更加需要软件的监控,以防止数据被非法外传或者非法使用。当然,对于高手来讲,任何的监控软件都有方法进行破解。但对于一般意义上的防范,对于减少数据泄密的可能性还是非常有效的。特别是数据部门的软件监控,即使软件被破解或者被特殊的方法终止,仍然有软件使用的日志可以查看。监控软件能够起到看门锁的作用,软件越复杂,相当于安装的锁具越高级,对开锁技能的要求也会越高,从而对数据的保护将更加有效。目前好多公司的电脑都安装有多个监控软件,通过多道锁的保护,减少数据被非授权传播的几率,即使公司的电脑丢失了,也有一定的保障作用。
在服务器端也应该设定一定的自动化预警机制,除了对日志进行保留,对敏感数据加强管理外,还要对数据访问进行预警。当有人访问了公司的敏感数据之后,达到一定的量级,则要预警通知给相关人员。比如,人力资源部的经理是有权限访问公司员工个人信息数据的,当这个数据以单条或者小组的方式被查询的时候,系统可以默认为是允许的操作,当一个业务单元的人力资源经理的账户要对全公司所有人员的信息进行查询操作的时候,就需要预警给相关人员,包括系统自动通知邮件、短消息等方式。如果人力资源部的经理对该数据的访问得到过授权,那么被通知的相关人员应该知道他有这个访问的需要,而当该经理没有得到授权就进行全员的数据访问,则有可能是非法的查询,这个时候就需要采取相关的措施了。
数据分级制度。企业在建立了完善的数据地图之后,需要对公司内部数据分级进行安全管理。一般来讲企业的数据可以分成绝密、机密、保密、公司内部分享、公开数据等几个级别,不同公司可以根据公司的内部数据分级情况进行管理。绝密级别的数据一般仅限少数人能够访问,比如公司的产品技术数据、客户报价数据、采购报价数据等;机密数据是仅限公司部分级别人员或者职能部门可以访问的数据,比如薪酬数据、个人信息数据、公司财务数据和订单数据等;而保密数据是在授权情况下可以由公司内部管理者访问的数据,该类数据比机密数据等级较低,可以在较大范围内共享,但又不能给全员分享,比如公司的薪酬体系等;公司内部分享数据,为公司所有内部人员所用,公司所有的正式员工都可以访问,但又不可以对外公开的数据;而公司公开数据则是公司为对外宣传所对外公布的数据,比如上市公司的财务报表、公司广告、软文、宣传资料等。从保密等级上划分,形成了绝密→机密→保密→内部→公开5个等级。公司内部管理上,针对每类数据的开放范围要制定
清晰明确的标准,并在数据系统和数据库上建立相关的授权机制,从而对数据形成严格的分级管理机制。
保密等级的时间效用性。一般情况下,数据的保密等级会随着时间的变化而变化,比如绝密文件在有效期过后会转为机密文件,而机密文件在过了有效期之后会转为保密文件。公司制订了股权分配机制,在该机制还未确定和发布之前属于绝密文件,而一旦发布则变成了机密文件;相关的政策性文件则是保密文件。所以,公司在对数据进行保密级别划分时,往往需要对数据的保密等级设定相关的有效期,并设定有效期结束后应转为什么样的保密等级。
授权流程。对数据的授权流程控制是非常重要的。当一个员工需要对一定的数据进行分析的时候,如果该数据超出了自己的访问权限,则需要高层进行授权,然后由其在授权范围内访问,当项目结束或者工作完成之后,该授权自动结束,其所访问的数据需要收回,并对电脑使用记录进行无法恢复的删除。很多公司在授权上都能够做到,但在使用完成后的删除管理上却难以做到,导致很多员工离开公司之后,会带走其曾经访问过的数据。虽然威胁不大,但是这些数据却是竞争对手或者竞争情报机构热衷采集的数据。如果员工责任心不强或者经受不住诱惑,会导致大量的数据流失情况的发生。
保密规定。员工在入职后一般都需要签署保密协定,保证其在职期间保守公司秘密,并在离职后继续对公司的信息保密。西方国家法律相对较为健全,虽然员工离职后对在职期间的数据有留存,但对数据的保密则会坚守自己的职业操守。但在国内,由于信誉机制不健全,员工的职业操守相对要弱一些,往往会发生数据泄漏的情况。
排他协议。有些公司会与员工签署排他协议,即离开公司后多少时间内不能到指定的竞争对手公司工作。这种排他协议成本较高,因为根据劳动合同法,在员工离职后,公司需要在保密期内为员工支付一定的工资来确保该协议的有效性。
1.3 盗不走的只有经验
数据安全永远是相对的,只要数据还需要人们的访问和使用,数据的安全就存在人为的威胁,绝对保密的数据反而没有价值。企业要想让数据发挥更大的价值,就需要将数据放在更大的范围内共享,因此其泄密的风险就会大大增加。数据的泄漏风险等级会随着开放人数的增加成幂级增长。
数据是可以泄漏的,但数据背后的价值以及企业使用过程中积累的经验是无法被盗走的。企业积累了数据首先会考虑如何更好地利用,此时会通过内部的数据开放和共享来解决数据使用的问题。如果担心数据泄漏而拒绝开放数据,让数据在服务器的硬盘里“睡觉”,那么企业将永远无法获得数据价值,反而让数据等待着被盗走。而当企业使用数据做出了相关的经营和管理决策后,即使数据被非法泄漏,价值还是体现了。换句话说,当我们往前看的时候,历史的数据反而不再那么重要了。企业应充分利用现有数据努力往前跑,那么留下的只是历史的脚印,而且企业跑得越快,留下的历史数据越加不那么重要。所以,不用担心数据因为开放或者分享而有泄露的风险,反而要通过数据开放和分享,发挥数据的最大价值,让数据挖掘为企业带来更多的收益,从而提高企业的经营和管理水平。若死守着数据不分享,则什么价值也无法获得。
以上的结论对部门来说也同样适用。部门的数据也需要开放给其他的部门,以发挥数据的价值,死守着本部门的数据,不充分地利用,肯定对本部门没有什么意义,对其他部门也没有什么意义。一个部门的数据如果不同其他部门的数据结合起来解读、分析和挖掘,也是没有意义的。数据割裂和信息孤岛都不利于数据的深度分析和解读,只有开放、分享和相互关联起来才会有价值。有些部门经理总担心自己的数据分析能力不如其他部门,数据开放反而是给其他善于利用数据的部门所用,因此拒绝开放数据。这种狭隘的想法是不会帮助其学会如何利用数据的,因为在同其他部门协作分析数据的时候,可以向其他部门学习,封闭的思想不会让自己学会分析数据,而只有通过开放和学习,才能让自己成长。
当然,数据应用的经验是需要积累的,而很多的数学模型在构建之后需要长期的应用,并不断修订模型参数和误差,才能更加精准,这就是一个积累的过程,如果不注重积累,得到的结论就会有失偏颇。所以企业不需要过度担心数据安全问题,只要在数据应用上不断研究、积累经验、无限迭代,一定会享受到数据开放和分享带来的好处。