总第14期
Focus    焦点
Focus    焦点
由华住集团数据泄露带来的数据安全启示
文/陈广成

8月底,1.3亿身份数据泄露事件将华住酒店集团推上了风口浪尖,安全人员对公开数据进行测试发现,数据均为真实存在。并且,安全人员通过数据交叉验证的方法进行检测,同样发现被泄露数据绝大部分为新数据,而非老数据混杂售卖。这意味着此次华住酒店集团上亿条真实数据泄露的可能性较大。

个人数据泄露带来的影响和潜在损失巨大,从华住泄露数据被兜售8比特币(按照当天汇率约合37万人民币)的价格可见一斑。事实上,从国内外来看,数据泄露的事件从来没有停止过,2018年以来就发生了几十起影响较大的数据泄露事件。比如运动品牌Under Armour在3月份表示,MyFitnessPal饮食和健身应用上1.5亿个账户数据遭遇有史以来最规模的黑客攻击,被盗数据包括MyFitnessPal移动应用和网站的账户用户名、电子邮件地址和加密密码;1月份,美国Sacramento Bee报社的一个数据库发生泄露,其中包括1940万选民的联系信息(地址和电话号码)、党派关系、出生日期和出生地点等。

数据安全公司Gemalto 《2017数据泄露水平指数报告》显示,2017 年上半年全球范围内数据泄露总量为19 亿条,超过2016 年全年总量(14 亿),比2016 年下半年增长了160%多。2017 年,全球同样发生了多起影响重大的数据泄露事件,例如美国共和党下属数据分析公司征信机构先后发生大规模用户数据泄露事件,影响人数均达到亿级规模。我国数据泄露事件也时有发生,并且数据泄露的潜在隐患同样不容乐观。据Shodan 统计,截至2017 年2月3 日,中国有15046个MangoDB数据库暴露在公网,存在严重安全问题。

这足以说明,数据泄露风险的势头没有止步,并且随着云计算、大数据等新型IT技术的演进,数据安全风险愈演愈烈。

数据安全风险点与挑战

毫无疑问,如今数据安全威胁已渗透在数据生产、采集、处理和共享等大数据产业链的各个环节,风险成因复杂交织;既有外部攻击,也有内部泄露;既有技术漏洞,也有管理缺陷;既有新技术新模式触发的新风险,也有传统安全问题的持续触发。

尤其在大数据场景下,数据从多个渠道大量汇聚,数据类型、用户角色和应用需求更加多样化,访问控制面临诸多新的问题。首先,多源数据的大量汇聚增加了访问控制策略制定及授权管理的难度,过度授权和授权不足现象严重。其次,数据多样性、用户角色和需求的细化增加了客体的描述困难,传统访问控制方案中往往采用数据属性(如身份证号)来描述访问控制策略中的客体,非结构化和半结构化数据无法采取同样的方式进行精细化描述,导致无法准确为用户指定其可以访问的数据范围,难以满足最小授权原则。大数据复杂的数据存储和流动场景使得数据加密的实现变得异常困难,海量数据的密钥管理也是亟待解决的难题。

中国信息通信研究院发布的《2018年大数据安全白皮书》指出,大数据促使数据生命周期由传统的单链条逐渐演变成为复杂多链条形态,增加了共享、交易等环节,且数据应用场景和参与角色愈加多样化,在复杂的应用环境下,保证国家重要数据、企业机密数据以及用户个人隐私数据等敏感数据不发生外泄,是数据安全的首要需求。

就此次华住事件来看,隐私保护是建立在数据安全防护基础之上的保障个人隐私权的更深层次安全要求。中国信息通信研究院报告指出,我们应该也要意识到大数据时代的隐私保护不再是狭隘地保护个人隐私权,而是在个人信息收集、使用过程中保障数据主体的个人信息自决权利。实际上,个人信息保护已经成为一个涵盖产品设计、业务运营、安全防护等在内的体系化工程,不是一个单纯的技术问题

大数据环境下,数据安全技术提供了机密性、完整性和可用性的防护基础,隐私保护是在此基础上,保证个人隐私信息不发生泄露或不被外界知悉。目前应用最广泛的是数据脱敏技术,学术界也提出了同态加密、安全多方计算等可用于隐私保护的密码算法,但应用尚不广泛。

数据安全保护思考

安全是发展的前提,必须全面提高大数据安全技术保障能力,进而构建贯穿大数据应用云管端的综合立体防御体系,以满足国家大数据战略和市场应用的需求。数据是信息系统的核心资产,是大数据安全的最终保护对象。除大数据平台提供的数据安全保障机制之外,目前所采用的数据安全技术,一般是在整体数据视图的基础上,设置分级分类的动态防护策略,降低已知风险的同时考虑减少对业务数据流动的干扰与伤害。对于结构化的数据安全,主要采用数据库审计、数据库防火墙,以及数据库脱敏等数据库安全防护技术;对于非结构化的数据安全,主要采用数据泄露防护(Data leakage prevention, DLP)技术。同时,细粒度的数据行为审计与追踪溯源技术,能帮助系统在发生数据安全事件时,迅速定位问题,查缺补漏。

对于数据安全技术保护,中国信息通信研究院给出了建议:

一是建立覆盖数据收集、传输、存储、处理、共享、销毁全生命周期的安全防护体系,综合利用数据源验证、大规模传输加密、非关系型数据库加密存储、隐私保护、数据交易安全、数据防泄露、追踪溯源、数据销毁等技术,与系统现有网络信息安全技术设施相结合,建立纵深的防御体系;

二是提升大数据平台本身的安全防御能力,引入用户和组件的身份认证、细粒度的访问控制、数据操作安全审计、数据脱敏等隐私保护机制,从机制上防止数据的未授权访问和泄露,同时增加大数据平台组件配置和运行过程中隐含的安全问题的关注,加强对平台紧急安全事件的响应能力;

三是实现从被动防御到主动检测的转变,借助大数据分析、人工智能等技术,实现自动化威胁识别、风险阻断和攻击溯源,从源头上提升大数据安全防御水平,提升对未知威胁的防御能力和防御效率。

此外,在个人数据隐私方面还应该意识到,大数据应用与个人信息保护之间的突出矛盾不单是技术问题,更需要通过加快立法、加强执法规范大数据应用场景下的个人信息收集、使用行为,尽快构建政府管理、企业履责、社会监督、网民自律等多主体共同参与的个人信息保护制度体系。

分享到
关闭