大数据系统下的数据安全注意事项
以下信息源自于演讲记录:(一)在大数据时代,越大的公司,面临的数据安全风险越高,简要而言,主要分为六个部分:
1. 后台被******,例如SDK泄漏关键服务IP地址;
2. 数据被爬取风险,例如简历信息被外界抓取;
3. 内部使用风险,例如采集的用户数据是否存在泄漏风险;
4. 生态公司风险,例如收购的公司数据安全规范能够达成一致;
5. 开放数据风险,例如敏感数据泄漏等;
6. 监督合规风险,例如政府监管部门的要求等。
(二)以Hadoop为代表的大数据集群存在如下安全问题:
1. 数据存储在同一集群中,非常集中;
2. 分布式系统天然的复杂性,使得防护变得非常困难;
3. 数据由于BI分析等需求,存在极强的流动性,防护边界非常宽泛。
(三)在大公司的角度上,数据安全主要需要注意如下三方面:
1. 数据要合法、合理、合规,避免用户的敏感数据被滥用;
2. 建立完善的数据脱敏机制,评估内部、生态、对外开放三方面的数据风险;
3. 建设完善的防火墙与应用安全机制,应对外部风险,如******、爬取数据等。
(四)当前的前沿数据安全技术:
1. 同态加密:对密文进行计算,适合于那些将数据存储在云平台的公司,但性能消耗十分严重;
2. 多方安全计算:多方分享数据进行计算,但性能消耗十分严重,且适用场景有限;
3. SGX:通过硬件来保证数据的安全问题,适合线下金融等公司场景;
4. 差分隐私:通过不关联个体的计算方式,得到整体层面的数据。
(五)大数据集群中的数据安全措施:
1. 敏感数据定义:通过打标签的形式,规定哪些数据是敏感信息;
2. 建立权限控制机制:对于访问数据的用户权限进行严格的定义;
3. 敏感数据的展示需要脱敏,包括:前缀保留、截断、隐藏、枚举、哈希、移位、置换、差分隐私、K-匿名、L-多样性等;
4. 异常数据访问信息监控,包括:点异常、聚集异常、情景异常等;
5. 数据提取流程:数据采集层打标签、数据分析层搭建隔离测试环境、数据应用层添加异常行为检测、产品对接进行数据安全审计等。
页:
[1]