随着数据应用场景的不断拓展深化,数据流动的量级和频率也日益激增,巨大的流量和访问频率背后是无法估量的数据安全风险。作为宝贵的生产要素,如果通过限制数据流动,或者设置数据流动壁垒,不仅会造成严重的资源浪费,甚至不利于发挥数据要素的价值。显然,数据开放和数据安全之间存在着矛盾和失衡。
数据流动可见不仅是数据流动安全建设的基础底座,事实上,从监管合规层面来看,解决数据流动可见也是企业的必由之路。不论是《数据安全法》明确了国家建立数据分类分级保护制度,要求对数据实行分类分级保护;还是《个人信息保护法》对个人信息的处理活动进行记录进行了明确要求,抑或是《数据出境安全评估办法》强调企业要进行数据风险自评估,都是对落实数据流动可见的重要指引和必要要求。
企业在持续的发展过程中会累积海量的数据,这些数据结构类型多,流转场景也很复杂。从数据安全角度来说,「数据可见」关注的是数据的发现和“敏感数据”的识别,让企业清晰自己需要保护的数据资产和需要保护的级别;「流动可见」描述的是这些数据资产在数据服务之间,通过数据接口进行传递、处理和存储等过程。
数据流动可见的关键是基于数据发现和分类分级,对企业当前的数据服务和数据接口进行梳理,并关联数据处理活动核心要素信息如数据范围、数据处理目的、数据处理结果等,明确企业敏感数据及重要数据的业务场景化安全要求。
通过对真实数据安全建设实践的观察发现,对于大部分企业来说,要真正落地数据流动可见能力是一件极具挑战的事情,主要原因集中表现在以下4点:
全链路数据流动安全能力体系建设的核心是在持续的数据发现和分类分级的基础上,关注数据资产内外部流转状态,对数据的流转、交互进行链路构建,形成整体数据流动的安全态势,并将流动链路的构建结果应用于业务场景化的风险监测和治理,同时,在数据安全治理机制上实现动态更新和统一管理。
同时通过持续扫描和暴露面风险监测的手段,动态完成资产扫描和暴露⾯更新,及时感知数据资产和数据流动的变化,并适时开展数据风险治理及合规评估等工作,最大化提升数据要素深度利用和安全保护的水平。
企业在构建数据流动感知大脑的时候通常需要依赖专业的技术方式来实现,以下几种实践技术可以参考借鉴:
问卷调研和访谈是咨询服务机构常见的分析数据流动可见的方式。通过对相关的产品经理和研发人员进行访谈,收集和汇总数据和流动相关的信息,形成企业数据流动的架构图
通过技术工具对目标范围进行系统性的扫描,发现其中的数据服务和数据资产信息;基于对企业数据类型和范围的收集、分析、处理,能够帮助企业做出合理的保护策略
通过使用网络流量分析工具和技术的方式,捕获和监测企业网络中的数据流动情况,适用于分析企业内部网络和外部通信的数据流动情况,监测数据的传输路径、数据来源和数据的目的等信息
一种在应用程序中插入代码或工具,以监测、记录和分析数据流动的方式。通过在关键位置插入代码,捕获和跟踪数据在应用程序内部的流动情况,并生成数据流动的可见架构图,适用于分析和监测应用程序内部的数据流动
解决数据流动可见并不是简单的公式模版,即便掌握了技术方法,仍需要避开建设误区,结合行业规范、业务场景等进行针对性设计落地,这对企业来说无疑是种考验。那么,企业在落实数据流动可见能力的路上应该避开哪些“坑”呢?
1、 避免盲目求全
企业需要关注敏感数据的识别,而非全量业务数据的分类:在构建数据流动的可见性时,重点关注敏感数据的识别和追踪,将精力集中在敏感数据的流动路径、使用情况和安全控制上,以确保对敏感信息的全面管理和保护。
优先关注数据源头和数据出口:因为企业生产网络域内部的数据流动非常复杂,要实现全面完整的梳理成本很高,从数据安全角度来看,应当重点关注数据的来源和最终去向(应用和API的数据流动),这可以大幅的减少构建数据流动视图的成本。
2、避免打扰业务
避免对生产业务系统进行改造或者造成影响:插桩方案部署成本非常高,需要在应用程序中插入额外的代码或修改字节码,这可能会对应用程序的原有逻辑和性能产生影响。因此,在非必要场景下,不宜采用插桩模式。
3、避免过度人力投入
通过机器学习不断沉淀经验:利用机器学习和数据分析技术,不断沉淀和学习数据流动的模式和规律;建立基于机器学习模型的数据流动分析系统,自动化识别敏感数据和数据流动,减少对人工参与的依赖,提高数据流动可见性效率和准确性。
自动化工具和流程:采用自动化工具和流程,可以降低人力投入的成本和风险。通过选择、部署适当的数据流动分析工具,可以实现数据的自动收集、清洗、转换和分析。
数据开放具有重要意义,数字化发展进程不可逆转,而数据流动一旦受阻,就意味着依赖数据流动创造的产业发展、技术创新、生活生产等,都会受到巨大影响。
全知科技《数据安全作战地图——数据流动可见》知识图谱已正式发布,图谱针对数据流动可见业务难点、技术方法、实践思路、避坑指南等内容模块,摘取、关联、归纳关键理论知识和实践要点,具备强可视化的学习能力和分析能力,帮助企业建立体系化的数据安全建设思维。