Page 31 - 金融科技视界2022-8期
P. 31
Technical Tracking
技术追踪
特定TEE硬件设备,而且需要依 TEE使用成本高、权限管控太严,
赖硬件产品的安全性(不存在安 限制了数据的流通和利用。而信息 4
全漏洞,没留后门),硬件安全性 混淆脱敏路线具备低成本、高性 路线四:分布式计算
的检测通常难以进行。增强硬件 能、实现简易的优势。
安全的可信度的方法有TEE硬件 缺点是难平衡隐私保护和数 该路线的代表是联邦学习、
国产化和权威机构检测。 据可用性的矛盾:混淆脱敏去除了 分割学习及弱PPML(暴露中间
部分信息(或降低了部分信息精 计算结 果 的隐 私保 护机 器 学习
3 度),而某些计算和分析可能需要 PPML,联邦学习和分割学习为弱
路线三:信息混淆脱敏 使用这些信息(或需要使用高精度 PPML特例)。
的信息)。在这种情况下,就还需 大多分布式计算任务不需要
它的主要代表是匿名化和差 要采用MPC或TEE。 各节点间交互原始输入数据,只需
分隐私,其方法是通过加噪、删 信息 混 淆 脱 敏 另 一 大 用 途 交互本地基于原始数据计算的中
除、泛化等信息处理手段对数据 是:作为辅助,结合其他隐私技术 间结果。相比较把各方数据汇聚
处理以减少或去除其中的敏感信 路线(如MPC、TEE)用于联合计 在一起再计算的集中式计算方法,
息后再输出。 算,减少可从结果中得到敏感信 分布式计算大为减少了原始信息
例如,医学主管单位将采集 息。MPC、TEE可以保护输入数 的泄露。但与MPC、TEE方式相
的个人数据/疫情数据匿名化和脱 据、中间计算结果不泄露,但是如 比隐私保护弱,额外泄露了中间结
敏后公开发布,供广大医疗机构研 果最终计算结果包含敏感信息,则 果信息。
究,供各机构和民众做好防疫工 还需要采用信息混淆脱敏处理后 以联邦学习为例,它沿用了传
作。在这样的场景下,数据的合理 再输出最终结果,或者对输入数 统分布式机器学习的参数服务器-
用途非常广、用量非常大,MPC或 据、中间结果应用信息混淆脱敏。 工作服务器架构。
2022.8 金融科技视界 29