当今社会已经步入数字经济时代,数据作为5大生产要素之一在各行各业的价值越来越重要。打破数据孤岛、实现互联互通和数据信息共享是实现数据价值的重要前提。然而,在数据流转的过程中由于数据的使用者不再局限于其所有者本人,在重视数据使用价值的同时需要关注数据的安全性,特别是数据涉及的隐私性。近年来我国数据立法进程不断加快,《中华人民共和国网络安全法》《中华人民共和国数据安全法》等法案逐步完善了我国数据相关立法的顶层设计,着重强调了数据流通过程中的数据安全和个人信息保护。安全的数据流通逐渐成为各级政府、企业单位和广大民众关注的重点。各项政策法规的不断完善,一方面建立了数据安全保障制度的基本框架和数据处理者的基本义务,另一方面完善了数据产业发展、政务数据开放的促进机制。
隐私计算作为平衡数据利用和安全的重要途径,是解决数据流通环节用户授权的有效工具。自2016年,工业和信息化部、中国人民银行、国家发展改革委、中央网信办等政府监管部门先后在相关政策文件中提到加强隐私计算相关技术的攻关和应用。如今,随着云计算、大数据等高新技术的发展,计算环境已经从传统的本地计算模式逐步转向具有场景多、规模大、个性化、跨网跨域等诸多特点的新型模式。因此,如何在复杂的新环境下开发保障数据安全、促进数据开发利用的隐私计算技术成为当下的热点问题之一。
隐私计算又被形象地称为“可用不可见”的技术,是涵盖众多学科的交叉融合技术,目前主流的隐私计算技术主要分为三大类:以多方安全计算为代表的基于密码学的隐私计算技术,以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术,以可信执行环境为代表的基于可信硬件的隐私计算技术。
4月4日,北京国家金融科技认证中心公布了首批“多方安全计算金融科技产品国推认证”名单,包括蚂蚁集团两项产品在内的首批5项产品通过了该认证。
这是国内首次对多方安全计算金融领域应用展开认证工作,也是目前国内唯一针对该领域的“认证”,此次认证结果的发布,意味着数据要素市场的相关市场准入标准和监管体系迎来进一步完善。
作为隐私计算产品的重要底层技术,多方安全计算技术能够在保护数据隐私的同时,实现不同机构之间数据的合法合规融合,实现安全的多方数据查询和分析,进一步打破各方之间的数据壁垒,连接数据孤岛,有效实现数据价值的转化与释放。
隐私计算为数据价值而生
伴随着云计算、大数据、人工智能等新一代信息技术的快速发展,数据已经成为基础性关键战略资源,同时也是数字经济时代的核心生产要素。
但是,在信息技术蓬勃发展的同时,数据也面临着一系列严峻的安全挑战,不仅包括公民个人信息和隐私的安全隐患,也包括政府和企业数据资产的泄露风险。近年来,数据泄露事件层出不穷,出于安全顾虑,数据价值链不同环节之间的流动受阻,分工协作关系脆弱,很难形成有效闭环。
大数据时代,如何在保障数据安全的同时又不影响数据要素的使用,是每一个数据生产者和获益者应该考虑的事情。
1982年,著名计算机学家、中国科学院院士姚期智提出了经典的“百万富翁”问题:张三和李四都是富翁,他们想知道谁更富有,但他们都想保护好自己的隐私,不愿意让对方或者任何第三方知道自己真正拥有多少财富。如何在保护好双方隐私的情况下,计算出谁更有钱?
在普通人看来,这几乎是一个无解的悖论。但是姚期智就此提出了“多方安全计算”的概念,即“一组互不信任的参与方在需要保护隐私信息以及没有可信第三方的前提下进行协同计算”。
近年来,我国多部与数据安全相关的法律法规落地实施,包括《网络安全法》《个人信息保护法》《密码法》《数据安全法》以及《民法典》,形成了较为完备的安全法律体系,隐私计算为需求强烈但瓶颈重重的数据流通提供了破局思路。
随着政策落地以及各方关注度的提升,隐私计算已成为当下火热的新兴技术,跻身商业和资本竞争的热门赛道,有业界人士将2020年称为“隐私计算元年”。顾问咨询公司高德纳(Gartner)发布的《2021年重要科技战略趋势》中,也将隐私计算列为未来几年科技发展的九大趋势之一。
多技术融合保护数据安全
隐私计算又被形象地称为“可用不可见”的技术。看不见数据,却又能实现对数据的计算分析,隐私计算是如何做到的?
蚂蚁集团隐私智能计算技术部总经理王磊告诉科技日报记者,隐私计算是涵盖众多学科的交叉融合技术,发展初期汇聚了多种不同种类的技术,目前主流的隐私计算技术主要分为三大类。
第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。
以多方安全计算为例,其主要逻辑是在没有可靠的第三方(中介)的情况下,各方通过事先约定的密码学协议进行交互,完成预定的计算任务,每个参与方无法得知其他方输入的信息,只能得到计算结果。
“每一类技术路线都有各自的特点,适用于不同的应用场景。”王磊说,例如联邦学习适用于对性能和规模要求较高的建模场景,多方安全计算安全性更高,基于可信硬件的隐私计算可以支持更复杂的计算需求。
但是,从近年来的技术发展趋势和行业需求来看,想要通过单一技术“包打天下”几乎不可能,现实需求往往需要不同的隐私计算技术组合使用,在保证原始数据安全和隐私性的同时,完成对数据的计算和分析任务。
王磊告诉记者,以蚂蚁集团隐私计算的技术路线为例,从最早基于矩阵掩码的数据变换方案,到基于多方安全计算和可信执行环境的两套技术路线,再到后来的多种技术融合路线,并催生了可信隐私计算开源框架“隐语”和隐语开放平台。“隐语”提供的是代码,主要面向开发者,好比把原材料都准备齐全,就看开发者怎么做出一桌色香味俱全的大菜;而隐语开放平台则可以让用户直接调用各项功能,好比平台提供了预制菜,只要根据个人需求简单加热调味即可。
隐私计算应用场景
当前,隐私计算应用最广泛的是金融行业。例如,招商银行启动了“慧点隐私计算平台互联互通项目”,交通银行则启动了监管沙盒项目,中国工商银行、中国农业银行也不同程度的在相关业务中尝试性地应用了隐私计算工具。
“传统的金融机构风险管理模式,除了调查走访外,主要是利用本单位数据和征信系统查询用户信息,这种方式对用户的风险判断不够全面。”王磊表示,基于多方安全计算的金融风控全链路解决方案,可以调用不同机构的多个信息渠道对潜在用户的历史记录进行多维度计算分析,各金融机构、信息渠道可形成征信系统联盟,能为各方提供数据分析服务,且数据无须离开本地,调用数据的过程中,数据不再以明文(即数据不加密)形式出现,而是通过安全协议共享,任何人都无法从中窥探到原始信息,这就是隐私计算相较于传统金融机构风险管理模式所带来的重要改变。
除了金融行业,隐私计算在医疗行业、保险理赔、政务信息等领域也有非常大的应用空间。
例如,过去保险机构在理赔过程中,会向医疗机构明文查询被保险人的诊疗情况,而获得的原始数据往往涉及用户隐私。2018年,蚂蚁集团尝试将隐私计算技术应用到保险理赔场景,通过设定数据逻辑查询,利用多方安全计算等隐私计算技术,使得保险公司只获得是否理赔的结果,不会获得原始数据,从而实现数据“可用不可见”,保护理赔用户隐私。
在医疗行业,全球抗击新冠疫情数据共享也运用到了隐私计算,这使各方可以在不公布详细数据的情况下,联合其他科研人员协同进行病例样本基因组的联合分析并共享结果,实现了对病毒流行病学情况的实时追踪和对未来毒株演化的预测,成为抗击疫情的一把利剑。
隐私计算未来的发展趋势
自计算机诞生以来,数据一直是明文流通和应用,面向数字经济时代,安全地用好数据成为绕不过去的坎。今后,法规政策和技术进步都将助推数据要素告别明文流通,开启“数据密态时代”的新征程,在数据密态时代最有潜力的支撑性技术非隐私计算莫属。
从技术角度来看,隐私计算仍在加速成熟
(1)软硬件协同优化性能的提升、技术的可用性。硬件加速在隐私计算性能提升方面正在发挥越来越关键的作用,在算法不断优化的基础上,一些专用芯片和控件的使用将进一步提升隐私计算的性能。
(2)逐步向大规模分布式计算迈进。2020年以来,隐私计算逐渐成熟的一个表现就是分布式隐私计算的逐渐应用,为解决隐私计算在计算量方面的瓶颈提供了优秀实践。
(3)提供工具化、模块化的服务能力。如何满足用户的个性化与定制化需求、提升用户使用效率将成为产品形态趋同之下,技术提供者提升竞争力的关键。低代码甚至零代码开发、图形化拉拖拽替代编码和多版本轻量化部署等将成为产品升级优化的关键之一。
从应用角度来看,隐私计算将加速与其他技术的协同以推进大规模落地应用
(1)增强与区块链等其他技术的不断协同。区块链与隐私计算的功能是天然互补的,借助区块链去中心化、不可篡改、公开透明的特性,将增强隐私计算任务的可验证性、可审计性,目前已成为诸多厂商的技术融合方向。此外,隐私计算与云计算的协同,将在支持云端数据存储、处理的同时加强任务过程中的安全与隐私控制;而隐私计算与人工智能的协同,将有力推进数据智能的应用和发展。
(2)促进跨技术平台间的互联互通。隐私计算的目标在于促进多方数据之间的互联互通,但从应用现状看,不同技术路径之间的差异明显,而同一路径下不同产品的实现方案也相互独立,数据资源的互联互通只能基于不同的技术平台分块实现,无疑增加了应用侧的使用成本。从长期发展来看,跨技术路径、跨系统平台之间的隐私计算技术工具的互联互通将成为广泛需求。
从产业角度来看,隐私计算还需与数据治理相互配合,共同促进数据要素的共享利用和价值释放
(1)隐私计算有望成为数据流通的关键基础设施。随着近两年国内隐私计算的技术产品快速落地,越来越多的行业客户开始在数据流通活动中实施部署相应的技术解决方案,隐私计算逐步推动着传统数据流通模式和流程的变革,当技术能力和应用模式越发成熟之时,隐私计算才有望成为全社会数据流通网络的支撑型基础设施。
(2)技术发展将随着数据合规要求的不断变化而动态演变。在《数据安全法(二审草案)》《个人信息保护法(二审草案)》等法案逐步出台后,金融、电信、互联网等各个行业将陆续出台数据流通相关的监管规定,虽然监管层面逐步认可并鼓励应用隐私计算以促进数据流通与权益保护之间的平衡,但法律法规并不会明确给出技术应用的具体路径。随着攻击手段和破解技术的不断发展,数据合规要求将不断更新,技术的发展也将随之动态演变。
来源:信息安全研究、科技日报、信息通信技术与政策
文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885
参与评论
请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。
评论区