导读:社会发展趋势带来了新的协作模式,产生了一些新的技术概念,例如隐私计算和区块链技术等。在前沿技术的研究和生态建设中,不同的角色切入点也不尽相同,一般来说,负责技术落地的厂商会更多关注产品实现中多技术融合的整体性,例如联邦学习、区块链技术等多技术的融合价值和兼容性问题,而金融测评机构主要依据测评标准作为判定依据,以现有的隐私计算及区块链的金融标准来看,有明确的技术边界,即便一个产品融合了多个技术,也是单独依据某种技术方案的相关标准进行评估,但不管测评对象是什么,测评的目的还是为了保障金融科技产品在安全性、可靠性、功能及性能等评估维度上能够达到国家及金融行业等标准要求,让金融产品使用方在采购时能有一个较为客观可靠的初筛以确保使用的产品符合标准要求并在使用时更为放心。
本次由深圳国家金融科技测评中心的罗丰带来主题为《金融科技测评助力金融数据安全共享》的分享,主要内容包括三大部分:基本背景
金融数据安全共享关键技术
金融科技测评探索与实践
分享嘉宾|罗丰 国金测评 隐私计算实验室负责人
编辑整理|弓雨山 深信服
出品社区|DataFun
01
金融数据安全共享的基本背景

中央在去年首次将数据作为一个生产要素提出,要求社会数据资产的价值进一步提升;在后续的十四五规划、央行发布的金融科技发展规划等文件中,也把充分释放数据要素潜能作为一项重点任务去规划。然而释放数据价值首先要解决的就是数据孤岛问题,即如何有效实现数据的流通和融合,打破数据孤岛是一个系统性工程,需联合多方解决目前困境,包括如何进行数据的分类分级;如何保障整个数据生命周期的数据安全、如何实现数据高效交互;数据资产如何评估;价值如何分配等。其中确保数据安全可控及合规,是实现数据共享的基本条件和前提。在倡导数据共享的同时,国家发布了关于网络安全、数据安全、个人信息保护等法律法规,旨在安全合规的前提下释放数据价值,安全与发展并重。在这样的背景下,如何在打破数据孤岛、促进数据融合的同时保障数据安全,也成为了急需面对和解决的问题。这也是近年来多方安全计算、联邦学习、区块链等技术得到重视和快速发展的原因之一。

央行发布的《金融科技发展规划(2022-2025 年)》中,已经对加强数据能力、保障数据安全与个人隐私等方面做了顶层设计;在《金融业数据能力建设指引》中,对数据战略、数据治理等八个方面也做了相关的指引要求;在《关于银行保险业数字化转型的指导意见》中,对完善数据治理体系、加强数据治理、加强数据安全和隐私保护、提高数据应用能力等方面给出了具体的指导意见。综上,在金融科技行业,从顶层设计到规范指引、指导意见,相关的配套政策体系目前已经逐步完善。02

隐私计算是目前实现数据安全共享的主流技术路径。根据行业调研结果,目前隐私计算已经形成了“3+1”的技术发展方向,“3”即隐私计算中的多方安全计算、联邦学习和可信执行环境,“1”即区块链,利用区块链不可篡改、可溯源的特性,作为辅助隐私计算的关键技术。其中,这里提到的数据安全不等同于数据合规,从技术上解决的是数据流通安全的问题。隐私计算指的是通过使用多方安全计算、联邦学习等技术和解决方案,使得多方原始数据在各不外泄的情况下,完成一系列联合运算处理的过程。其中同态加密作为隐私计算里中较有潜力和发展趋势的技术路线之一,早在 1978 年就发现了 RSA 具备这个乘法半同态的属性,到了 2009 年,基于格密码首次提出了一个全同态的概念,也标志着这个全同态的开始。但多种技术路线的独立发展,也导致了不同技术路线之间不兼容、从而产生了新的数据孤岛问题。
隐私计算在实现多方数据融合的过程中会涉及到多方机构或参与方之间的交互,这时会产生一个半诚实模型和恶意模型的概念,如何确保各参与方的交互过程中不存在恶意行为或恶意行为可以被追溯并不可抵赖,是分布式设计方案中需要解决的问题。区块链本身的可追溯性、不可篡改性和不可抵赖性将整个隐私计算活动过程的关键行为形成记录存证,是很好的一个解决方案。当发现某一方存在恶意行为的情况下,就可以通过不可抵赖的记录数据进行追溯、完成审计及后续的追责处理。这也是区块链在隐私计算中一个关键的技术契合点。
隐私计算技术在金融领域的应用场景主要可以分为联合查询、联合运算和联合建模,细分应用场景有联合联合营销、欺诈监测、智能风控等。以智能风控的金融应用场景为例,当客户想办理银行卡时,银行不会直接办理;目前上层对于银行机构的相关方面审查也越来越明确和重视,银行需要首先去确保客户办卡的用途。但是银行机构如果仅在自己的数据系统里面做风险查询,尤其面对新的开卡用户的时候,因为缺乏相关数据很难做好风控评估。最好的方式是同时去查询其他银行机构对于该开户人的风险标签。假设在一个隐私计算系统中,银行机构 A、B、C 都是参与方,当机构 A 发起一个客户的风险标签查询时,如果机构 B 和机构 C 存储了这个客户的风险标签,那么机构 A 在获取密文查询结果并解析后,就能知道该客户是风险客户,从而去规避对该客户发卡造成的风险和损失。同时因为整个过程是一个匿踪查询,所以对于 B 和 C 机构来说,并不知道机构 A 查询的具体信息,这也相当于保护了查询方的权益。
除了包括前文提到的数据孤岛问题、数据群岛问题、数据隐私安全问题,目前还存在数据融合合规问题、技术理论安全证明缺失等问题与风险。
随着技术的迭代与更新,金融数据安全共享相关的技术标准也在不断完善、与时俱进。当前金融科技行业的产品设计、研发和测评,都会依据金融相关的标准去开展。2020 年作为隐私计算元年,之后各种政策技术纷纷落地。《多方安全计算金融应用技术规范》经过多个标准编制环节,于 2020 年底正式发布,对多方安全计算金融应用场景中的产品与系统的开发设计起到了有效指引作用。
接下来主要是对这四本与隐私计算、区块链相关金融领域标准进行一个解读。在联邦学习和可信执行环境这两方面,因为目前的行标还未发布,所以测评依据暂时是国金测评基于金融行业经验、联合头部企业编制的两本企业标准。
目前测评的几个技术方向主要是多方安全计算、联邦学习、区块链和隐私计算一体机。目前已经有 18 款多方安全计算产品通过了测试,获得了国金测评颁发的测评证书。
MPC 的测评依据主要有《多方安全计算金融应用技术规范》(以下简称技术规范)和《多方安全计算金融应用评估规范》(以下简称评估规范)两本。这两本规范是角度不同的完全对应关系,相比于《技术规范》,《评估规范》更加侧重于为评估机构、产品方和解决方案提供方提供比较明确的评估依据。
标准的整体框架主要从概述、基本要求、安全要求和性能要求这四个部分去设计的。其中,基础要求包括了数据输入、算法输入、协同计算、结果输出、调度管理等基本功能。安全要求中除了协议安全及隐私数据安全是隐私计算技术里特有的安全要求外,其他的包括认证授权、密码安全、通信安全、存证与日志,都是一种通用的安全检测内容。性能要求会根据不同应用场景提出三个维度的指标:分别是计算延迟、吞吐量和计算精度。考虑到针对不同的多方安全计算产品存在某些检测项不适用的情况,实际测评过程中的检测案例会被划分为必测项、条件可选项和可选项。其中条件可选项是需要厂商根据自身产品的特性,给出某些项不可测的合理理由,可选项主要看厂商特性和意愿,经测评机构评估确认后,就不再进行检测评估。所有测试项符合要求后即可获得报告及证书。
《多方安全计算金融应用技术规范》针对参与方和工作时序的定义也是比较重要的一个部分。我们可以从传统的集成计算系统来理解参与方,从数据输入、到数据计算、再到结果输出,针对这三个环节,分别可以抽象出数据提供方(提供数据);计算方(执行运算);还有一个是结果获取方(获取输出结果)。在《技术规范》里面定义的MPC系统来看,除了这三个角色,还有额外三个角色:任务发起方、调度方和算法提供方。任务发起方和调度方是分布式系统里面特有的,因为分布式会涉及到不同的机构、不同的节点去参与,可能不止一个数据提供方、计算方和任务发起方,甚至每个节点都有可能有任务发布的权限、即都是任务发起方,多个任务发起方形成了一个多任务的分布式复杂系统,此时则需要一个调度方统一地去多任务的执行进行一个合理的调度和分配。要注意的是,在多方安全计算系统中,同一个节点可以同时担任不同的一个或者说多个角色,比如一个节点既可以是任务发起方,也可以是数据提供方、结果获取方。但有一个例外是数据提供方和计算方需要分开的,相当于不能既当这个运动员又当裁判,因为涉及到数据安全的问题,因此以也是一个硬性要求。关于 MPC 的工作时序,《技术规范》给出了比较详细的讲解表(上图右图)。首先会由任务发起方创建任务,然后向调度方发起任务请求。调度方会结合算法提供方提供的一些算法和参数形成调度信息,即图上的任务配置信息。数据提供方会根据所授权的数据从数据库里面读取数据,并转换成输入因子发送给计算方。其中输入因子是相对于源数据的一个概念,通过对数据进行切片、脱敏、同态加密等方式转化和处理,使得看起来像是一串乱码,参与方就无法这些通过截取输入因子直接获取到原始数据。计算方接收到输入因子后会按照 MPC 协议进行多方协同计算,最终将生成的输出因子发送给结果使用方。以上大概是《技术规范》对于多方安全计算任务的工作过程。但在实际的多方安全应用部署执行前,还需要完成诸多的前置准备工作,例如数据提供方需要对源数据进行统一定义。其他例如分布式联合查询、联合运算等应用场景,都需要有这样的前置过程,之后才能说具备了数据统一处理的基本条件。数据统一定义完成后,各数据提供方可以对自己的源数据做一个预授权的操作,去划分出哪些数据可以授权给哪些机构、或者说在哪些应用场景中去使用。还有包括一些系统管理平台,需要对每日的定时任务做配置,以及对各个机构任务的发起频次做限制。
安全要求部分在金融领域是非常重要的一部分。MPC 规范主要从协议安全、隐私数据安全认证、认证授权安全、密码安全、通信安全、存证与日志六个方面去设计。其中协议安全和隐私数据安全是特有的,也是需要重点关注的。安全模型主要分为两种:半诚实模型和恶意模型。二者区别在于,半城市模型只做一些窃听行为,而不去主动发起攻击,目的是尽可能在不暴露自己的情况下去收集更多的数据。而恶意模型除了窃听数据之外,还会去主动做一些主动攻击。安全要求部分有三个安全参数:不诚实门限、统计安全参数和计算安全参数。其中不诚实门限主要针对恶意模型,指的是恶意模型里能够支持恶意参与方合谋的极大值。统计安全参数是整个协议里安全上的要求,是与这个随机数相关。计算安全参数相当于是密码学里的等效安全参数。
安全要求部分有三个安全参数:不诚实门限、统计安全参数和计算安全参数。其中不成熟门限主要针对恶意模型,指的是恶意模型里能够支持恶意参与方合谋的极大值。统计安全参数是整个协议里安全上的要求,是与这个随机数相关。计算安全参数相当于是密码学里的等效安全参数。 协议安全的四个基本安全要求也必须要满足的,如果整个系统连隐私性和正确性都没办法保障,那也就没有可用性和价值。关于公平性和独立性,公平性相对来说比较难满足,因为实际应用场景中,不一定所有的参与方最终都会拿到输出结果。关于通信安全,经常会遇到两个问题,因为《技术规范》里这一部分要求使用国密,因此如果整个多方安全计算产品不支持国密,那么产品就没办法满足规范的要求。另一个是双向认证,通信中的双向认证在金融行业是一个比较通用的要求,但在评估过程中,也存在双向认证由于落地便捷性等原因没有实现的情况。存证和日志部分主要是为了在风险事故发生时,可以通过存证和日志,去进行溯源和审查。为了确保整个证据链的完整性和审计的可分析性,《技术规范》要求所有的输入、输出数据和计算任务都需要存证,所有的操作也都应该保存日志,并且至少要保存六个月以上,相对的,规范一般不会规定具体的事项方式,只要满足要求即可,例如可以采用加密存储,也可以放到TEE或通过区块链的技术实现。
性能要求在《技术规范》中被划分为四个场景。对于每类应用场景,在计算时延和 MPC 精度上都有不同的性能指标要求。实时类的计算时延会要求相对高一些,对于非实时类,TPS 要求则高一些。对于资金类,MPC 精度相对会要求更高一些。评判依据中的精度,是会将明文的计算结果和密文的计算结果进行二进制的转换,然后去比对连续的相同有效位。


联邦学习的金融行标《联邦学习技术金融应用规范》是从 2021 年开始编制,目前还未正式发布,所以我们目前参考的是自己的一个企业标准,该标准已经过了多轮测评的一个实际验证和考验。
联邦学习的整体框架设计,与多方安全计算保持一致,也分为概述、基础要求、安全要求、性能要求这几个维度。整个任务执行也包括六个角色任务发起方、调度方、算法方、数据提供方、计算方和结果方。
在安全方面的话,多方安全计算主要是协议安全和隐私数据安全这两部分,做的是底层数据流通上的一些安全评估。相比较而言,联邦学习更在意横向联邦、纵向联邦包括特征工程等上层应用,不太会在意底层的数据流通安全。再细分拆解,联邦学习更多涉及的是机器学习算法相关的东西,包括对逻辑回归、树模型、神经网络等一些机器学习算法相关的一些安全测试。性能测试方面,多方安全计算的测量维度受硬件资源的影响,为保证测评的公正性,会要求厂商部署在我们统一测试平台并用统一的测试数据集进行测试,但是联邦学习比较的是相同硬件资源下,明密文之间的差异,不用所有厂商都部署到测试平台上。

区块链的《区块链技术金融应用评估规范》,《个人金融信息保护技术规范》和《金融分布式账本技术规范》。测评对象主要针对联盟链,测评内容主要涉及一些底层架构、智能合约、上层应用等。目前的话多家银行机构,包括腾讯、蚂蚁、前海联合交易中心等都通过了测评。
区块链的评估规范按照常规划分基本可以划分为基本要求,安全要求和性能要求。区块链的技术方向和应用方向当前存在很多安全风险,主要包括共识机制、智能合约、商品能力的设计风险,密钥的全生命周期的管理风险等。在测试案例的设计上,例如针对智能合约的风险,测评机构会去建立一套智能合约安全监测的系统;针对漏洞分析,测评机构也会去做一些模糊测试或静态化测试,或者模拟一些漏洞攻击手段等方式去实现一个漏洞的分析。目前我们已针对区划链形成了完善的测试案例,覆盖了接口测试、压力测试、异常模拟测试等,并且已经集成到了测试平台上。测试平台的话目前已经支持蚂蚁链、Fabric 等这些主流的这个底层链的区块链产品。
隐私计算一体机是目前相对来说一个新兴的产品类型,也是隐私计算发展路线的其中一个趋势。它的设计初衷主要是为了解决隐私计算面临的几个问题:一个是执行效率上的问题。隐私计算中涉及大量加密过程,包括协议的交互等,会导致数据膨胀,造成计算效率低下。该问题的解决方案主要有两个,一个是通过优化协议和算法,从本质上去解决运算效率的问题;另外一个是通过提高硬件资源的支持去实现加速,隐私计算一体机则是通过采用 GPU、FPGA等硬件加速的方式去解决该问题。另外,隐私计算一体机在安全可控上更高一些。多方安全计算和联邦学习产品即便满足了标准上的安全要求,但在实际应用和部署到具体的一个运行环境当中时,比较难保障整体的系统安全性。比如说操作系统有没有漏洞、容器有没有进行安全配置和裁剪、是否存在侧信道攻击的风险等。而隐私计算一体机作为一个整体产品,本身就具备产品完整性,所以产品的安全性能和可用性相对来说会更客观或者更可控。隐私计算一体机的逻辑架构图定义中,最底层是硬件层,包括常见的 CPU 、硬件硬盘、内存通信模块等,也包括一些安全性的硬件模块,比如加密模块的。还有一些加速硬件,比如 GPU 和 FPGA。运行环境层主要是安全容器和操作系统。通用功能最核心的就是隐私计算层。
隐私计算一体机企业标准的框架设计也是与逻辑架构图保持一致的,从整机的分层上去设计的,包括硬件要求、运行环境要求、通用功能要求、隐私计算要求以及这个性能要求 5 个部分。当然也是可以从中抽象出功能要求、安全要求和性能要求,我们实际的一个测评分类,也是按这么一个方式进行的,可信执行环境也就是我们常说的TEE,目前的市面上的主流方案是基于国产海光处理器以及 Intel SGX,但基于 Intel SGX 的话,因为不是自主可控的,所以有技术能力的厂商会在外面再包一层,去提高它的可控安全性,在这方面,我们主要是去评估TEE和REE之间的资源和数据的隔离性,以及信任根及敏感数据的存储安全,启动安全等。可信平台模块的话也就是常说的 TCM 或 TPM,我们主要是会去测试一个启动度量机制,核心文件数据的防篡改能力以及异常状态告警等功能的实现,操作系统和容器安全,主要是做一些漏洞扫描和安全配置的评估,以及看是不是做了定制化裁剪,实现最小配置,容器还需要看下具不具备日志及审计功能,同时应该禁止共享进程、网络、用户等命名空间,通用功能有一点需要注意的就是防拆机制,防拆机制的话,也是为了确保整机的安全性,如果对整机进行一个拆机的话,就会触发一个报警机制,像现在的支付终端,包括有些智能门锁,都有这么一种安全机制,那这个的话也是条件可选项,如果你的整机是部署在一个安全可控的环境下,不会具有这种拆机物理攻击的一个风险,那么这个功能可以不具备,但是如果是部署在一个非安全可控的一个环境下,比如说是给到其他机构进行本地部署的话,那么就存在这种攻击风险,就需要有具备这么一个防拆机制。隐私计算要求的话跟前面两个规范也是对应的,包括任务管理、数据管理、算法管理、节点管理及安全管理。性能要求的话我们是对精准性和效率两个维度进行评估,精准性方面,对于匿名查询及安全求交等计算结果是要求与明文运算完全一致的。
针对功能要求模块、安全要求模块及性能要求模块,可以单独分开测评,分别提供对应模块的测评报告。如果说同一款产品三个测评均通过检测,或直接通过了全项测评,则会最终颁发一个隐私计算一体机的测评证书。
厂商经过我方的测评,除了可以衡量自身产品的符合性,对不满足要求的部分进行优化完善,最大的价值是可以凭借测评报告或证书,获取到金融科技产品认证,在今年的 2 月份,第二批金融科技产品认证目录已经发布,区块链和多方安全计算都新增到了这个第二批目录里面。该认证是由央行和市场监督管理总局一起联合发布的认证,含金量在金融行业里面也非常高。那么我们颁发的报告和证书是完全可以作为申请金融科技产品认证的佐证材料之一,去证明产品符合了规范要求,同时也是获取这个认证的必要条件之一。


这个是我们的一个检测流程,在测试开始前,需要客户准备送检产品及相关材料,提交给我们实验室,我们会对这些产品及材料进行一个审核,在双方确认依据标准及评估项后,就可以签订合同正式测评了,正式测评会采用人员访谈、材料审查、产品验证等方式进行,根据项目的不同,测试周期也不一样,如果都满足要求,那么我们会在跟客户确认报告信息后,出具一份报告。隐私计算等测评项目,还会出具相应的一个测评证书。随着隐私计算、区块链技术体系及产业的不断成熟,数据融合共享已经离我们越来越近。在新需求、新技术和新应用场景落地的同时,金融行业也在不断地更新完善和迭代。以标准化为抓手,以测评为落地手段,助力金融数据的安全和共享。我们作为一家金融测评机构,也希望通过长年的积累,提供更专业的测评能力,以及更加人性化的测评服务,以一个企业担当,去服务于国家战略、服务于金融监管、服务于产业发展、服务于金融消费者。今天的分享就到这里,谢谢大家。扫码查看【数据安全与隐私计算峰会】视频回放👇

罗丰
国金测评 隐私计算实验室负责人
法国鲁昂电子电力工程师大学硕士,PMP,现任深圳国家金融科技测评中心隐私计算实验室负责人,拥有多年金融科技检测评估经验,研究方向涉及数据合规、数据融合等,包括但不限于基于大数据、隐私计算等主流技术路线的基础研究、测评方案设计与标准编制,曾主导Q/NFEC 0001-2022《隐私计算一体机金融应用技术要求》的编制修订,参与PBOC、Visa、Mastercard、UPTS、PCI等多项金融应用与安全规范落地实施工作。
# 直播推荐 #
💬:现代数据中心 NVIDIA GPU IO 加速方法
⏰:12/28 19:00
🔗:扫码进群观看直播

# 免费电子书 #
📁:Impala优化实践
⏰:领取截止 2023.1.15 23:59
🔗:扫码回复「16」查看领取方式

专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章800+,百万+阅读,15万+精准粉丝。