
因此,各个企业的 AI 团队在建模时,都力图寻找更为安全高
效的隐私计算方法来提升多源数据协同能力,为 AI 模型训练
提供更大规模、更高质量的数据。
这其中,联邦学习方法是近年来受到广泛关注的隐私计算方
法。与以往多方安全计算、分布式机器学习和深度学习方法相
比,联邦学习方法具有以下特征:
• 各参与方的数据都留存在本地来参与训练,一种联邦学习
方法的基本流程如图一所示;
• 每个参与方的数据都参与训练过程,相比合并所有数据训
练的模型,联邦学习模型的准确率损失可控;
• 训练过程中兼顾隐私和安全,各参与方能够在不披露原始数据
的前提下共同参与和推动 AI 模型的优化,并共享最终模型。
为了让联邦学习方案的构建更为便捷高效,并能够快速与用户
应用场景融合,作为联邦学习的积极探索者和参与者,微众银行
率先发布了联邦学习工业级开源框架 FATE。作为一种分布式
安全计算框架,FATE 支持同态加密 (包括全同态、半同态) 等隐
私技术,并覆盖横向联邦学习、纵向联邦学习以及联邦迁移学
习等不同联邦学习类型,可为机器学习、深度学习等提供高性
能安全计算。
一直以来,英特尔都以先进的软硬件产品与技术为联邦学习方
案中的各类隐私技术提供出色的基础能力。微众银行 FATE 框
架中支持的各类同态加密算法,其运行过程中需要执行高密度
的计算任务,而英特尔® 架构处理器平台在密集型计算上的优
势可对其提供巨大助力。
现在,面向单路和双路的第三代英特尔® 至强® 可扩展处理器
的到来,进一步为各项联邦学习任务提供了强劲算力,其集成
的英特尔® AVX-512 IFMA 指令集可与英特尔® IPP-Crypto
库等出色技术和产品协同,也为半同态加密过程提供了特定加
速能力。
以多缓冲区函数加速半同态加密中的模幂运算
同态加密是联邦学习中常见的隐私技术之一。所谓同态,是指
通过一定的加密方法,让原始数据的操作,与加密数据的操作
始终能保持同一种形态。如图二所示,假设原始数据 A 和 B 分
别来自联邦学习的参与方 a 和 b,双方计划通过协同运算得到
结果 C,但 ab 双方都不希望对方知道自己的数是多少。在使用
同态加密的联邦学习环境中,可以对 AB 分别进行加密,并在
加密环境下执行运算,所得到的结果进行解密后即可得到 C。
由于整个协同计算过程都是在加密状态下进行,ab 双方在计
算过程中无法看到原始数据,因此保证了原始数据的安全性。
使用同态加密的联邦学习环境
参与方 a 参与方 b
加密 加密
解密
A
A
B
B
C
C
运算符
运算符
图二 同态加密协议基本方法
加密实体对齐
加密模型训练
协同方 C
A 数据 B 数据
2
1
3 3
1
4 4
发送公钥
计算梯度与损失
交换中间结果
更新模型
1
3
2
4
数据源 A 防火墙 数据源 B
11010101
01011110
10010101
11010101
01011110
10010101
模型 B模型 A
图一 一种联邦学习基本架构
2
案例研究
|
加速安全计算 赋能联邦学习
文档被以下合辑收录
评论