高手问答第 304 期 —— 聊聊隐私计算技术

小白兔爱吃大灰狼 发布于 08/08 10:29
阅读 4K+
收藏 2
数据流动起来才可以创造更大的价值,随着数字经济持续高速增长, 数据的互联互通需求越来越旺盛,大到政府机关的公共数据、公司核心商业数据、小到个人信息。近两年,我国也相继出台了 《数据安全法》《个人信息保护法》。因此, 如何让数据安全地流通起来,是一个必须要解决的问题
 
隐私计算技术作为 连接数据流通和隐私保护法规的纽带,通过同态加密、混淆电路、差分隐私等技术,实现了 “数据可用不可见”。隐私计算技术是在保护 数据提供方不泄露原始数据的前提下,实现数据分析计算的技术集合。它作为数据流通的 重要创新前沿技术,目前主要包含如下三大技术路线: 安全多方计算(SMPC)、机密计算(TEE)、联邦学习(FL) ,这些技术已经广泛应用于金融、医疗、通信、政务等多个行业。
 
OSCHINA 本期高手问答 (8 月 9 日 - 8 月 15 日) 我们请来了 PrimiHub 开源 和大家一起探讨关于「隐私计算技术」的问题。
 
可讨论的问题包括但不限于:
  • 什么是隐私计算
  • 隐私计算的学习建议
  • 隐私计算相关的技术
  • PrimiHub 的技术设计
如有其他隐私计算相关问题也欢迎积极提问。
 

PrimiHub 作为一款由密码学专家团队打造的开源隐私框架,具有以下特性:
  • 开源:完全开源、免费
  • 自主研发:安全多方计算、联邦学习、同态加密、可信计算等隐私计算技术
  • 开箱即用:拥有 Web 界面、命令行和 Python SDK 等多种使用方式
  • 功能丰富:支持隐匿查询、隐私求交、联合统计、数据资源管理等功能
  • 灵活配置:支持自定义扩展语法、语义、安全协议等
GitHub 地址:https://github.com/primihub/primihub

嘉宾介绍

 
刘仁章,应用数学博士,北京原语科技密码学专家。精通格密码、同态加密、安全多方计算等。在 NIST 全球后量子密码算法竞赛中攻破 HK17 等多个后量子密码候选方案。曾获 2022 年“金融密码杯”竞赛一等奖。
 
为了鼓励踊跃提问, 原语科技 PrimiHub 会在问答结束后从提问者中抽取 5 名幸运会员,赠予 PrimiHub 定制笔记本礼盒 3 件套(内含:笔记本*1、金属签字笔*1、U盘*1)。
 
 

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就 隐私计算技术 相关问题向 PrimiHub 提问,直接回帖提问既可。

加载中
0
小白兔爱吃大灰狼
小白兔爱吃大灰狼

高手问答第 304 期 —— 聊聊隐私计算技术

@before31 @clearsky1991  @梦梦阁  @xiaoaiwhc1  @灰灰

恭喜以上5位网友分别获得 PrimiHub 定制笔记本礼盒 3 件套 一套

请于8月23日前登陆账号, 私信  @小白兔爱吃大灰狼   告知快递信息(格式:姓名+电话+地址),过期视为自动放弃哦~

3
clearsky1991
clearsky1991

@PrimiHub开源 老师,您好,我之前无意中看到过一个微软同态加密库SEAL(https://github.com/microsoft/SEAL#windows-linux-and-macos),这个实际应用时似乎需要针对特定的数据结构、应用中的算法调用它封装的一些函数,总之就是需要编写特定应用特定场景下的C/C++代码,目前同态加密这块有么有通用一些的算法、工具、类库?

PrimiHub开源
PrimiHub开源
就目前的技术发展而言,同态加密算法库只提供了一些底层的同态加密算子(可以想象为“指令集”),而我们现在也还只能通过写“汇编代码”的形式来进行开发,为此,我们还不得不了解这些指令的功能,并按照指令的格式去做开发。不过相信随着技术的发展, 以后说不定会有一些像“C语言”这样的高级语言出现,也会有“编译器”一样的通用工具出现,使得同态加密技术门槛大大降低。
PrimiHub开源
PrimiHub开源
关于同态加密,可以参考我们的另一篇文章:《同态加密为什么能被称为密码学的 “圣杯”?》https://my.oschina.net/u/6662337/blog/10091831
PrimiHub开源
PrimiHub开源
同态加密指的是可以在密文状态下进行运算,例如密文加法、密文乘法。SEAL同态库支持上述运算,以及一些向量、矩阵的运算,例如向量点积。至于怎么使用,需要看特点场景下需要用到哪些同态运算,然后调用同态库相应的算子来实现需要的功能。但是目前来说,通用的工具比较少,而且只能做一些Toy Example。可以去看看谷歌的同态加密转译器(transpiler),网上有开源。
2
iman123
iman123

@PrimiHub开源 老师,您好,我想了解一下:隐私计算技术目前的现状、主流技术方案是什么,未来有哪些趋势?

PrimiHub开源
PrimiHub开源
当前的隐私计算技术多应用在金融、医疗、政务、营销等行业,比如「金融领域」的联合反洗钱、银(行)证(券)数据共享、高净值/风险用户共享;「集团机构」间的数据共享比如:共建用户黑名单。鉴于各行各业对隐私保护的要求逐渐提高,隐私计算技术今后应该会用到各行各业。
PrimiHub开源
PrimiHub开源
隐私计算涉及到的技术有安全多方计算、同态加密、联邦学习、差分隐私、机密计算等,不同技术有各自的优势和劣势,以及各自适合的应用场景。一般来说,对安全性要求高的场景,首选安全多方计算;对性能要求高的场景,优先TEE;多方机器学习建模的时候,考虑联邦学习。
0
贺小皮蛋
贺小皮蛋

@PrimiHub开源 这块不太熟悉,不过之前看到过类似 同态加密这样的技术介绍,从我们公司的态度来说 企业的数据 基本上都是不对外公开的,如果已经是私域的数据了 是否还会涉及隐私计算这类的场景呢

PrimiHub开源
PrimiHub开源
如提问中所说的,如果是私域数据、没有流通需求的数据,是不需要用到隐私保护技术的。 数据的流通要以隐私保护为前提,隐私计算技术的关键作用就是保护数据流通中的隐私性和安全性。对于企业来说,使用隐私计算技术,可以在不泄漏数据的前提,释放数据的价值。
PrimiHub开源
PrimiHub开源
该评论暂时无法显示,详情咨询 QQ 群:点此入群
0
某人gmgn3
某人gmgn3

@PrimiHub开源 我想问下什么是隐私计算?已将隐私计算的应用途径?

PrimiHub开源
PrimiHub开源
隐私计算是指在「保护数据本身不对外泄露」的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的。隐私计算多应用在金融、医疗、政务、营销等行业,比如「金融领域」的联合反洗钱、银(行)证(券)数据共享、高净值/风险用户共享;「集团机构」间的数据共享比如:共建用户黑名单; 《苹果的差分隐私技术原理》https://my.oschina.net/u/6662337/blog/10087905
0
灰灰
灰灰

是不是可以兼顾隐私,又可以实现计算?不是简单的加/解密。

灰灰
灰灰
回复 @PrimiHub开源 : 这个值得推广,而且值得向ZF推广,既可以保护大家的隐私,又可以达到不断优化工作的效果,还避免第三方服务公司在服务过程中盗取数据。
PrimiHub开源
PrimiHub开源
是的。“隐私计算技术”的全称为“隐私保护计算技术”,是在保护隐私情况下进行计算的技术。仅仅使用普通的加解密功能,达不到隐私计算的要求。有一种特殊的加密技术叫“全同态加密”,可以在密文状态下进行计算,是实现隐私计算的一种技术路线。
0
empireghost
empireghost

@PrimiHub开源   

  • 隐私计算有什么学习建议?  与特定编程语言有关联吗?
  •  
  • 隐私计算有那些相关的技术?  适合什么行业使用?
  •  
PrimiHub开源
PrimiHub开源
隐私计算涉及到的技术有安全多方计算、同态加密、联邦学习、差分隐私、机密计算等,在金融、政务、医疗等行业有很好的应用场景。学习隐私计算技术的话需要有扎实的数学基础,编程语言的话有C++和Python,安全多方计算、同态加密和机密计算多用C++,联邦学习和差分隐私多用Python。
0
before31
before31

@PrimiHub开源 老师您好,我有两个问题请教:

1、如果说,隐私计算技术的目的是“在不泄漏数据的前提,释放数据的价值”的话,那传统的方式,例如,你想要评估某人的信用情况,来我这里查的时候我只给出他的信用评分,不会给出具体的数据详情,这样也保护了用户的数据并且产生了价值。这两者有什么区别呢?

2、隐私计算技术现在在国内的应用情况怎么样,是刚开始发展的阶段,还是已经有大规模应用了?主要集中在哪些场景?

PrimiHub开源
PrimiHub开源
隐私计算技术可以很好地解决这个问题,比如联合建模、联合风控等,让各方的数据流通起来,而且可以在不泄漏隐私的情况下更好地利用数据价值。
PrimiHub开源
PrimiHub开源
2、隐私计算多应用在金融、医疗、政务、营销等行业,比如「金融领域」的联合反洗钱、银(行)证(券)数据共享、高净值/风险用户共享;「集团机构」间的数据共享比如:共建用户黑名单;这里还有一篇《苹果的差分隐私技术原理》https://my.oschina.net/u/6662337/blog/10087905
PrimiHub开源
PrimiHub开源
1、在上述场景中,只需要保证查询结果的隐私性,所以展示信用分数即可。但在实际的信用评估中,需要收集很多用户的原始数据来构建信用评估模型。而且,由于一方的数据是有限的,实际中需要多方联合来提高模型精度。进一步,多方的数据融合可以解决“数据孤岛”问题(各方的数据孤立,没有相互流通),而在涉及到多方的时候就需要保护数据隐私。
0
Ericpoon
Ericpoon

@PrimiHub开源 这个和使用did做身份认证,有没什么联系?

PrimiHub开源
PrimiHub开源
两者背后用到的一些密码学技术是相同的,如零知识证明等。DID里的认证行为也可以看做是隐私计算在这类特定场景中的应用。目前也有很多区块链+隐私计算的研究。
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部