暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
面向频繁项集挖掘的本地差分隐私事务数据收集方法-欧阳佳,印鉴,肖政宏,赵慧民,刘少鹏,梁鹏,肖茵茵.pdf
52
24页
0次
2022-05-26
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software, [doi: 10.13328/j.cnki.jos.006044] http://www.jos.org.cn
©国科学院软件研究所版权所. Tel: +86-10-62562563
面向繁项集挖掘的本地差分隐私事务据收集方
1
,
2
,
1
,
1
,
1
,
1
,
1
1
(广东技术师范大 计算机科学院, 广 广州 510665)
2
(山大 数据科学与计算机, 广东 广 510275)
通讯作者:政宏, E-mail: huasxzh@126.com
: 事务数据常见于各种应用场景中,如购物记录、页面浏览历史等.为提供更好的服务,服务提供商收集用户
数据并进行分,但收集事务数据会泄露用户的隐私信.为解决上述问题,文基于压缩的本地差分隐私模,
出一种事务数据收集方法.首先,定义一种新的候选项集分值函;,基于该函数将候选项集的样本空间划分为
多个子空间;第三,随机选择其中一个子空,基于该子空间随机生成事务数据并发送给不可信的数据收集;最后
考虑到隐私参数的设置问题,基于最大后验置信度攻击模型设计启发式隐私参数设置策略.理论分析表明该方法
同时保护事务数据的长度与内容,满足压缩的本地差分隐私要求.实验表明,目前最优的工作相比,本文收集的数
据具有更高的效用性,隐私参数设置更具有语义性.
关键词: 隐私保护;数据收集;事务数据;本地差分隐私;隐私参数
图法类号: TP311
文引: ,,,,,,.频繁挖掘差分务数集方.
软件学报. http://www.jos.org.cn/1000-9825/6044.htm
英文引用格式: Ouyang J, Yin J, Xiao ZH, Zhao HM, Liu SP, LIANG P, XIAO YY. Transaction Data Collection for It
emset Mining under Local Differential Privacy. Ruan Jian Xue Bao/Journal of Software, (in Chinese). http://www.jos.org.
cn/1000-9825/6044.htm
Transaction Data Collection for Itemset Mining under Local Differential Privacy
OUYANG Jia
1
, YIN Jian
1
, XIAO Zheng-Hong
1
, ZHAO Hui-Min
1
, LIU Shao-Peng
1
, LIANG Peng
1
, XIAO Yin-Yin
1
1
(College of Computer Science, Guangdong Polytechnic Normal University, Guangzhou 510665, China)
2
(School of Data and Computer Science, SUN YAT-SEN University, Guangzhou 510275, China)
Abstract: Transaction data is commonly in various application scenarios, such as shopping records, page browsing history, etc., service
providers collect and analyze transaction data for providing better services. However, collecting transaction data will disclose privacy
information. To solve the problem, this paper proposes a transaction data collection mechanism based on Condensed Local Differential
Privacy (CLDP). Firstly, we define a new score function of the candidate set. Secondly, we separate the output domain of the candidate set
into several subspaces according to the function. Thirdly, the client select one subspace randomly, and generate transaction data randomly
based on the subspace, then, send it to the untrusted data collector. Finally, considering the difficulty for setting the privacy parameter, we
design the heuristic privacy parameter setting strategy, based on the maximum posterior confidence threat model (MPC). The theoretical
analysis shows that this method can protect the length and content of transaction data at the same time and satisfies
α
-CLDP. The
基金项目: 自然科学基金(61702119,U1711262,U1501252,U1711261);广州市科技划项(201804010236,201607010152);
广东省基础与应用基础研究基(2019A1515012048).广东省教育厅创新团队项目(2017KCXTD021)
Foundation item: National Natural Science Foundation of China (61702119, U1711262,U1501252, U1711261); Science and
Technology Program of Guangzhou (201804010236, 201607010152); Guangdong Basic and Applied Basic Research Foundation
(2019A1515012048). The Innovation Team Project of the Education Department of Guangdong Province(2017KCXTD021)
收稿时间:
2019-11-06; 修改时间: 2020-01-30, 2020-03-09; 采用时: 2020-03-20; jos 在线出版时间: 2021-05-20
2
Journal of Software 软件学报
experiments demonstrate that the transaction data collected in this paper has higher utility than the state-of-the-art approaches, and the
privacy parameter setting is semantic.
Key words: privacy preserving; data collecting; transaction data; local differential privacy; privacy parameter
数据,信息的场(:,电影,
,浏览).数据的发,事务收集,其中丰富,集者
数据(:协同滤、关联则等),得到模型为用提供好的服务.
,据中人隐,网页搜索露自态、
等信;网上生的录将所购私物,露自习惯
;览网页时生的 WEB流将露自己的网习等等.果不取任保护措施接收并分析用
的数,会导个人私信息的,造成严重.震惊世界 AOL 日志私泄事件敲响警钟,因隐
泄露带来困扰将严影响人们合法权益生活.
,务数私保发布究热,数研是将完整事务发送据中,设数
中心集者.集者行扰,足差的数相关
信息,该方统称心化隐私.尽管收集称不泄露取用的敏,但在业或
利益驱使,户隐很难得到,因此假设据中或数据收者是信的这一不切.
本地分隐(Local Differential Privacy, LDP)术是种本化的据收集方,中心化差隐私
的是,其针对的不可的第三方据收.端基 LDP 在本地独对数进行机响,然后将扰
的数发送据收,据收者得数据不完用户,但又了一据统信息,
有较的数效用.,LDP 避免了大模计算以与数中心繁交互的讯代,常适于资源受
的客,:移动备、线传器等.前已工业得到广应,包括软、GoogleApple 公司
LDP 到应.
[1]
基于 LDP 据隐私保已有究中,要集于类型数、数数值、离数据.务数由于其应
非常广,直以是研难点重点.于事据高、稀及长不等,导致务数
的研往往规数要复.前有多基 LDP 作对数据内容()以及度进了有
效的,些工首先事务据作长处,后对务数进行集抽.文献[2] PrivSet 法就
其中典型,法设一种用性,后基种高的随方法到扰的事数据,
. PrivSet ,(Condensed Local Differential
Privacy, CLDP)提出新的事务收集方法 TDC_LDP.首先一种的候项集分值,然后
指数制从选项集中机抽一个,由于文提出的值函 PrivSet 效用函数相比留了
的信,此整效果 PrivSet 要好.
本文主要献如下:
(1) ,,
为多子空,中相分值的候项集于同一个空间;
(2) ,信的,
支持计数频繁项集掘的用性;
(3) 考虑隐私数的设置,直观的设隐私, MPC 击模,提出种启式隐参数
置策.
本文他内组织如下. 1 介绍关工; 2 介绍文相的预备知; 3 TDC_LDP
详细; 4 章进行理分析及介绍隐参数置策; 5 章进实验分析实验; 6 章是本文
总结.
of 24
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜