
摘
要
社交网络是一个有效的信息传播平台
,
使得人们的生活更加便捷
.
同时
,
在线社交网络也不断提
高了社交网络账号的价值
.
然而
,
为了获取非法 利益
,
犯罪团 伙会利 用社交 网络平 台隐秘 地开展 各种诈
骗
、
赌博等犯罪活动
.
为了保护用户的社交安全
,
各种基于用户行为
、
关系传播的恶意账号检测方法被提
出
.
此类方法需要积累足够的用户数据才能 进行恶 意检测
,
利用这 个时间 差
,
犯罪团 伙可以 开展大 量的
犯罪活动
.
首先系统分析了现有恶意 账号检 测工作
.
为克服 现有方 法的 缺 点而 更 快地 检 测恶 意 账号
,
设
计了一种基于账号注册属性的恶意账号检测 方法
.
方法首 先通过 分析恶 意账号 和正常 账号在 不同属 性
值上的分布
,
设计并提取了账号的相似性特征和异常特征
;
然后基于此计算两两账号的相似度构图以聚
类挖掘恶意注册团体
,
从而有效实现注册阶段的恶意账号检测
.
关键词
在线社交网络
;
聚类
;
恶意账号检测
;
账号注册属性
;
统计分析
中图法 分类号
TP393
随着移动互联网 的 发展
,
移动 社 交网 络 迅速 地
成为了主流的社交 平 台
,
在人 们 的生 活 和工 作 中占
据了重要的地位
.
除了传统的对话交流
,
移动社交网
络平台还为用户提 供 了更 加 多样 化 的服 务
,
例如 阅
读
、
购物等
.
众多的用户共同编织了一张复杂的社交
网络
,
他们的一举一动都在影响着这个网络的发 展
.
与此同时
,
一些不法分子也在社交网络上活跃着
,
他
们使用批量注册的 账 号
,
在社 交 平台 上 进行 各 种恶
意活动
,
例如赌博
、
刷阅读量
、
引导用户流等
,
以此牟
取不法利益
.
为了防止 恶意账 号危害 社交网 络生态 环境
,
许
多恶意账号检 测 模 型 被 提 出
.
例 如 基 于 用 户 发 送 的
内容
(
如文字
、
图片
、
链接 等
)、
用户 行 为
(
如点 赞
、
上
传
、
关注等
),
来训 练 检测 模 型
[
1G6
]
;
或者 根 据 用 户 间
的社交关系
(
如好 友
、
关注
、
订阅 等
)
构建 图 模型
,
来
挖掘 恶 意 团体
[
7G10
]
.
然 而
,
无 论 是 用户 发送 的内 容
、
用户的行为
,
还是用户间的社交关系
,
都需要一定的
时间来收集和积累
.
在这段期间里
,
恶意账号已经可
以开展大量的恶意活动
,
对正常用户造成影响
.
另一
方面
,
当今黑色产业 链已 大 规模 地 采用 自 动化 账 户
注册技术来批量获 取 社交 网 络账 号
,
以确 保 其恶 意
活动可持续
、
影响范围广且获得的不法利益高
.
本文
首先具体介绍了现有恶意账号检测工作并分析了它
们的优缺点
.
为克服它们的局限性
,
更加快速而有效
地应对此类黑产威胁
,
减少恶意账号造成的危害
,
并
尽早检测出此类由 黑 产链 批 量注 册 的恶 意 账号
,
本
文提出了基于社交网络账号注册属性的恶意账号检
测方法
.
本文工 作 旨 在 仅 基 于 账 号 注 册 属 性 实 现 对
恶意账号的有效检 测
,
在注 册 阶段 即 遏止 恶 意账 号
的进一步活动
.
微信是现今中国最大的移动互联网社交网络平
台
,
每天的账号注册量可达百万级别
.
在与微信平台
所有方
———
腾讯 公 司
———
达 成 深 度 合 作 的 基 础 上
,
本文对其提供的
2017
年部 分 微信 注 册账 号 数据 进
行了深入统计分析
,
发现 在 某些 时 段上 恶 意账 号 占
全部新注册账号的比例可高 达
50%
,
但由于 涉及商
业隐私
,
我们无 法 给 出 具 体 的 数 值
.
此 外
,
还 发 现 恶
意账号会使用某些 相 同的 注 册属 性
,
如某 个 恶意 团
体注册的账号具有相同的
IP
前缀和手机号码 前缀
.
这是由于恶意团体注册账号时受时间
、
人力
、
设备等
资源所限
,
使用 机 器 批 量 注 册 造 成 的
.
此 外
,
恶 意 账
号的某些注册属性 会 存在 异 常
,
如注 册 国家 与 用户
填写的国家不一致
、
注册
IP
所在省份与手机号所在
省份不一致等
.
这 可 能 是 因 为 这 些 属 性 是 黑 色 产 业
链的批量注册工具 随 机生 成 的
,
未考 虑 正常 账 号属
性间的内在联 系
.
针 对 恶 意 账 号 具 有 的 相 似 性 特 征
和异常特征
,
本文使 用了 带 权重 的 无向 非 连通 图 的
账号聚类算法
,
用图中的点代表账号
,
边代表账号间
的相似关系
,
图中的 连通 分 量便 能 体现 账 号间 的 群
组关系
,
从而能够快速 地 将大 量 注册 账 号聚 集 成若
干个群组
.
注意 到 每 一 个 连 通 分 量 都 是 一 张 有 权 重
的无向连通子图
,
本文 提 出了 基 于带 权 重的 无 向连
通图的恶意检测算 法
,
为每 个 账号 计 算出 恶 意分 数
来衡量其恶意 程 度
.
恶 意 分 数 高 的 账 号 将 最 终 被 判
定为恶意账号
.
本文的贡献主要有
3
个方面
:
1
)
系统分析 了 近 年 来 社 交 网 络 恶 意 账 号 检 测
的研究工作
,
包括基 于账 号 属性 特 征的 检 测模 型 与
基于账号间关系的检测模型
;
2
)
对微信账 号 的 注 册 数 据 进 行 大 规 模 地 统 计
分析
,
系统总结了恶 意账 号 具有 相 似与 异 常的 注 册
属性模式
;
3
)
设计了一 种 基 于 注 册 属 性 的 无 监 督 恶 意 账
号检测方法
,
可在账 号注 册 阶段 实 现对 大 规模 恶 意
0232
计算机研究与发展
2021
,
58
(
11
)
评论