暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
融入案件辅助句的低频和易混淆罪名预测-郭军军,刘真丞,余正涛,黄于欣,相艳.pdf
327
12页
0次
2022-05-26
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2021,32(10):31393150 [doi: 10.13328/j.cnki.jos.006028] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
融入案件辅助句的低频和易混淆罪名预测
郭军军
1,2
,
刘真丞
1,2
,
余正涛
1,2
,
黄于欣
1,2
,
1,2
1
(昆明理工大学 信息工程与自动化学院,云南 昆明 650500)
2
(云南省人工智能实验室(昆明理工大学),云南 昆明 650500)
通讯作者: 余正涛, E-mail: ztyu@hotmail.com
: 由于低频罪名数据量较少和易混淆罪名案情描述相似等原因,导致低频和易混淆罪名预测效果不佳.
了解决此类问题,通过构建案件辅助,提出一种基于双向互注意力机制的案件辅助句融合方,实现罪名预测.
要包括以下 3 部分:首先,基于司法领域知识构建案件辅助句,将案件辅助句作为案情描述和罪名之间的映射知识;
然后,基于词级和字符级表征分别提取案情描述与案件辅助句多粒度特征;同时,借助案件辅助句与案情描述双向注
意机制,获得具有辅助句倾向性的案情描述表征,并最终实现低频和易混淆罪名的预测.基于中国刑事案件公共数
集的实验结果表明:所提方法在 F1 值最大提升 13.2%,准确率最大提升 4.5%,低频罪名预测 F1 值提升 4.3%,易混淆
罪名预测 F1 值提升 8.2%,所提算法显著地提升了低频和易混淆罪名的预测性能.
关键词: 低频罪名;易混淆罪名;双向互注意力;多粒度编码;案件辅助句
中图法分类号: TP18
中文引用格式: 郭军军,刘真丞,余正涛,黄于欣,相艳.融入案件辅助句的低频和易混淆罪名预测.软件学报,2021,32(10):
31393150. http ://www.jos.org.cn/1000-9825/6028.htm
英文引用格式: Guo JJ, Liu ZC, Yu ZT, Huang YX, Xiang Y. Few shot and confusing charges prediction with the auxiliary
sentences of case. Ruan Jian Xue Bao/Journal of Software, 2021,32(10):31393150 (in Chinese). http://www.jos.org.cn/1000 -
9825/6028.htm
Few Shot and Co nfusing Charges Prediction wi th the Auxiliary Sente nces o f Ca se
GUO Jun-Jun
1,2
, LIU Zhen-Cheng
1,2
, YU Zheng-Tao
1,2
, HUANG Yu-Xin
1,2
, XIANG Yan
1,2
1
(Faculty of Information Engineering and Auto mation, Kun ming University of S cience and Technology, Kunming 650500, Chin a)
2
(Yunnan Key Laboratory of Artifi cial Intellig ence (Kunming Univ ersity of S cience and Techn ology), Kunming 6 50500, Chin a)
Abstra ct : Due to the insufficiency of few shot charges and the similarity of case descriptions for the confusing charges, the prediction
performance of the existing methods for few shot charges and confusing charges is not promising. To address the forementioned
drawbacks, a novel few shot and confusing charges prediction method is proposed, which is based on bi-direction mutual attention
mechanism with the auxiliary sentences of case. For the proposed model, firstly, the auxiliary sentence of case via the judicial field is
constructed, where the auxiliary sentence of case is considered as external knowledge for mapping the description of the case to the
corresponding charge. Secondly, the multi-granularity characteristics of case d escription and the auxiliary sentence of case are extract ed at
the level of both word and character, respectively. At the same time, the auxiliary sentence of case and case description are used to build
基金项目: 国家重点研发计划(2018YFC0830105, 2018YFC0830101, 2018YFC0830100); 国家自然科学基金(61972186,
61762056, 61472168, 61866020); 云南省科技厅省级人培项目(KKSY201703015); 云南省基础研究专项面上项目(2019FB082,
202001AT070047)
Foundation item: National Key Research and Development Program of China (2018YFC0830105, 2018YFC0830101,
2018YFC0830100); National Natural Science Foundation of China (61972186, 61762056, 61472168, 61866020); Provincial Personnel
Training Project of Yunnan Science and Technology Department (KKSY201703015); Natural Science Foundation Project of Yunnan
Science and Technology Department (2019FB082, 202001AT070047)
收稿时间: 2019-12-06; 修改时间: 2020-02-09; 采用时间: 2020-03-02
3140
Journal of Software 软件学报 Vol.32, No.10, October 2021
bi-direction mutual attention. Finally, the tendency representation of the case description with the guidance of the auxiliary sentence of
case are derived, which improve the prediction accuracy of few shot and confusing charges. The experimental results conducted on the
benchmark data of criminal cases show that the proposed model increases the F1 value and prediction accuracy by 13.2% and 4.5%,
respectively, and increases the F1 values for the few shot charges and confusing charges by 4.3% and 8.2%, respectively, which
significantly enhance the prediction p erformance for f ew shot and confusing charges.
Key words: few shot charge; confusing charge; bi-direction mutual attention; multi-granular coding; auxiliary sentence of case
罪名预测任务是法律判决任务中一个重要的子任务,在法律领域中发挥着至关重要的作用.目前常见罪名
预测准确率比较高,但低频和易混淆罪名的预测准确率却不尽如人意,主要是因为低频罪名数据少和易混淆罪
名案情描述相似等原因所.据统计,截止目前,我国刑法罪名共有 469 ,罪名的分布呈典型的长尾分布(幂律
分布的一种形式).在我国几千万的裁判文书数据中,我们统计了大量真实案例数据后发现:案例数据极度不均
,部分案例的案情描述不易区分.
早期阶段,有研究者基于传统的统计学习方法来解决罪名预测任务.也有研究者试图利用字符、单词和短
语等浅层文本特征预测罪名.近年来,罪名预测任务通常被形式化为文本分类任务,研究人员大多基于神经网络
模型解决罪名预测任务,也有部分研究人员提出融入外部知识共同建模的方法.基于传统文本分类的方法难以
从低频和易混淆罪名案例中学习到案件的关键特征,因此,低频和易混淆罪名预测仍然是罪名预测任务的难点.
提升低频和易混淆罪名的预测准确率,是法律判决任务有待解决的难题之一.
(1) 低频罪名预测
我们统计裁判文书案例数据时发现:比较常见的罪名(如盗窃罪、抢劫罪等)占了大约 78%;比较低频的几十
类罪名(如倒卖文物罪、高利转贷罪等)只占了不到 0.5%,此类低频罪名中大部分案例数据只有十多条,导致低
频罪名可训练的案例数据特别.因此,基于神经网络模型很难学习到足够的案件关键特征.故而在数据量有限
的条件下,低频罪名的准确预测是一个严峻的挑战.
(2) 易混淆罪名预测
在我国刑事案件数据中,有很大一部分罪名及其案情描述不易区分,比如(抢劫罪,抢夺罪)(盗伐林木罪,
伐林木罪).此类罪名
数据很难提取案例中有效区分因素,容易误导模型学习到彼此的噪声特征,干预模型的
判断能力.因此,提高易混淆罪名预测的准确性,也是有待解决的一个难题.
对于低频和易混淆罪名预测准确率低这一问题,本文提出一种融入案件辅助句构建双向互注意力的方法,
旨在提高低频和易混淆罪名的预测性能.不同于以往传统文本分类的方法,我们主要基于案件辅助句指导案情
描述计算多粒度关键信息倾向性表征.拟基于案件辅助句与案情描述构建双向互注意力,捕捉具有案件辅助句
感知的案情描述特征,最终提升低频和易混淆罪名的预测准确率.
案件辅助句作为案情描述与罪名之间的内在映射,不仅可以为低频罪名扩充关键信息,还可以为易混淆罪
名提供有效区分因素.具体来说,我们分析了大量的中国刑事案件数据后,定义了几类案件辅助句.以抢劫罪和
抢夺罪为例.首先,由这两类罪名的案件性质可知,这两类罪名均有故意犯罪行为以非法占有为目的”,以此
可区别于其他部分案件(如过失致人死亡罪等);其次,通过案情描述对比分析,如图 1 所示,可知抢劫罪的案情
描述中包含了强行推倒”“刺伤威胁
暴力手段;与之相反,“抢夺罪的案情描述更倾向于趁其不备”,
使用暴力手段.
因此,我们可定义抢劫罪和抢夺罪的有效区分因素为该案件是否以暴力为手段”. 以此方法类推,我们分别
定义其他几类案件的辅助句子.
为了验证本文所提方法对低频和易混淆罪名预测性能的提升,我们分别在 3 个不同规模的中国刑事案件
公共数据集中进行实验.实验结果表明:与其他基线模型相比,本文模型在 3 个数据集上均取得了最显著的效果,
评估指标均优于基线模型.与引入罪名区分属性解决低频和易混淆罪名预测模型(当前低频和易混淆罪名预测
性能最佳模型)相比,本文模型在 3 个数据集上宏观 F1 值最大提升 13.2%,准确率最大提升 4. 5%. 值得一提的是:
本文模型在低频罪名预测宏观 F1 值提升 4.3%,易混淆罪名预测宏观 F1 值提升 8.2%.
of 12
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜