
面向铁路敏感数据的识别方法综述
陈泓铭
1
,张苔丝
1
,马 锐
1
,吴艳华
2,3
,李清欣
2,3
(1.北京理工大学 计算机学院,北京 100081;
2.国家铁路智能运输系统工程技术研究中心,北京 100081;
3.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
摘 要:铁路信息化产生的海量数据给数据安全带来挑战,敏感数据识别方法研究尤为迫切。文章
系统分析国内外现有的敏感数据识别方法研究现状和发展趋势,总结多维度的敏感数据识别方法及其分
类,梳理并深入比较、分析基于规则匹配和机器学习的敏感数据识别方法。基于规则匹配的敏感数据识
别方法具有快速设置、资源需求低的优点,适合识别特定模式的敏感数据;基于机器学习的敏感数据识
别方法则具有高适应性、高效率和准确率,能够更好地适应非结构化数据,提高识别的精度和效率。不
同的识别方法需要根据不同的应用场景、数据性质及可用资源等因素进行综合考量和选择。该研究可为
铁路领域数据安全提供理论支撑。
关键词:数据安全;铁路敏感数据;敏感数据识别方法;机器学习;规则匹配
中图分类号:U29:TP39 文献标识码:A
DOI:10.3969/j.issn.1005-8451.2024.10.03
Identification method for railway sensitive data
CHENHongming
1
,ZHANGTaisi
1
,MARui
1
,WUYanhua
2,3
,LIQingxin
2,3
(1.SchoolofComputerScienceandTechnology,BeijingInsitituteofTechnology,Beijing 100081,China;
2.CenterofNationalRailwayIntelligentTransportationSystemEngineeringandTechnology,Beijing 100081,China;
3.InstituteofComputingTechnologies,ChinaAcademyofRailwaySciencesCorporationLimited,
Beijing 100081,China)
Abstract: Themassivedatageneratedbyrailwayinformatizationposeschallengestodatasecurity,andresearchon
sensitive data identification methods is particularly urgent. This paper systematically analyzed the current research
statusanddevelopmenttrendsofsensitivedatarecognitionmethodsathomeandabroad,summarizedmultidimensional
sensitivedatarecognitionmethodsandtheirclassifications,sortedoutanddeeplycomparedandanalyzedsensitivedata
recognitionmethodsbasedonrulematchingandmachinelearning.Therulematching-basedsensitivedatarecognition
methodhastheadvantagesoffastsetupandlowresourcerequirements,issuitableforidentifyingspecificpatternsof
sensitive data. The machine learning-based sensitive data recognition method has high adaptability, efficiency, and
accuracy, which can better adapt to unstructured data and improve recognition accuracy and efficiency. Different
recognitionmethodsneedtobecomprehensivelyconsideredandselectedbasedonfactorssuchasdifferentapplication
scenarios,dataproperties,and available resources. This studycanprovidetheoreticalsupportfordatasecurityin the
railwayfield.
Keywords: datasecurity;railwaysensitivedata;sensitivedataidentification;machinelearning;rulematching
中国铁路正在加快信息化、数字化的进程。铁
路业务和管理等信息化系统产生的海量数据,承载
着乘客信息、列车运行信息、铁路基础设施信息等
铁路系统建设运行的重要信息,是国家基础战略资
源,也是国家铁路智能运输系统工程技术研究中心
的重要资产。铁路系统作为国家基础设施的重要一
环,其安全与稳定关乎国家的社会经济发展和人民
生活质量。作为铁路领域重要的运行资源和发展动
力,铁路数据的安全已成为铁路系统稳健运行的重
要因素。
信息技术的发展对数据安全提出了新的挑战,
包括数据泄露、滥用及篡改等安全隐患。在交换、
使用、加工或共享铁路数据时,存在数据泄露的风
收稿日期:2024-07-15
基金项目:中国铁道科学研究院集团有限公司科研项目(2023YJ356)
作者简介:陈泓铭,在读硕士研究生;张苔丝,在读硕士研究生。
第33卷 第10期
Vol.33 No.10
识别评估
Identification and Evaluation
文章编号:1005-8451(2024)10-0013-10
2024.10总第331期
13
评论