暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
面向多读_写头磁畴壁存储器的优化研究-许瑞,谷守珍,沙行勉,诸葛晴凤,石亮,高思远.pdf
307
18页
1次
2022-05-24
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2020,31(9):27232740 [doi: 10.13328/j.cnki.jos.005941] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
面向多读/写头磁畴壁存储器的优化研究
2
,
谷守珍
1
,
沙行勉
2
,
诸葛晴凤
2
,
2
,
高思远
2
1
(上海市高可信计算重点实验室(华东师范大学),上海 200062)
2
(华东师范大学 计算机科学与技术学院,上海 200062)
通讯作者: 谷守珍, E-mail: szgu@sei.ecnu.edu.cn
: 当前,大数据及人工智能技术向嵌入式系统发展,对嵌入式系统的存储访问能力提出了更高的要求.磁畴
壁存储器凭借其高读写速度、高密度以及低功耗等优点,可以用于嵌入式系统,以满足数据密集型应用对访问速度、
容量及能耗的需求.但是磁畴壁存储器在进行数据访问之前需要进行移动操作,这将极大影响其存储访问性能.而减
少移动操作可以有效提升磁畴壁存储器的性能.面向运行数据密集型应用的多读/写头磁畴壁存储器系统,研究减少
移动操作的最优指令调度与数据放置技术.首先提出了可获得最小移动次数的整数线性规(integer linear
programming,简称 ILP)模型.由于 ILP 模型不能在多项式时间内求得最优解,所以提出了多项式时间的启发式算法
——生成指令调度和数据放置(generation instruction scheduling and data placement,简称 GISDP)算法.实验结果表
,ILP 模型和 GISDP 算法可以有效减少移动操作的次数.在配备 8 个读/写头的磁畴壁存储器上,GISDP 算法生成的
指令调度与数据放置方案相较其他算法可以平均减少 89.7%的移动操作,并且 GISDP 算法的结果接近 ILP 模型的
最优解.
关键词: 磁畴壁存储器;数据密集型应用;指令调度;数据放置;移动操作
中图法分类号: TP333
中文引用格式: 许瑞,谷守珍,沙行勉,诸葛晴凤,石亮,高思远.向多读/写头磁畴壁存储器的优化研究.软件学,2020,31(9):
27232740. http ://www.jos.org.cn/1000-9825/5941.htm
英文引用格式: Xu R, Gu SZ, Sha EHM, Zhuge QF, Shi L, Gao SY. Optimization of multi-port domain wall memory. Ruan Jian
Xue Bao/Journal of Software, 2020,31(9):27232740 (in Chinese). http://www.jos.org.cn/1000-9825/5941.htm
Optimization of Multi-port Domain Wall Memory
XU Rui
2
, GU Shou-Zhen
1
, Edwin H-M Sha
2
, ZHUGE Qing-Feng
2
, SHI Liang
2
, GAO Si-Yuan
2
1
(Shanghai Key Laboratory of Trustworthy Computing (East China Normal University), Shanghai 200062, China)
2
(School of Computer Science and Technology, East China Normal University, Shanghai 200062, China)
Abstra ct : Nowadays, it has become a trend that embedded systems are designed for big data and artificial intelligence applications,
which demand the larg e capacity and high access performance of memory. Domain wall memory (DWM) is a novel non-volatil e memory
with high access performance, high density, and low power consumption. Thus, for data-intensive applications specific embedded systems,
DWM can meet the requirements of access speed, capacity, and power consumption. However, before accessing data on DWM, data in
nanowires need to be shifted to align them with read/write port, which is called shift operation. Numerous shift operations take most of
time and generate much quantity of heat when accessing data on DWM. It will decrease the access speed of DWM and system
基金项目: 国家自然科学基金(61702187, 61602180, 61 972154, 61772092); 上海市扬帆计划(17YF1404400)
Foundation item: National Natural Science Foundation of China (61702187, 61602180, 61972154, 61772092); Shanghai Sailing
Program (17YF1404400)
本文由智能嵌入式系统专题特约编辑王泉教授、吴中海教授、陈仪香教授、苗启广教授推荐.
收稿时间: 2019-07-01; 修改时间: 2019-08-18; 采用时间: 2019-11-02; jos 在线出版时间: 2020-01-13
CNKI 网络优先出版: 2020-01-14 11 :27:01, http: //kns.cnki.net/kcms/d etail/11.2560.TP.20200114.1126.023 .html
2724
Journal of Software 软件学报 Vol.31, No.9, September 2020
performance further. In th at case, reducing shift op erations of DWM can significantly i mprove the system perfor mance. This study aims at
data-intensive application specific embedded systems with multi-port DWM, and explores optimal instruction schedule and data
placement strategy which achieve minimum shift operations. An integer linear programming (ILP) model is firstly proposed to obtain
minimum number of shifts. Since ILP model cannot find the optimal solution in polynomial time, a heuristic algorithm is proposed to
reduce the number of shif ts on DWMgeneration instru ction scheduling and data placement (GISDP) algorithm. The experimental results
show that ILP mod el and GISDP algorithm can effectively reduce shift op eration. On target system with 8 read/write ports DWM, GISDP
can reduce shift operations by 89.7% on average when compared with other algorithms , and t he results of GIS DP are close to the optimal
solutions of ILP.
Key words: domain wall memor y; d ata-intensiv e applic ations; instru ction scheduling ; dat a placement; shift operat ion
在大数据以及人工智能技术飞速发展的今天,大数据分析技术可以对世间万物所产生的数据进行分析,
工智能中学习算法可以对数据进行学习、分析、总结.目前,由众多嵌入式设备构建的物联网系统中,互联设备
之间收集与共享的数据已经广泛使用大数据分析及人工智能技术
[1]
.其中,大数据泛指数据规模达到 TB,甚至
PB 级别,应用均是数据密集型应用,具有高度密集的海量数据读写的特点
[2]
.随着大数据及人工智能应用逐渐向
边缘化设备发展,嵌入式设备的数据存储访问性能对系统性能的影响变得尤为重要.高速缓存和便笺式存储器
经常应用于嵌入式系统中,而提升系统的数据访问性能
[3]
.相较于由硬件管理的高速缓存,便笺式存储器具有
更高的能量利用率和存储面积
[4]
.它采用软件管理,因此,便笺式存储器上的数据访问行为具有可预测性
[5,6]
.
面向应用的实时嵌入式系统中,采用便笺式存储器在能耗与性能方面更具优势
[7]
.
非易失性存储器(non-volatile memory,简称 NVM)凭借其访问速度快、低功耗、高密度以及字节寻址等优
,被广泛应用在便笺式存储器中
[8]
,已经成为嵌入式系统中备受欢迎的存储技术候选对象
[9,10]
.其中,磁畴壁
储器(domain wall memory,简称 DWM)是一种高密度、低功耗的新型非易失性存储器
[11]
.它采用赛道存储技术,
使用磁畴中的磁矩表示数据,利用自旋动量传递的效应,磁性纳米线中读写数据位
[12]
.磁畴壁存储器的密度比
自旋力矩 MRAM 4 ,最佳访问性能可与 SRAM 相媲美, DRAM 相比,减少了 92%的泄漏功率
[13,14]
.磁畴壁
存储器已经展示了可以替换目前存储器的潜能,例如:文献[15]研究了将磁畴壁存储器作为通用计算平台的片
上存储器;在文献[16,17 ],将磁畴壁存储器用作图形图像处理平台的片上存储器使用;文献[18]研究在 AES
台用磁畴壁存储器替换 SRAM 来提高加密方法的性能.除此之外,还有一种是斯格明子介质的赛道存储器,使用
斯格明子表示数据.
虽然磁畴壁存储器具有高密度、低功耗、高读写速度的优势,但是由于赛道存储技术的特点,每次访问数
据需要先移动纳米线中的数据,使得要访问的数据与读/写头对齐,然后才能进行数据访问.其中:读写操作均是
需要 6.3ns,移动操作需要 5.87ns
[5,6]
.但是,移动操作需要较高的驱动电流,因此,频繁的移动操作会极大地影响磁
畴壁存储器的性能与能耗,甚至导致存储单元的损坏
[19]
.特别是对于数据密集型应用,海量的数据访问需求会造
成大量的移动操作.由于移动操作的次数可以由数据的放置位置以及访问数据的顺序决定,所以进行合理的数
据放置以及指令调度,能够极大地提高磁畴壁存储器的存储访问性能,进而提升系统性能.
本文针对数据密集型应用,面向配备多个读/写头的磁畴壁存储器的单核处理器系统研究最优指令调度与
数据放置方案来获得最少的移动操作次数,以提升磁畴壁存储器的存储访问性能,进而提升系统性能.已经有研
究工作表明,磁畴壁存储器上进行数据分配是 NP 完全问题
[20]
,所以本文提出了能够获得最优指令调度与数
据放置方案的整数线性规划(integer linear programming,简称 ILP)模型和能够获得近似最优方案的多项式时间
的启发式算法.本文的主要贡献包括:
提出了可以在配备多个/写头的磁畴壁存储器上生成最优的指令调度和数据放置方案的 ILP 模型,
可以求得最小的移动次数;
提出了可以在配备多个读/头的磁畴壁存储器上,在多项式时间内生成近似最优的指令调度和数据
放置(generation instruction scheduling and data placement,简称 GISDP) 方案的启发式算法,以此来减小
移动次数;
对配备不同数量读/写头的磁畴壁存储器的存储访问性能进行了设计探索与实验.
of 18
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜