
计 算 机 研 究 与 发 展
DOI
:
10.7544∕issn1000G1239.2021.20201041
JournalofCom
p
uterResearchandDevelo
p
ment 58
(
6
):
1155 1165
,
2021
收稿日期
:
2020
-
12
-
21
;
修回日期
:
2021
-
04
-
26
基金项目
:“
核高基
”
国家科技重大专项基金项目
(
2013ZX01028G001G001
)
Thisworkwassu
pp
ortedb
y
theNationalScienceandTechnolo
gy
Ma
j
orPro
j
ectsofHe
g
ao
j
i
(
2013ZX01028G001G001
)
.
高性能众核处理器申威
26010
胡 向 东
柯 希 明
尹
飞
张
新
马 永 飞
颜 世 云
马
超
(
上海高性能集成电路设计中心
上海
201204
)
(
huxdisme@vi
p
.sina.com
)
ShenweiG26010
:
A Hi
g
hGPerformanceMan
y
GCoreProcessor
HuXian
g
don
g
,
KeXimin
g
,
YinFei
,
ZhaoXin
,
MaYon
g
fei
,
YanShi
y
un
,
andMaChao
(
Shan
g
haiHi
g
hGPer
f
ormanceInte
g
ratedCircuitDesi
g
nCenter
,
Shan
g
hai
201204
)
Abstract BasedonthemultiGcore
p
rocessorShenwei1600
,
thehi
g
hG
p
erformanceman
y
Gcore
p
rocessor
Shenwei26010ado
p
tsSoC
(
s
y
stemonchi
p
)
technolo
gy
,
andinte
g
rates4com
p
utin
g
Gcontrolcoresand
256com
p
utin
g
coresinasin
g
lechi
p
.Itado
p
tsa64GbitRISC
(
reducedinstructionsetcom
p
uter
)
instructionsetdesi
g
ned with an ori
g
inaldesi
g
n
,
andsu
pp
orts256GbitSIMD
(
sin
g
leinstruction
multi
p
ledata
)
inte
g
erandfloatin
g
G
p
ointvectorGaccelerationo
p
erations.Its
p
eak
p
erformancefor
double
p
recision floatin
g
G
p
oint o
p
erations reaches 3.168TFLOPS.Shenwei 26010
p
rocessor is
manufacturedusin
g
28nm
p
rocesstechnolo
gy
.Thedieareaofthechi
p
ismorethan500mm
2
,
andthe
260coresofthechi
p
canrunstabl
y
withafre
q
uenc
y
of1.5GHz.Shenwei26010
p
rocessorado
p
tsa
variet
y
oflow
p
owerGconsum
p
tiondesi
g
nsonthearchitecturelevel
,
themicroarchitecturelevel
,
and
thecircuitlevel
,
andthus
,
leadin
g
toa
p
eakener
gy
Gefficienc
y
Gratioof10.559GFLOPS∕W.Notabl
y
,
boththeo
p
eratin
g
fre
q
uenc
y
andtheener
gy
Gefficienc
y
Gratioofthechi
p
arehi
g
herthanthoseofthe
worldwidecontem
p
orar
yp
rocessor
p
roducts.Throu
g
hthetechnicalinnovationsofhi
g
hfre
q
uenc
y
desi
g
n
,
stablereliabilit
y
desi
g
nand
y
ielddesi
g
n
,
Shenwei26010haseffectivel
y
solvedtheissuesof
hi
g
hfre
q
uenc
y
tar
g
et
,
p
owerconsum
p
tionwall
,
stabilit
y
andreliabilit
y
,
and
y
ield
,
allofwhichare
encounteredwhen
p
ursuin
g
the
g
oalofhi
g
hG
p
erformancecom
p
utin
g
.Ithasbeena
pp
liedsuccessfull
y
toa100PFLOPSsu
p
ercom
p
uters
y
stemnamed
“
Sunwa
y
TaihuLi
g
ht
”
onalar
g
escale
,
andtherefore
,
canade
q
uatel
y
meetthecom
p
utin
g
re
q
uirementsforbothscientificanden
g
ineerin
g
a
pp
lications.
Ke
y
words Shenweiinstructionset
;
com
p
utationGcontrolcore
;
com
p
utin
g
core
;
low
p
owerdesi
g
n
;
ener
gy
Gefficienc
y
Gration
摘
要
申威
26010
高性能众核处理器在多核处理器申威
1600
基础上
,
采用片上系统
(
s
y
stemonchi
p
,
SoC
)
技术
,
在 单 芯 片 内 集 成
4
个 运 算 控 制 核 心 和
256
个 运 算 核 心
,
采 用 自 主 设 计 的
64
位 申 威
RISC
(
reducedinstructionsetcom
p
uter
)
指令系统
,
支持
256
位
SIMD
(
sin
g
leinstructionmulti
p
ledata
)
整数
和浮点向量加速运算
,
单芯片双精度浮点峰值性能达
3.168TFLOPS.
申威
26010
处理器基于
28nm
工
艺流片
,
芯片
die
面积超过
500mm
2
,
芯片
260
个核心稳定运行频率达
1.5GHz.
申威
26010
处理器从结
构级
、
微结构级到电路级
,
综合 采 用多 种 低功 耗 设计 技 术
,
峰值 能 效比 达
10.559GFLOPS∕W.
芯片 运 行
频率和能效比均超过同时期国际同类型处理器
.
申威
26010
通过在高频率设计
、
稳定可靠性设计和成品
率设计等方面的技术创新
,
有效解决了芯片在实现高性能目标中所遇 到的高 频率目 标
、
功耗墙
、
稳定可
靠性和成品率等难题
,
成功大规模应用于国产
10
万万亿次超级计算机系统
“
神威
太湖之光
”,
有效满足
了科学与工程应用的计算需求
.
评论