
计 算 机 研 究 与 发 展
DOI
:
10.7544∕issn1000G1239.2021.20200501
JournalofCom
p
uterResearchandDevelo
p
ment 58
(
3
):
497 512
,
2021
收稿日期
:
2020
-
06
-
19
;
修回日期
:
2020
-
12
-
09
基金项目
:
国家重点研发计划项目
(
2018YFB1003400
)
Thisworkwassu
pp
ortedb
y
theNationalKe
y
ResearchandDevelo
p
mentPro
g
ramofChina
(
2018YFB1003400
)
.
通信作者
:
汤小春
(
tan
g
xc@nw
p
u.edu.cn
)
集中式集群资源调度框架的可扩展性优化
毛 安 琪
汤 小 春
丁
朝
李 战 怀
(
西北工业大学计算机学院
西安
710129
)
(
工信部大数据存储与管理重点实验室
(
西北工业大学
)
西安
710129
)
(
maoan
q
i@mail.nw
p
u.edu.cn
)
Scalabilit
y
forMonolithicSchedulersofClusterResourceMana
g
ementFramework
MaoAn
q
i
,
Tan
g
Xiaochun
,
Din
g
Zhao
,
andLiZhanhuai
(
Schoolo
f
Com
p
uterScience
,
NorthwesternPol
y
technicalUniversit
y
,
Xian
710129
)
(
Ke
y
Laborator
y
o
f
Bi
g
DataStora
g
eand Mana
g
ement
(
Northwestern Pol
y
technicalUniversit
y
),
Ministr
y
o
f
Industr
y
andIn
f
ormationTechnolo
gy
,
Xian
710129
)
Abstract Thesi
g
nificantadvanta
g
esofmonolithicclusterresourcemana
g
ements
y
steminensurin
g
theconsistenc
y
of
g
lobalresourcestatusanda
pp
l
y
in
g
multi
p
leschedulin
g
modelsmakeitwidel
y
used
inactuals
y
stems.Howerver
,
the
p
erformanceofthemonolithicresourcemana
g
erinalar
g
ecluster
mana
g
ementenvironmentdoesnotmeetex
p
ectations
,
becauseitusesasin
g
lenodeto maintainthe
g
lobalresourcestate.Whentheresource mana
g
erisreceivin
g
and
p
rocessin
g
lar
g
eGscale
p
eriodic
heartbeatinformation
,
theload
p
ressureontheresourcemana
g
erwillincreaseshar
p
l
y
,
whichleadsto
ascalabilit
y
bottleneck.Inordertosolvethese
p
roblems
,
this
p
a
p
er
p
ro
p
osestheideaof
“
nochan
g
e
,
nou
p
date
”
tore
p
lacethe
p
eriodicu
p
datemechanismoftheresourcemana
g
er.Inour
p
a
p
er
,
webriefl
y
summarizethree main to
p
ics.Firstl
y
,
weintroduce a differentialGbased heartbeatinformation
p
rocessin
g
modelinthecom
p
utin
g
node.Whentheresourcestatusofthecom
p
utin
g
nodehasnot
chan
g
ed
,
itwillnotsendthemessa
g
etotheresourcemana
g
er
,
thereb
y
reducin
g
thesizeandnumber
ofmessa
g
es.Secondl
y
,
we
p
ro
p
osearin
g
network monitorin
g
modelbetweencom
p
utin
g
nodes.B
y
ado
p
tin
g
this mode
,
the
p
eriodic monitorin
gp
ressurecanbetransferredtothecom
p
utin
g
nodes.
Finall
y
,
weim
p
lementthesetwomodelsonYARN.Afterex
p
erimentalverification
,
wecanconclude
thatwhentheclusterreaches10000nodesandtheheartbeatintervalis3s
,
theYARNbasedonour
modelsincreasestheheartbeatinformation
p
rocessin
g
efficienc
y
andresourceu
p
dateefficienc
y
b
y
about40%.Inaddition
,
thescaleoftheclustermana
g
edb
y
im
p
rovedYARNismorethan1.88times
thatoftheori
g
inalYARN.
Ke
y
words monolithicschedulers
;
scalabilit
y
;
heartbeatmessa
g
e
;
differential
;
rin
g
monitorin
g
摘
要
集中式集群资源管理系统既能够确保全局资源状态的一致性亦拥有多种调度模型
,
因此被广泛
应用于实际系统中
.
但是
,
当集中式资源管理器 在接收 并处理 大规模 的周期 性心跳 信息时
,
由于 其 采用
单一节点来维护全局资源状态
,
所以资源管理器的负载压力急剧增加
,
导致 调 度能 力 降低
,
影响 了 集群
系统的可扩展性
.
针对上述问题
,
提出一种
“
没有 变 化就 不 更新
”
的思 想
,
取代 集 中资 源 管理的 定时更 新
评论