
计 算 机 研 究 与 发 展
DOI
:
10.7544∕issn1000G1239.2021.20210069
JournalofCom
p
uterResearchandDevelo
p
ment 58
(
6
):
1192 1203
,
2021
收稿日期
:
2021
-
01
-
20
;
修回日期
:
2021
-
04
-
23
基金项目
:“
核高基
”
国家科技重大专项基金项目
(
2018ZX01028G102
)
Thisworkwassu
pp
ortedb
y
theNationalScienceandTechnolo
gy
Ma
j
orPro
j
ectsofHe
g
ao
j
i
(
2018ZX01028G102
)
.
通信作者
:
李宏亮
(
hon
g
lian
g
li@263.net
)
一种高性能超长点数浮点
FFT
加速器设计
王
谛
石
嵩
吴 铁 彬
刘
亮
谭 弘 兵
郝 子 宇
过
锋
李 宏 亮
(
江南计算技术研究所
江苏无锡
214083
)
(
wan
g
di
_
csarch@126.com
)
A Hi
g
hPerformanceAcceleratorDesi
g
nforUltraGLon
g
PointFloatin
g
GPointFFT
Wan
g
Di
,
ShiSon
g
,
WuTiebin
,
LiuLian
g
,
TanHon
g
bin
g
,
HaoZi
y
u
,
GuoFen
g
,
andLiHon
g
lian
g
(
Jian
g
nanInstituteo
f
Com
p
utin
g
Technolo
gy
,
Wuxi
,
Jian
g
su
214083
)
Abstract FastFouriertransform
(
FFT
)
p
la
y
sake
y
rolein di
g
italsi
g
nal
p
rocessin
g
.Withthe
increasin
g
demand ofhi
g
h
p
erformance ultraGlon
g p
ointFFT
,
di
g
italsi
g
nal
p
rocessor
(
DSP
)
is
becomin
g
moreandmoredifficulttomeetthedemand
,
sointe
g
ratedFFTacceleratorshavebecomean
im
p
ortantdevelo
p
menttrend.Inordertosu
pp
ortultraGlon
gp
ointFFT
,
this
p
a
p
erextendsthetwoG
dimensional decom
p
osition al
g
orithm of FFT to multiGdimensional
,
and we
p
ro
p
ose a hi
g
h
p
erformanceultraGlon
gp
ointFFTacceleratorarchitecturewhichcanbeinte
g
ratedintoDSP.Inthis
architecture
,
threeGdimensionaltrans
p
ositiono
p
erationisrealizedb
y
usin
g
collisionGfreeaddressin
g
methodwith
p
rimenumbermemor
y
banks
;
efficienttwiddlefactor
g
enerationisrealizedb
y
recursive
al
g
orithm
;
FFTo
p
erationcircuitisrefinedb
y
usin
g
sin
g
le
p
recisionfloatin
g
G
p
ointfuseddot
p
roduct
andfusedaddGsubtracto
p
eration.Finall
y
,
this
p
a
p
errealizesthesin
g
le
p
recisionfloatin
g
G
p
ointFFT
calculationwithin4G
p
oints.Thes
y
nthesisresultshowsthatthe
p
ro
p
osedFFTacceleratorcanrunat
afre
q
uenc
y
ofmorethan1GHzandits
p
erformancecanreach640Gflo
p
∕s
,
whichhasbeen
g
reatl
y
im
p
rovedintermsof
p
ointsand
p
erformancecom
p
aredwiththeexistin
g
research.
Ke
y
words fast Fouriertransform
(
FFT
);
multiGdimensionaldecom
p
osition al
g
orithm
;
threeG
dimensionaltrans
p
ositiono
p
eration
;
twiddlefactor
g
eneration
;
accelerator
摘
要
快速傅里叶变换
(
fastFouriertransform
,
FFT
)
在数字 信号 处 理中 占 据核 心 地位
.
随着 高 性能
超长点数
FFT
需求的增长
,
数字信号处理器
(
di
g
italsi
g
nal
p
rocessor
,
DSP
)
的计算 能力越 来越难 以满
足需求
,
集成
FFT
加速器成为重要的发展趋势
.
为了支持 超长点 数
FFT
,
将
2
维分解 算法推 广到多 维
,
提出一种可集成于
DSP
的高性能超长 点数
FFT
加速器 结构
.
该结 构 通过 基 于素 数 个存 储 体的 无 冲突
体编址方法实现了
3
维转置运算
;
通过递推算法实现了高效铰链因子生成
;
使用单精度浮点二项融合点
积运算和融合加 减运算
,
对
FFT
运算电路进行了精细化设计
.
实现了对
4G
点数单精度浮点
FFT
计算
的支持
.
综合结果表明
:
FFT
加速器运行频率能够达到
1GHz
以上
,
性能达到
640Gflo
p
∕s.
在支持的点数
和性能方面都较已有研究成果取得大幅提升
.
关键词
快速傅里叶变换
;
多维分解算法
;
3
维转置运算
;
铰链因子生成
;
加速器
中图法 分类号
TP332
评论