暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库管理-第350期 初探GPU:显存有何不同(20250724)

原创 胖头鱼的鱼缸 2025-07-23
200

数据库管理350期 2025-07-24

数据库管理-第350期 初探GPU:显存有何不同(20250724)

作者:胖头鱼的鱼缸(尹海文) Oracle ACE Pro: Database PostgreSQL ACE Partner 10年数据库行业经验 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVP,ITPUB认证专家 圈内拥有“总监”称号,非著名社恐(社交恐怖分子) 公众号:胖头鱼的鱼缸 CSDN:胖头鱼的鱼缸(尹海文) 墨天轮:胖头鱼的鱼缸 ITPUB:yhw1809 IFClub:胖头鱼的鱼缸 除授权转载并标明出处外,均为“非法”抄袭

胖头鱼的鱼缸4_01.png
之前写过不少关于数据库使用的硬件的文章,主要集中在CPU、内存、磁盘和网络,但是随着AI时代的来临,似乎还有一块硬件没有怎么去写,那就是算力的核心GPU。

1 CPU vs GPU

CPU拥有较少的核心数量但是每个核心都很强大,相对应的GPU拥有较多的核心但是每个核心相对弱小,以桌面级CPU/GPU为例,目前主流的CPU主频已经来到了5Ghz以上,而GPU则还在3Ghz左右。因为GPU最早的应用场景是渲染图像,整个图像页面的每个像素点的输出是需要同时加载出来的,需要GPU的多个核心同时完成工作,因此GPU在设计之初就更加适合处理并行计算任务;而CPU主要是用于线性计算,每个核心一件一件的处理工作(这里主要说的是CPU和GPU最原始的处理方式)。
CPU与GPU运行方式的不同导致了二者需要的暂存区域需求也是不一样的,其中最主要的就是带宽要求:显存>>内存。

2 DDR vs GDDR

首先明确一个公式:

带宽=传输速率×位宽

这里以高速公路类比,而位宽相当于高速公路的车道数量,传输速率相当于高速公路的时速,但是有一点,电子的速度是一致的,因此提升传输速率的方式其实是缩小高速公路上每辆车之间的间隔。
这里不过多解释时钟周期具体是怎么实现的,仅仅是说一下,在一个时钟周期内时钟振荡一次会出现一次信号的抬高与降低,传统传输方式是在信号抬高过程中发起一次传输,这也被称作SDR(Single Data Rate)。
image.png
在一个时钟周期内还有一次信号降低,在降低过程中再发起一次传输,在一个时钟周期就能完成两次传输动作,这就是DDR(Double Data Rate),也就是目前CPU内存使用的传输模式,且由于CPU计算前后大多存在关联性无法并行,每次获取数据量并不大,所以位宽一直是64bit,为了降低延迟主要在内存频率提升和提升三缓容量上。
image.png
而为了满足GPU的带宽要求,则在DDR的基础上出现了GDDR(Graphic Double Data Rate),在GDDR5中将时钟信号复制出3份,并将每个偏移1/4个周期,在每个抬高阶段传输一次数据即得到了在每个时钟周期内可以传输4次数据(可以理解为4倍速)。
image.png
在GDDR6时代,在GDDR5每个时钟周期传输4次数据的基础上实现了翻倍,来到了每个时钟周期传输8次数据(8倍速)。为了进一步提升显存带宽,在传统使用0和1的指代高低电平的二进制传输的基础上,使用00、01、10、11来指代低、中低、中高、高电平,这样一个信号的容量就从1比特提升到了2比特,这就叫PAM-4(4-Level Pulse Amplitude Modulation)技术,在GDDR6基础上衍生出来的GDDR6-X就是16倍速。但是PAM-4比较激进,在GDDR7上则使用了相对保守的PAM-3,也就是类似于3进制的方式来传输数据。
因此我们在高规格的GPU上看到的则是高频率+大位宽的显存。

3 HBM

在DDR之外还在GPU上有另外一项显存技术HBM(High Bandwidth Memory),简单来说就是通过3D堆栈工艺将多个DDR芯片垂直堆叠并与GPU封装在一起,实现了大容量和高位宽的DDR组合阵列。HBM的核心在于其卓越的内存带宽,通过使用硅通孔(TSV)技术,多个DRAM芯片被堆叠起来,形成一个高度集成的内存模块。这种结构允许更宽的总线,跨独立通道运行,从而大幅提升了每个周期的数据传输量,适用于需要高速数据处理的应用,HBM不仅提供了极高的带宽,还具备低功耗和小尺寸的特点。(源自AI总结)
v2da8d82935479a485bf0f152657a0d7dd_1440w.png
在一般GDDR显存位宽还在512bit时,HBM的带宽已经来到了1024bit起步。HBM也不是没有缺点,首先是加工工艺更难,需要与GPU芯片封装在一起;另一个就是大量显存与GPU堆叠带来的发热与散热问题。

总结

本期针对CPU与GPU的不同,较为深入的讲解了内存与显存的不同。
老规矩,知道写了些啥。

最后修改时间:2025-07-24 09:39:35
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论