数据库管理351期 2025-07-25
数据库管理-第351期 初探GPU:统一内存是什么(20250725)
作者:胖头鱼的鱼缸(尹海文) Oracle ACE Pro: Database PostgreSQL ACE Partner 10年数据库行业经验 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVP,ITPUB认证专家 圈内拥有“总监”称号,非著名社恐(社交恐怖分子) 公众号:胖头鱼的鱼缸 CSDN:胖头鱼的鱼缸(尹海文) 墨天轮:胖头鱼的鱼缸 ITPUB:yhw1809 IFClub:胖头鱼的鱼缸 除授权转载并标明出处外,均为“非法”抄袭

在上一篇文章中简单介绍了DDR、GDDR还有HBM的区别,CPU需要内存的低延迟而GPU需要显存的高带宽。但在最近几年的PC产品中(其实不止PC也不仅是最近几年出现的)我们会发现一种叫统一内存的东西,统一内存又是什么东西。
1 统一内存
这里我们使用M4 Pro或M4 Max的MacBook Pro为例,其统一内存的最大带宽分别达到273GB/s和546GB/s,其规格分别是是四通道256bit和八通道512bit的LPDDR5-8533Mbps的统一内存。

另一款使用统一内存的则是使用AMD AI MAX+ 395的ROG 幻X 2025,其最大可搭载128GB四通道256bit的LPDDR5X-8000MHz统一内存,带宽来到了256GB/s,其内存总量可以动态/指定分配给CPU和GPU。

2 LPDDR
在查找水果本和ROG的相关资料的时候我们看到了统一内存均使用的是LPDDR5(X),LPDDR的全称是Low Power Double Data Rate,可以直接理解为低功耗DDR,最初主要用于移动端设备。相较于标准DDR,LPDDR的发展相对较为激进,即电压更低,频率更高,其中LPDDR5一般频率为6400MT/s(最大7500MT/s),而LPDDR5X则来到了8533MT/s以上。LPDDR之所以可以供CPU和GPU统一使用,相较于与DDR一般64bit的位宽,其可以做到256bit-512bit,功耗更低频率较高,可以板载,在一定程度上满足GPU的带宽需求。但是LPDDR的高频率也带来了一些问题,主要就是时序高于一般DDR带来了更大的延迟,这一点对CPU不一定很友好。
3 vs GDDR
看到上面两款使用统一内存的PC的带宽,大家一定会觉得256GB/s起步,已经是非常大的带宽了,那我们来看看Nvidia GeForce RTX5090D的显存规格。

没错,使用512bit GDDR7-28Ghz 32GB显存的RTX5090D的显存带宽来到了惊人的1792GB/s,是M4 Max最大内存带宽的3倍还多(相较于M3 Ultra最高800GB/s的带宽也有2倍还多),这么看来统一内存似乎并没有达到专用显存的性能。
4 更进一步
到现在我们已经看到了在CPU上普遍使用的DDR内存,在GPU上使用的GDDR、HBM显存,以及在CPU、GPU均可使用的LPDDR内存,不同的类型的内存有不同优缺点,有些延迟低,有些带宽高,有些则比较均衡,但是如果有需求需要在不同类型的内存之间进行交互可能带来比较大的问题。
总结
这一期在DDR、GDDR、HBM的基础上又加上了LPDDR的简单介绍。
老规矩,知道写了些啥。




