投资要点:
AI 加速需求超过 CPU 计算能力摩尔定律供给。深度学习是目前 AI 领域最有效算法,深度
学习模型需要通过大量的数据训练才能获得理想的效果,CPU 优势为处理各类数据及强逻
辑判断能力,解决单次复杂问题能力强。两者需求并非完全匹配,深度学习需要一种替代
硬件来满足海量数据的运算需求。
GPU:较成熟生态系统,最先收益人工智能爆发。GPU 与 CPU 类似,只不过是一种专门
进行图像运算工作的微处理器。GPU 是专为执行复杂的数学和几何计算而设计的,这些计
算是图形渲染所必需的。GPU 在浮点运算、并行计算等部分计算方面可以提供数十倍乃至
于上百倍于 CPU 的性能。英伟达公司从 2006 年下半年已经开始陆续推出相关的硬件产品
以及软件开发工具,目前是人工智能硬件市场的主导。
GPU 天然具有三个方面局限性。GPU 作为图像处理器,设计初衷是为了应对图像处理中
需要大规模并行计算。因此,其在应用于深度学习算法时,有三个方面的局限性:1. 应
用过程中无法充分发挥并行计算优势。2. 硬件结构固定不具备可编程性。3. 运行深度
学习算法能效远低于 ASIC 及 FPGA。
FPGA:能效中等、灵活度高、成本较高的 AI 白板,具有三类局限。FPGA 称为现场可编
程门阵列,用户可以根据自身的需求进行重复编程,与 GPU、CPU 相比,具有性能高、
能耗低、可硬件编程的特点。同时具有三类局限:1. 基本单元的计算能力有限;2. 速
度和功耗有待提升;3、FPGA 价格较为昂贵。
ASIC:顶级能耗、拥抱未来。ASIC 是一种为专门目的而设计的集成电路。专为特定目的
而设计。不同于 GPU 和 FPGA 的灵活性,定制化的 ASIC 一旦制造完成将不能更改,所以
初期成本高、开发周期长的使得进入门槛高。目前,大多是具备 AI 算法又擅长芯片研发的
巨头参与,如 Google 的 TPU。由于完美适用于神经网络相关算法,ASIC 在性能和功耗
上都要优于 GPU 和 FPGA,TPU1 是传统 GPU 性能的 14-16 倍,NPU 是 GPU 的 118 倍。
寒武纪已发布对外应用指令集,预计 ASIC 将是未来 AI 芯片的核心。
推荐标的:中科曙光(寒武纪深度合作伙伴,预计 AI 服务器将深度合作、X86 芯片若突
破则提升市场份额与毛利率)、中科创达(华为麒麟 970 芯片人脸识别应用提供方)、富瀚
微(安防行业解码芯片领军)
评论