- 算力芯片:高性能CPU/GPU/NPU微架构分析
- 濮元恺
- 1746字
- 2024-10-16 17:48:20
前言
随着ChatGPT 等千亿级参数AI 大模型的快速发展,业界对算力的需求越来越高。算力是计算机在单位时间内对整数和浮点数的计算能力。算力的提供方是高性能、高密度的CPU (中央处理器)、GPGPU(通用图形处理器)、NPU(神经网络处理器)和各类加速器芯片。本书聚焦近几年来市场上出现的高算力芯片,通过对它们进行技术架构层面的解读,向读者介绍算力芯片的发展和竞争态势。
算力芯片拥有比常规中央处理器更强大的计算能力,拥有更强的专用性,能够处理大量的数据并执行复杂的算法。算力芯片的设计焦点通常是提供高性能的数学运算能力,特别是在处理并行计算任务时。这些芯片广泛应用于各类计算环境,从超级计算机到个人计算机,再到移动设备。算力可以用于衡量个人计算机、服务器、移动设备或者大型数据中心的性能。评估一款芯片的算力涉及多个参数,包括但不限于时钟频率、核心数量、内存带宽,以及执行特定任务(如浮点计算或整数计算)时的速度,如整数TOPS算力和不同精度的浮点算力。
CPU发展了50多年,GPU也发展了将近30年。围绕着CPU和GPU所构建的软件和硬件体系已经相当成熟,面对性能瓶颈,要想增加算力,只能不断增加集群规模,AI计算成本成为不可承受之重。支撑AI的算力芯片,未来何去何从?
本书正是在这样的背景下开始写作的。本书介绍了超级计算机算力和AI算力的异同,从CPU流水线开始,描述主要的众核处理器架构和功能部件设计。在GPGPU和NPU等加速器部分,介绍了GPU为何能从单纯的图形任务处理器变成通用处理器,且聚焦在GPU设计逻辑、存储体系、线程管理,以及面向 AI的张量处理器设计,同时对华为等厂商推出的NPU芯片设计也做了详细介绍。最后回顾了近20年来主流的GPU设计路线、芯片架构特点,以及目前备受关注的大模型专用AI超级计算机。
本书提供了简明的硬件逻辑知识:通过对产品的细致描述,读者可以看出传统 x86 架构和ARM架构在高算力市场的激烈竞争路线,还可以感受到GPGPU的蓬勃发展对于我们对常规算力的颠覆性认知。算力芯片是一个广阔的领域,本书也力求通过覆盖度尽可能高的算力技术和产品介绍,描绘出该领域的竞争格局。
本书面向的读者
● 从事计算机硬件开发的读者:本书提供了丰富的硬件逻辑知识。
● 芯片开发领域的从业者:读者可以了解芯片技术背后的理念、设计哲学和发展过程。
● 软件开发人员:如果软件开发人员熟悉硬件架构,就可以有针对性地设计程序,让代码高效率运行。
交流沟通
笔者在工作及读书期间结识了一些优秀的IT科技媒体人,相信大部分读者对于驱动之家(如今的快科技)如雷贯耳。在征求其总编邱洪民(笔名:上方文Q)的同意之后,我们通过公众号“硬件世界”开设了联系专栏,和各位读者交流。书中内容丰富,但是难免有疏漏和不准确的技术细节描述,希望读者及时指正,也希望通过公众号“硬件世界”保持和各位读者的沟通。我期待再版时能够不断丰富内容,让本书在算力芯片领域快速变革的背景下,成为一本有生命力的“常青书”。
特别致谢
笔者曾就职于“中关村在线”核心硬件事业部,对于全世界备受关注的消费类电子产品,特别是围绕CPU、GPU展开的计算机核心硬件有较多了解,在后来的工作中有幸成为这些高性能算力芯片的用户。工作的过程也是学习积累的过程,我们也经常看到优秀的媒体,比如“半导体行业观察”“快科技”“新智元”等,对他们长期以来坚持输出高质量内容表示感谢。
金融行业也是算力密集型行业,该行业需要采集大量的市场数据,每天的数据量以 TB计算。在工作中,处理大量数据的过程要使用高算力的CPU和GPU,来分析数据规律、构建模型,所以笔者对高性能算力芯片微架构的设计有深刻认知。同时,笔者承担多家金融行业公司IT基础设施建设的咨询工作。
为避免打扰和阻力,近一年来笔者在完全保密的情况下撰写本书,家人和同事们完全不知此事,如今图书问世笔者也要感谢他们的支持和理解。最后特别感谢为笔者撰写序言和推荐语的几位行业领军者,你们推动了技术革新,见证了算力芯片如何颠覆和重塑我们的行业。
本书资源下载
在本书的写作过程中,笔者参考和学习了大量书籍、论文、厂商白皮书和技术架构图,在此对这些作者表示深深的感谢,具体参考资料和资源链接请扫描封底二维码获取。
由于笔者水平和精力都有限,而且本书的内容较多、牵涉的技术较广,谬误和疏漏之处在所难免,很多技术点设计的细节描述得不够详尽,恳请广大技术专家和读者指正。