前言

随着ChatGPT 等千亿级参数AI 大模型的快速发展，业界对算力的需求越来越高。算力是计算机在单位时间内对整数和浮点数的计算能力。算力的提供方是高性能、高密度的CPU （中央处理器）、GPGPU（通用图形处理器）、NPU（神经网络处理器）和各类加速器芯片。本书聚焦近几年来市场上出现的高算力芯片，通过对它们进行技术架构层面的解读，向读者介绍算力芯片的发展和竞争态势。

算力芯片拥有比常规中央处理器更强大的计算能力，拥有更强的专用性，能够处理大量的数据并执行复杂的算法。算力芯片的设计焦点通常是提供高性能的数学运算能力，特别是在处理并行计算任务时。这些芯片广泛应用于各类计算环境，从超级计算机到个人计算机，再到移动设备。算力可以用于衡量个人计算机、服务器、移动设备或者大型数据中心的性能。评估一款芯片的算力涉及多个参数，包括但不限于时钟频率、核心数量、内存带宽，以及执行特定任务（如浮点计算或整数计算）时的速度，如整数TOPS算力和不同精度的浮点算力。

CPU发展了50多年，GPU也发展了将近30年。围绕着CPU和GPU所构建的软件和硬件体系已经相当成熟，面对性能瓶颈，要想增加算力，只能不断增加集群规模，AI计算成本成为不可承受之重。支撑AI的算力芯片，未来何去何从？

本书正是在这样的背景下开始写作的。本书介绍了超级计算机算力和AI算力的异同，从CPU流水线开始，描述主要的众核处理器架构和功能部件设计。在GPGPU和NPU等加速器部分，介绍了GPU为何能从单纯的图形任务处理器变成通用处理器，且聚焦在GPU设计逻辑、存储体系、线程管理，以及面向 AI的张量处理器设计，同时对华为等厂商推出的NPU芯片设计也做了详细介绍。最后回顾了近20年来主流的GPU设计路线、芯片架构特点，以及目前备受关注的大模型专用AI超级计算机。

本书提供了简明的硬件逻辑知识：通过对产品的细致描述，读者可以看出传统 x86 架构和ARM架构在高算力市场的激烈竞争路线，还可以感受到GPGPU的蓬勃发展对于我们对常规算力的颠覆性认知。算力芯片是一个广阔的领域，本书也力求通过覆盖度尽可能高的算力技术和产品介绍，描绘出该领域的竞争格局。

本书面向的读者

● 从事计算机硬件开发的读者：本书提供了丰富的硬件逻辑知识。

● 芯片开发领域的从业者：读者可以了解芯片技术背后的理念、设计哲学和发展过程。

● 软件开发人员：如果软件开发人员熟悉硬件架构，就可以有针对性地设计程序，让代码高效率运行。

交流沟通

笔者在工作及读书期间结识了一些优秀的IT科技媒体人，相信大部分读者对于驱动之家（如今的快科技）如雷贯耳。在征求其总编邱洪民（笔名：上方文Q）的同意之后，我们通过公众号“硬件世界”开设了联系专栏，和各位读者交流。书中内容丰富，但是难免有疏漏和不准确的技术细节描述，希望读者及时指正，也希望通过公众号“硬件世界”保持和各位读者的沟通。我期待再版时能够不断丰富内容，让本书在算力芯片领域快速变革的背景下，成为一本有生命力的“常青书”。

特别致谢

笔者曾就职于“中关村在线”核心硬件事业部，对于全世界备受关注的消费类电子产品，特别是围绕CPU、GPU展开的计算机核心硬件有较多了解，在后来的工作中有幸成为这些高性能算力芯片的用户。工作的过程也是学习积累的过程，我们也经常看到优秀的媒体，比如“半导体行业观察”“快科技”“新智元”等，对他们长期以来坚持输出高质量内容表示感谢。

金融行业也是算力密集型行业，该行业需要采集大量的市场数据，每天的数据量以 TB计算。在工作中，处理大量数据的过程要使用高算力的CPU和GPU，来分析数据规律、构建模型，所以笔者对高性能算力芯片微架构的设计有深刻认知。同时，笔者承担多家金融行业公司IT基础设施建设的咨询工作。

为避免打扰和阻力，近一年来笔者在完全保密的情况下撰写本书，家人和同事们完全不知此事，如今图书问世笔者也要感谢他们的支持和理解。最后特别感谢为笔者撰写序言和推荐语的几位行业领军者，你们推动了技术革新，见证了算力芯片如何颠覆和重塑我们的行业。

本书资源下载

在本书的写作过程中，笔者参考和学习了大量书籍、论文、厂商白皮书和技术架构图，在此对这些作者表示深深的感谢，具体参考资料和资源链接请扫描封底二维码获取。

由于笔者水平和精力都有限，而且本书的内容较多、牵涉的技术较广，谬误和疏漏之处在所难免，很多技术点设计的细节描述得不够详尽，恳请广大技术专家和读者指正。