计算机体系结构:量化研究方法

亨尼西著书籍

《计算机体系结构：量化研究方法(第5版)》是最权威的计算机体系结构著作，是久负盛名的经典作品。书中系统地介绍了计算机系统的设计基础、指令集系统结构、流水线和指令集并行技术、层次化存储系统与存储设备、互连网络以及多处理器系统等重要内容。在这个最新版中，作者增加了当前炙手可热的云计算和手机客户端技术等相关内容，探讨了在手机、平板电脑、笔记本电脑和其他移动计算设备上云计算的软硬件实现方式。《计算机体系结构：量化研究方法(第5版)》可作为高等院校计算机专业本科生或研究生教材，也可作为从事计算机体系结构或计算机系统设计的工程技术人员的参考书。

基本信息

外文名
Computer Architecture:A Quantitative Approach, Fifth Edition
出版社
人民邮电出版社
作者
亨尼西(John L.Hennessy)
开本
16
页数
595页

基本介绍

内容简介

《计算机体系结构:量化研究方法(第5版)》可作为高等院校计算机专业本科生或研究生教材，也可作为从事计算机体系结构或计算机系统设计的工程技术人员的参考书。

作者简介

作者：（美国）亨尼西（John L.Hennessy）（美国）帕特森（David A.Patterson）译者：贾洪峰亨尼西（John L.Hennessy），是斯坦福大学的第10任校长，从1977年开始在该校电子工程与计算机系任教。Hennessy是IEEE和ACM会士，美国国家工程院、国家科学院和美国哲学院院士，美国艺术与科学院院士。他获得过众多奖项，如2001年度Eckert—Mauchly奖，表彰他对RISC技术的贡献；2001年度Seymour Cray计算机工程奖；与David Patterson共同获得的2000年度约翰·冯·诺依曼奖章。他还拥有7个荣誉博士学位。1981年，JohnL.Hennessy带领几位研究生在斯坦福开始MIPS项目的研究。1984年完成该项目之后，他暂时离开大学，与他人共同筹建MIPS计算机系统公司（也就是现在的MIPS技术公司），这家公司开发了最早的商用RISC微处理器之一。到2006年，已经有20多亿个MIPS微处理器被用于视频游戏、掌上电脑、激光打印机和网络交换机等各种设备中。Hennessy后来领导了DASH（Director Architecture for Shared Memory，共享存储器控制体系结构）项目，这一项目设计了第一个可扩展缓存一致性多处理器原型，其中的许多重要思想都在现代多处理器中得到了应用。除了参与科研活动、履行学校职责之外，他仍作为前期顾问和投资者参与了无数的创业项目。帕特森（David A.Patterson），自1977年进入加州大学伯克利分校执教以来，一直讲授计算机体系结构课程，拥有该校计算机科学Pardee讲座教授职位。他因为教学成果显著而荣获了加州大学的杰出教学奖、ACM的Karlstrom奖、IEEE的Mulligan教育奖章和本科生教学奖。因为在RISC方面的贡献而获得了IEEE技术成就奖和ACM Eckert—Mauchly奖，他还因为在RAID方面的贡献而分享了IEEE Johnson信息存储奖，并与John Hennessy共同获得了IEEE约翰·冯·诺依曼奖章和C&C奖金。和John Hennessy相似，Patterson也是美国艺术与科学院院士、美国计算机历史博物馆院士、ACM和IEEE会士。他还被选人美国国家工程院、美国国家科学院和硅谷工程名人堂。Patterson身为美国总统信息技术顾问委员会委员，同时也是伯克利电子工程与计算机科学系计算机科学分部主任、计算机研究协会主席和ACM主席。这一履历使他荣获了ACM和CRA颁发的杰出服务奖。在加州大学伯克利分校，Patterson领导了RISCI的设计与实现工作，这可能是第一台VLSI精简指令集计算机，为商业SPARC体系结构奠定了基础。他曾是廉价磁盘冗余阵列（RedundantArrays of Inexpensive Disks，RAID）项目的领导者之一，正是由于这一项目，才有了后来许多公司出品的可靠存储系统。他还参与了工作站网络（Network of Workstations，NOW）项目，因为这一项目而有了因特网公司使用的集群技术和后来的云计算。这些项目获得了ACM颁发的三个论文奖。作为“算法—机器—人类”（AMP）实验室和并行计算实验室的主管，他目前在这里开展自己的研究项目。AMP实验室的目标是开发可扩展的机器学习算法、适用于仓库级计算机的编程模型、能够快速洞悉云中海量数据的众包（Crowd—Sourcmg）工具。并行计算实验室的目标是研发先进技术，为并行个人移动设备提供可扩展、可移植、方便快捷的效率软件。

图书目录

第1章量化设计与分析基础 1.1引言 1.2计算机的分类 1.2.1个人移动设备 1.2.2桌面计算 1.2.3服务器 1.2.4集群／仓库级计算机 1.2.5嵌入式计算机 1.2.6并行度与并行体系结构的分类 1.3计算机体系结构的定义 1.3.1指令集体系结构：计算机体系结构的近距离审视 1.3.2真正的计算机体系结构：设计满足目标和功能需求的组成和硬件 1.4技术趋势 1.4.1性能趋势：带宽胜过延迟 1.4.2晶体管性能与连线的发展 1.5集成电路中的功率和能耗趋势 1.5.1功率和能耗：系统观点 1.5.2微处理器内部的能耗和功率 1.6成本趋势 1.6.1时间、产量和大众化的影响 1.6.2集成电路的成本 1.6.3成本与价格 1.6.4制造成本与运行成本 1.7可信任度 1.8性能的测量、报告和汇总 1.8.1基准测试 1.8.2报告性能测试结果 1.8.3性能结果汇总 1.9计算机设计的量化原理 1.9.1充分利用并行 1.9.2局域性原理 1.9.3重点关注常见情形 1.9.4Amdahl定律 1.9.5处理器性能公式 1.10融会贯通：性能、价格和功耗 1.11谬论与易犯错误 1.12结语 1.13历史回顾与参考文献第2章存储器层次结构设计 2.1 引言 2.2缓存性能的10种高级优化方法 2.2.1 第一种优化：小而简单的第一级缓存，用以缩短命中时间、降低功率 2.2.2第二种优化：采用路预测以缩短命中时间 2.2.3第三种优化：实现缓存访问的流水化，以提高缓存带宽 2.2.4第四种优化：采用无阻塞缓存，以提高缓存带宽 2.2.5第五种优化：采用多种缓存以提高缓存带宽 2.2.6 第六种优化：关键字优先和提前重启动以降低缺失代价 2.2.7第七种优化：合并写缓冲区以降低缺失代价 2.2.8第八种优化：采用编译器优化以降低缺失率 2.2.9第九种优化：对指令和数据进行硬件预取，以降低缺失代价或缺失率 2.2.10第十种优化：用编译器控制预取，以降低缺失代价或缺失率 2.2.11缓存优化小结 2.3存储器技术与优化 2.3.1 SRAM技术 2.3.2 DRAM技术 2.3.3提高DRAM芯片内部的存储器性能 2.3.4 降低SDRAM中的功耗 2.3.5 闪存 2.3.6提高存储器系统的可靠性 2.4保护：虚拟存储器和虚拟机 2.4.1 通过虚拟存储器提供保护 2.4.2通过虚拟机提供保护 2.4.3对虚拟机监视器的要求 2.4.4虚拟机（缺少）的指令集体系结构支持 2.4.5虚拟机对虚拟存储器和I／O的影响 2.4.6 VMM实例：Xen虚拟机 2.5交叉问题：存储器层次结构的设计 2.5.1保护和指令集体系结构 2.5.2缓存数据的一致性 2.6融会贯通：ARM Cortex—A8釉atel Corei7中的存储器层次结构 2.6.1 ARM Cortex—A8 2.6.2 Intel Core i7 2.7谬论与易犯错误 2.8结语：展望 2.9历史回顾与参考文献第3章指令级并行及其开发 3.1指令级并行：概念与挑战 3.1.1什么是指令级并行 3.1.2数据相关与冒险 3.1.3控制相关 3.2揭示ILP的基本编译器技术 3.2.1基本流水线调度和循环展开 3.2.2循环展开与调度小结 3.3用高级分支预测降低分支成本 3.3.1竞赛预测器：局部预测器与全局预测器的自适应联合 3.3.2 Intel Core i7分支预测器 3.4用动态调度克服数据冒险 3.4.1动态调度：思想 3.4.2使用Tomasulo算法进行动态调度 3.5动态调度：示例和算法 3.5.1 Tomasulo算法：细节 3.5.2 Tomasulo算法：基于循环的示例 3.6基于硬件的推测 3.7以多发射和静态调度来开发ILP 3.8以动态调度、多发射和推测来开发ILP 3.9用于指令传送和推测的高级技术 3.9.1提高指令提取带宽 3.9.2推测：实现问题与扩展 3.10 ILP局限性的研究 3.10.1硬件模型 3.10.2可实现处理器上ILP的局限性 3.10.3超越本研究的局限 3.11交叉问题：ILP方法与存储器系统 3.11.1硬件推测与软件推测 3.11.2推测执行与存储器系统 3.12多线程：开发线程级并行提高单处理器吞吐量 3.12.1细粒度多线程在Sun T1上的效果 3.12.2 同时多线程在超标量处理器上的效果 3.1 3融会贯通：Intel Core i7和IARM Cortex—A8 3.13.1 ARM Cortex—A8 3.13.2 Intel Core i7 3.14谬论与易犯错误 3.15结语：前路何方 3.16历史回顾与参考文献第4章向量、SIMD和GPU体系结构中的数据级并行 4.1 引言 4.2向量体系结构 4.2.1 VMIPS 4.2.2向量处理器如何工作：一个示例 4.2.3 向量执行时间 …… 第5章线程级并行第6章以仓库级计算机开发请求级、数据级并行附录A指令集基本原理附录B存储器层次结构回顾附录C流水线：基础与中级概念参考文献索引

名人推荐

“本书之所以会成为不朽的经典之作，是因为每次再版都不仅仅是一次更新补充，而是全面修订，针对这个激动人心且快速变化的领域，给予我们最及时的信息和权威的解读。即便对于我这样已从业二十多年的人来说，再次阅读本书时，依旧自觉学无止境，感佩于两位卓越大师的渊博学识和深厚功底。” ——Luiz Andre Barroso，Google公司 “《计算机体系结构：量化研究方法》是一部经典，犹如美酒，历久而弥醇。只有Hennessy和Patterson才可能接触到谷歌、亚马逊、微软等云计算与互联网规模的应用提供商的内部人士，对这一重要领域，业内的介绍材料无出其右。” ——James Hamilton，Amazon web服务部 “《计算机体系结构：量化研究方法（第5版）》继续发扬传统，为学习计算机体系结构的学生提供了当前计算平台的最新信息，使他们能够洞悉体系结构，便于设计未来系统。这一版的亮点在于大幅修订了数据级并行那一章，用传统的体系结构术语清晰地解读了GPU体系结构。” ——Krste Asanovic，加州大学伯克利分校 “Hennessy和Patterson撰写本书的第一版时，研究生们是在用50000个晶体管组装计算机。今天，仓库级的计算机集群会包含50000个服务器，每个服务器中包含数十个处理器和数十亿个晶体管。计算机体系结构一直在不停地快速发展，而《计算机体系结构：量化研究方法》紧跟它的步伐，每个版本都准确地解释和分析了这一领域激动人心的最新重要思想。” ——James Larus，微软研究院