这一章中的Put It All Together也主要讨论ARM Cortex A8和Core I7.
《量化》第3版曾使用大量的篇幅介绍安腾和VLIW中的指令级并行,第4版虽然增加了对Power处理器和X86处理器的介绍,但安腾的VLIW也被一并介绍。
第5版则干脆直接ARM和Core。关于安腾和VLIW的介绍,放到了附录里。作者给出的理由是“This architecture did not live up to the earlier claims".
即作者觉得这种体系结构实际效果并没有开始时声称的那么好.
1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章
====================================================
不管是高性能计算领域,还是嵌入式手机上,现在貌似不用上GPU就不够时尚。
《量化》在第4版只在附录中介绍了一下向量机,在第5版中则在正文中第4章完整的介绍该体系结构。
而且作者用了“contain the most detailed and clearset explanation of GPU yet"来形容这一章的内容,而且用了”particularly proud about“形容自己对这一章的态度。
可见,这一章将是本书让作者最为骄傲的亮点之一(之二是第6章对Google Warehouse-scale计算机的论述,没有之三)。
1.5 对称多处理器和多线程并行章节变化不大
=========================================
这一章主要介绍线程级并行,但标题从第四版的”Multiprocessors and Thread-Level Application",缩减成了“Thread-Level Application”,作者并没有提为什么少了一个词。
Put It All Together 部分的介绍也从Sun T1变成了 Core I7.
1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行
======================================================
warehouse规模计算机(Warehouse-Scale Computer, WSC),即将整个数据中心看作一台计算机。这种规模的计算机面向的主要是互联网服务。
作者在撰写这一章时,得到了许多Amazon和Google一线工程师的协作,论述WSC计算机的设计、成本和性能。
本章从MapReduce的编程模型谈起,接着描述WSC计算机的物理实现,以及能耗、成本、性能的情况。
Put It All Together部分详细介绍了Google WSC的情况,许多内容都是在本书中首次公开。
(《编译点滴》也将持续跟进这部分内容,敬请关注。)