全部版块 我的主页
论坛 金融投资论坛 六区 金融学(理论版) 量化投资
3706 11
2015-02-19
QQ截图20150219200141.png
《计算机体系结构-量化研究方法》是计算机体系结构领域,最经典也是最前沿的教材。
经典,是因为没有其他的书能超越此书在体系结构领域的地位。前沿,是因为这本书基本是每5年左右再版一次。紧紧围绕最新的体系结构方向的变化。
作者: John L.Hennessy 斯坦福大学校长
IEEE和ACM会士
美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章
他也是2001年Seymour Cray计算机工程奖得主
并且和本书另外一位作者David A.Patterson分享了2000年John von Neumann奖。







Table of Contents
=================
1 章节变化
1.1 强调了功耗
1.2 更加强调存储体系结构
1.3 合并了ILP(Instruction-Level Parallelism)章节
1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章
1.5 对称多处理器和多线程并行章节变化不大
1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行
1.7 弱化外部存储章节
2 《编译点滴》评论
3 其他变化
4 相关资源
1 章节变化
~~~~~~~~~~~


1.1 强调了功耗
===============
第一章在Put it all together中,侧重了对功耗的考察。

1.2 更加强调存储体系结构
=========================
在第4版中,存储体系结构虽然也是很重要的一章,但被放置在第5章。而第5版中,直接将其放置在了第2章。
本章中除了讨论Cache、SRAM和DRAM,还增加了对Flash的讨论。


Put it all together中所举的例子,也从AMD Opteron,改成了ARM Cortex-A8和Core I7。


1.3 合并了ILP(Instruction-Level Parallelism)章节
===================================================
ILP一章主要介绍了指令级并行的相关概念,在第4版中分为两个章节分别在第2和第3章中论述。第5版中,将两个章节做了合并,在第3章中介绍。


这一章中的Put It All Together也主要讨论ARM Cortex A8和Core I7.
《量化》第3版曾使用大量的篇幅介绍安腾和VLIW中的指令级并行,第4版虽然增加了对Power处理器和X86处理器的介绍,但安腾的VLIW也被一并介绍。
第5版则干脆直接ARM和Core。关于安腾和VLIW的介绍,放到了附录里。作者给出的理由是“This architecture did not live up to the earlier claims".
即作者觉得这种体系结构实际效果并没有开始时声称的那么好.


1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章
====================================================
不管是高性能计算领域,还是嵌入式手机上,现在貌似不用上GPU就不够时尚。
《量化》在第4版只在附录中介绍了一下向量机,在第5版中则在正文中第4章完整的介绍该体系结构。
而且作者用了“contain the most detailed and clearset explanation of GPU yet"来形容这一章的内容,而且用了”particularly proud about“形容自己对这一章的态度。
可见,这一章将是本书让作者最为骄傲的亮点之一(之二是第6章对Google Warehouse-scale计算机的论述,没有之三)。


这一章主要介绍了GPU的体系结构,并选择Core I7、Nvidia GTX系列GPU和 Tegra 2 GPU进行比较。


1.5 对称多处理器和多线程并行章节变化不大
=========================================
这一章主要介绍线程级并行,但标题从第四版的”Multiprocessors and Thread-Level Application",缩减成了“Thread-Level Application”,作者并没有提为什么少了一个词。
Put It All Together 部分的介绍也从Sun T1变成了 Core I7.


1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行
======================================================
warehouse规模计算机(Warehouse-Scale Computer, WSC),即将整个数据中心看作一台计算机。这种规模的计算机面向的主要是互联网服务。
作者在撰写这一章时,得到了许多Amazon和Google一线工程师的协作,论述WSC计算机的设计、成本和性能。
本章从MapReduce的编程模型谈起,接着描述WSC计算机的物理实现,以及能耗、成本、性能的情况。
Put It All Together部分详细介绍了Google WSC的情况,许多内容都是在本书中首次公开。
(《编译点滴》也将持续跟进这部分内容,敬请关注。)

1.7 弱化外部存储章节
=====================
“Storag System”一章,是《量化》第4版本正文中的一章,在第5版中,被放入了附录里。


2 《编译点滴》评论
~~~~~~~~~~~~~~~~~~~
从第4版到第5版,书中的亮点“Put It All Together”部分,从介绍Intel Pentium 4, Sun T1,AMD Opteron等好几款CPU的结构,缩减为介绍ARM Cortex 和Core I7。
看来作者也看好Intel和ARM的未来发展。


第5版的《量化》更加关注个人移动设备上的体系结构发展,以及数据中心端的体系结构发展,所以选择了面向个人设备的ARM Cortex系列CPU和面向数据中心的Intel Core I7 CPU。
除了第一章基础介绍和第二章存储结构外,第3-6章每一章的标题中都有“Parallelism”。总共涉及了如下几个方面:
- 指令级并行(ILP)
- 数据级并行(DLP)
- 线程级并行(TLP)
- 请求级并行(RLP)


其中数据级并行占用的章节最多,而且都是第5版《量化》中新增加的章节--第4章GPU和第6章数据中心。数据正变得越来越重要。
`

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-19 20:17:20
学习学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-19 20:59:21
thanks啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-19 22:59:02
thanks ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-20 09:40:44
绝对好东西
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-20 10:34:06
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群