内容导航
31 层:是鸡肋还是蛋糕?
回想起数年前,我们还记得1.4GHz 和1.5GHz Pentium 4 发布的时候,管线的数目从Pentium III 的10层,提高到Pentium 4 的20 层,足足增加了100% 。最初的时候,1.5GHz Pentium 4 处理器步履维艰,因为性能与主频仅为1GHz 的Pentium III 相比,也没有任何讨好之处,甚至在某些情况下还表现出明显的迟缓。
看看今天,我们可以知道Pentium 4 2.4C 的性能已经不止是Pentium III 1GHz 的两倍了,但之前我们敢做出这样清晰的介定吗?这是否说明了像“CPU 的设计与之前的不同,才会有如此结果”?。
宽松的估计来看,0.13 微米Northwood 核心Pentium 4 的极限频率在3.6GHz - 3.8GHz ;0.09微米Prescott 核心的处理器,由于可以限制电能的消耗,因此可以获得更高的时钟速度 - 但显然没有如Intel 预期的那么理想。
Intel 在转移到0.09微米制造工艺的时候,虽然获得了更小的处理器体积,不过Intel 也使Prescott 变得更加复杂了,也作了显著的微架构修改 - 把基本的整数管线扩充到了31层。由于这个数目并没有包括管线的初始解码层,实际全部的管线(整数指令、浮点指令需要更多的层)将超过31层。Intel 提醒我们,说我们不应该从Northwood 的标记来假设Prescott 的初始解码层(31),因为管线的改变已经变得更加广阔了。
管线长度增加的目的是明显的:为了增加时钟速度。Intel 1年前在IDF 上,宣布Prescott 的频率将在4 - 5GHz 之间;显然最大化地加深管线是达到目标的必要手段之一。

Intel 在加长管线的同时,也面临着严峻的考验,因为如果这样做的话,就意味着Prescott 在相同时钟的情况下,执行效率要比Northwood 低。我们想想,Pentium 4 只有在频率超越了2.4GHz 之后,才能够与更短管线的Athlon XP 展开竞争。现在戏码如常,Intel 也没有隆重地引入Prescott 处理器,因为如果3.4GHz Prescott 都不能够超越2.4GHz Northwood 的话,那么Pentium 4 的头衔就会失去光泽,仅成为别人的笑料而已。
接下来数个页面的篇幅将会介绍,Intel 为了提升Prescott 性能所采取的一些架构改进措施,如果没有这些改进措施的话,我想Prescott 就只能惨淡地为Pentium 4 划上终结的句号了。
首先我们必须注意到的是Intel 提升Pentium 4 管线的决定 - 这并非轻松的决定。我们不能够否认它是最好的决定,但显然Intel 的工程师们是如此想的。与GPU 使用的预设计逻辑门和单元硬件描述语言(HDLs)不同,Pentium 4 和Athlon 64 等CPU更多地是由人工设计的。 这几分手工设计也决定了,为什么Pentium 4使用远少的管线层,能够达到数GHz 的频率,而Radeon 9800 Pro 却依然被限制在几百MHz 。把大量CPU 的设计成就糅合到GPU 中也是不可能的,因为后者的生产周期大约为6个月,要远快得多。
尽管我们现在才谈论Prescott 处理器的管线,不过Intel 对该计划其实蓄谋已久,决非临急上阵。无论Intel 的出发点和动机何在,Prescott 的设计其实距离发布日期今天前的1 - 2 年就已经决定了(如果我们不把设计/测试/制造过程的时间考虑在内的话,实际是3年前)。在最后一分钟才作出“增加更多的管线” 的决定,是不可能的,因为管线深度的增加不仅在达到更高的时钟频率,为了获得更快的速度,工程师们还需要进行周边的协调。Intel 和AMD 都善于为自己的发展作出计划,不过完善一款产品需要大量的时间。设计CPU 与GPU 想比,存在太多、太多的区别。