内容导航
新核心Prescott P4处理器采用了Intel最新的0.09um 7层铜互联制造工艺,内部集成晶体管数也达到了1亿2500万个。这个数目比正统家族Northwood核心 P4处理器翻了一倍还多。而核心面积却由Northwood核心 P4的131平方毫米缩小到125平方毫米。可见Intel的0.09um工艺已经开始初显威力。依照P4面对主流中高端桌面处理器的定位,Prescott P4处理器仍然采用200MHz外频,800MHz FSB(同时发布了一款低端产品,533FSB)。
出于对Socket478插座的兼容,今年二月Intel推出的仍然是Socket478的mPGA(PIN GRID PACKAGE)版本。而在今年中旬,Intel将全面推动其新一代Socket T的LGA775封装。
相比于Northwood核心 P4,新核心Prescott P4拥有了更多令人神往的新特性:首先,由原来的8K一级数据缓存增大一倍,变为16K。指令缓存保持不变为12K。而二级缓存也翻了一番,达到了1MB,这个数值已经和AMD Athlon 64/FX持平,并提供三级缓存接口。在16K的一级数据缓存中,分配了4K用于动态分支目标缓存(Branch Target Buffers,简称BTB)在剩下的12K缓存中,也追加了2K用于追踪分支目标缓存。之所以对此尤其重视,是因为分支目标缓存在存放分支预测目标信息和指令编译、二级缓存资源分配方面起很大作用。这次Prescott创纪录的采用了31级超长流水管线的NetBurst微体系结构来进一步有效提高主频率,如果不能进一步提高程序的分支预测命中率,系统效能则会不升反降。因此Intel采取增大分支目标缓存这个有效措施来尽量避免预测错误。而在预测错误的同时,Intel采用另一措施有效避免效能浪费,即指令追踪缓存(Instruction Trace Caches,简称ITB),它可以在指令分支一旦预测出错的情况下,不必从头再来,而是通过读取指令追踪缓存回到最后的错误出重新进行运算处理,大大提高整体效能。
二级缓存增大一倍也使这颗CPU有了向更高级迈进的理由。相对于AMD Athlon 64/FX,如果二级缓存还是维持在512K的水平,商用性能就很难与其相抗衡。其实Intel使用1M二级缓存已经尝到了甜头,那就是他的迅驰处理器Pentium M,1M二级缓存使他在各项性能方面有了大幅度提升,优秀的性能加上Intel极好的理念使他的笔记本市场在2003年风光无限。可见提高二级缓存确实可以对CPU性能提升起到良好效果。
另一方面是它的增强型超线程技术与新的SSE3指令集。新的超线程技术由原来的每时钟周期欲取3条指令扩展到4条,这意味着每个虚拟逻辑执行单元可以同时处理两条指令,而此时两个虚拟逻辑执行单元共享一级缓存,能够更有效地提升多线程的实际执行效率。新增加的13条SSE3指令集在144条多媒体指令的基础上增强超线程同步指令、视频编码指令、以及浮点和复数运算增强指令。当然从历史角度来看,每一次指令集的增加都需要之后一段时间软件的配合才能发挥其应有功力,相信这次也不例外。
以下是当前主流CPU参数对比:
|
Intel Pentium 4 |
Intel Pentium 4 |
Intel Pentium 4 Extreme Edition |
AMD Athlon 64 |
AMD Athlon 64 FX |
AMD Athlon XP |
Processor core |
Prescott |
Northwood |
Gallatin |
ClawHammer |
SledgeHammer |
Barton |
Socket |
Socket 478 |
Socket 478 |
Socket 478 |
Socket 754 |
Socket 940 |
Socket A |
Frequencies |
2.8-3.4GHz |
1.6-3.4GHz |
3.2-3.4GHz |
2.0-2.2GHz |
2.2GHz |
Below 2.2GHz |
Production technology |
0.09 micron, «strained» silicon |
0.13 micron |
0.13 micron |
0.13 micron, SOI |
0.13 micron, SOI |
0.13 micron |
Number of transistors |
125mln. |
55mln. |
178mln. |
105.9mln. |
105.9mln. |
54.3mln. |
Die size |
112 sq.mm |
131 sq.mm |
237 sq.mm |
193 sq.mm |
193 sq.mm |
101 sq.mm |
L1 data cache |
16KB |
8KB |
8KB |
64KB |
64KB |
64KB |
L1 instructions cache |
12000 uops |
12000 uops |
12000 uops |
64KB |
64KB |
64KB |
L2 cache |
1024KB |
512KB |
512KB |
1024/512KB |
1024KB |
512KB |
L3 cache |
- |
- |
2MB |
- |
- |
- |
SIMD instructions |
SSE3/ SSE2/ SSE |
SSE2/ SSE |
SSE2/ SSE |
SSE2/ SSE/ 3DNow! |
SSE2/ SSE/ 3DNow! |
SSE/ 3DNow! |
Pipeline length |
31 stages |
20 stages |
20stages |
12 stages |
12 stages |
10 stages |
Voltage |
1.25 - 1.4v |
~1.525v |
~ 1.525v |
~ 1.5v |
1.5v |
1.5v |
x86-64 support |
- |
- |
- |
+ |
+ |
- |
Integrated memory controller |
- |
- |
- |
Single-channel DDR SDRAM |
Dual-channel DDR SDRAM |
- |