内容导航
DDR未必差,Rambus未必好
DDR SDRAM内存模组具有184只引脚,比SDRAM内存模组多了16只引脚。它领先于SDRAM的地方在于可以在时钟触发沿的上、下沿都能够进行数据传输,这也就是其双倍速率同步动态随机存储器的由来。由于PC66、PC100、PC133的命名习惯,我们常常把它们叫做DDR200、DDR266、DDR 333,不过JEDEC的官方名称是PC1600、PC2100和PC2700,这样看上去比PC800和PC1066更加有优势。
DDR内存支持2.5V电压的SSTL2标准,虽然同SDRAM使用的3.3V电压的LVTTL标准不同,但是其生产并不需要特别的设备,只要在现有的SDRAM的设备上进行改造就可以实现DDR内存的生产,对于内存厂商来说投入少风险小,这样式Rambus不能得到绝大部分内存厂商支持的或者及时的支持原因之一。那么为什么厂商就不能继续沿用单纯的提高内存运行频率的方式来提高内存带宽了?
为什么RDRAM起始频率就可以达到400MHz,而且还可以进一步的提升,而DDR SDRAM要提升到了DDR400缺遭到了很多的质疑。通俗的说,为什么RDRAM会比DDR SDRAM更快呢?其实这只是一种习惯上的认识,Rambus固然有很多优点,DDR也不是一种平庸的技术,它也有很多的优点。下面我们对比一下这两种技术,应该可以更加了解这两种都要成为过去的技术,并且对于未来的内存技术有些概念。
目前的大部分的DDR内存模组采用的都是TSOP封装的颗粒,而RDRAM采用的是FBGA封装的颗粒。


TSOP封装 TSOP II封装

FBGA封装
即使你对于封装技术没有多少了解,从上面的示意图上也可以看出来,TSOP和TSOP II封装的内存颗粒引脚在两侧(TSOP的引脚在芯片的短边,而TSOP II的引脚在芯片的长边),而FBGA封装的芯片则是通过底部的球形引脚直接焊接在PCB板上的,前者比后者的引脚长,虽然只有那么一点点,但是对于运行频率达到几百MHz的内存芯片足以影响其最高的运行频率了――在这种应用中,引脚长度越长,数据信号与时钟信号不同步的几率就越高。
相关资料显示,TSOP封装的内存颗粒的速度极限在150-180MHz左右,也就是刚好可以用于DDR333而不能用于DDR400。不过,三星力推的DDR400同样也是采用了TSOP II封装,不过估计产品的良率应该不会太高,否则三星也不可能等到11月份才批量供货。而FBGA封装的内存颗粒则可以轻松的运行在533MHz或者更高的频率上。
当然内存颗粒的封装也只是一个因素,比如Kingmax虽然也使用了BGA封装的颗粒,但是也似乎并不能在更高的频率下运行,因此内存模组封装厂商的技术水平和质量控制对于内存模组的频率也有着至关重要的影响。这也是为什么很多内存模组厂商没有投产RDRAM内存模组的原因之一。
串行总线每针传输率比并行总线高的多,这也是为什么现在PC业界正在从并行向串行发展的原因。比如IDE/ATA接口最高也只能达到133MB/s,而SATA起始传输率为150MB/s,理论上可以提供600MB/s的传输率。
RDRAM也是基于这个原因采用了16bit的串行总线结构,因此在传输速率上可以轻松的超过采用了64bit并行总线结构DDR SDRAM。由于只是16bit总线,因此无论是内存颗粒结构、芯片组的内存控制器的设计都会相对的简化。

黄色代表地址总线,橘黄色代表数据总线
从上面的图上,读者可以直观的了解到并行总线和串行总线的概念。可以看到RDRAM的数据总线和地址总线连接的芯片数目是完全一样的,而SDRAM和DDR SDRAM则是不一样的,比如示意图中一条数据总线只要连接内存条上的一颗内存颗粒,而地址总线需要连接4颗颗粒(不同的模组是不同的数目)。
另外,DDR的双数据率仅仅是数据总线可以在一个时钟周期的上升沿和下降沿传输数据,而地址总线依然是每个时钟周期只能传输一次数据。RDRAM却地址数据却可以在时钟的上升沿和下降沿都可以传输。
因此,RDRAM的地址总线和数据总线的负载是完全平衡的,而DDR SDRAM的地址总线和数据总线的负载则非常的不平衡,这种不平衡的结构也限制了DDR频率进一步的提升。
不过这并不是说串行总线就全面的超过了并行总线。由于RDRAM是串行总线,所以它的各个芯片距离内存控制器的距离是不同的,而DDR内存各个芯片距离内存控制器的距离是基本相同的。
通过主板的布局大致估计一下,使用DDR内存的主板的北桥到最内存模组最远端不过10厘米左右,而RDRAM最远端大约要50厘米左右。而电信号的传输速度大约是0.14m/ns,而PC1066的一个时钟周期只有1.88ns,因此距离不同的芯片对于指令的反应速度是有着明显的差别的。RDRAM的控制器会因此复杂一些,它需较近的内存颗粒等待较远的内存颗粒来达到同步,这个延迟时间被称为TPARAM。
在这个方面,RDRAM具有非常明显的优势。RDRAM采用了双16 bank架构(每两个bank共用一个放大器)因此其最大可以同时保持16个页面,根据使用的内存条以及颗粒的数据,同时打开的页面数目也不相同,如果使用4条8芯片RDRAM,那么理论上可以同时打开512个页面。而一般的DDR内存条中顶多具有8bank。可以同时打开的页面越多,RAS延迟时间就越少,内存性能就越高。
不过,这样比较还不够全面。还需要考虑芯片组以及内存的实际工作情况。为了降低RDRAM内存的功耗,并不是所有的颗粒都出于活动状态,一般只有4片颗粒处于活动状态,因此最大可以同时打开的页面只有64个,但是Intel 850E仅仅支持8个bank,因此RDRAM在这个方面几乎毫无优势可言。
因为Intel 845E芯片组最大支持8bank,而Intel 845G最大支持16bank,反而超过了RDRAM。从这个方面来看,RDRAM虽然具有如此的优点但是并没有得到芯片组厂商的支持,不能不说是个悲哀。
其实前面讨论如果展开的更深入的话,我们还可以知道关于RDRAM更多的优势和缺点。比如,RDRAM的串行结构可以有效的解决高频率工作状态下的反射杂波对于正常信号的影响,另外也能有效的解决阻抗匹配的问题。不过也正是因为串行结构,使得RDRAM最大只能支持32个芯片,而不同芯片组可以支持32-48个DDR芯片。
由于RDRAM模组是16bit,而颗粒也是16bit的,因此每片芯片都可以独立的工作,而DDR内存模组需要8片或者更多的内存颗粒协同工作才能提供所需的64bit数据带宽。这也是串行结构对于芯片的要求,在具有串行结构所带来的优点之外,也带来的发热量过大的缺点。因为要提供串联的所有芯片共同工作,则需要提供较大的电流,而处于并联模式的DDR芯片需要的电流因此会小很多,这样RDRAM功耗就会明显的高于DDR SDRAM,所以我们所看到的RDRAM全都采用了散热片,而只有很少的DDR模组采用了散热片。
这就是为什么前面我们提到RDRAM一般仅仅维持4个RDRAM芯片处于活动状态,其它的芯片当需要的时候再“激活”。这样降低了功耗却增加了延迟……
通过上面的分析,我们可以知道无论是DDR还是Rambus都不是完美的,包括Intel对于Rambus的支持也不够完全,而且通过这些对比,Intel转而选择DDR也并不是意味着其选择了“简单”,DDR的确具有一些Rambus所不具备的优势。
不过,DDR由于各个方面的限制,其频率已经很难进一步的提升了。这是业界对于DDR400始终保持观望态度的主要原因。虽然目前为止,没有一家芯片组厂商正式宣布对于DDR400的支持,但是以三星为首的内存厂商还是坚决的推出了DDR400的相关产品。对于DDR用户来说,在新型内存推出之前,这是唯一的提升系统内存带宽的途径。