首 页   新闻 | 行情 | 评测 | 调研 | 数码导购 | DIY | 专题 | 报价 | 论坛 | 二手 | 下载 | 博客 | 商城 | 拍卖 | 网址 | 分类
消费数码 手机 数码相机 MP3 MP4 数字家庭 硬 件 CPU 内存/硬盘 主板 显卡 音箱 机箱/散热器 光磁 显示器 游戏库 电影 音乐 小游戏
电 脑 笔记本 电脑 服务器 办公外设 打印机/耗材 键盘/鼠标/摄像头 投影机 企 业 中小企业 网络设备 方案 安全 克丽发现
产 品 价格查询 产品大全 排行榜 术语 产品论坛 图搜 厂商 经销商 商家库 商情快报 商城 活 动 PC采购攻略 模拟攒机 DELL直销店
中关村在线 - 大中华区 最具商业价值的IT专业网站 - The most valuable and professinal IT business website in Great China
ZOL首页 > 评测中心 > 技术评测       查看全部技术评测文章

拨云见日——深入彻底了解AMD64架构

类型:编译 作者:【中关村在线 新人类】 日期:2003-09-23 14:57:27




内容导航
K7和K8 解码器(Decoders)和管线(Pipelines)的区别

      现在让我们来比较K7和K8 。在文章的前面部分我们曾经说到管线有几个,甚至更多的层。它们与解码器有更深层次的接触,特别是解码器的命名无论从质量还是数量来说都有了很大的改变 。

      为了让大家更加明确地了解到改变,现在先让我们看看K7解码器。在之前让我们描述一下什么是解码器,"decoder"(解码器)术语被使用在K7架构的很多地方:

  1. Predecoder -- 在指令写入I-cache之前对它们进行分析,检测它们的起始和结束地址,前缀位置和解码类型(DirectPath 和 VectorPath;这将在后面解释)。所有这些内容都储存在L1 cache 的特定解码阵列bits里。同时它会认识"goto"指令,并预备分支选择器来选择快速的预测,并goto转到检测到的地址。Prerecording 在速度不快过4 bytes/时钟的时候将开始作用。

  2. Decoder(解码器)本身 -- 从I-cache 读取 x86 指令 到mOPs,并进行转换排列和标记 。

     我们能够在K7的解码过程中看到它包含了一系列的操作,这里我们称"decoder"没有进行深层次的挖掘。现在让我们澄清在#1提到的DirectPath 和 VectorPath 术语究竟是什么意思。K7 的解码器能够通过DirectPath 或者 VectorPath 来处理x86 指令。前者,DirectPath 仅处理转换为单个mOPs的x86 指令 。

     其它的指令则由VectorPath 处理,并把它们转换为连续的两个或者更多的mOPs 。在这些指令中(包括最复杂的整数分割/integer division)都使用了Microcode Engine 。通过内建的表单,它能够把x86指令放到mOPs 序里面。

     让我们检测一下K7 decoder和pipeline 的运作:


  • 1.FETCH(取):predecoder(预解码器)从I-cache 读取16 bytes ,并同步检测将要进行fetch(取)的下个段 。顺便说一下,K8也是读取16 bytes 的。在特定的情况下(如果x86指令大于16/3 bytes),这个阶段将变为限制的因素之一。 平均的x86指令容量在5-6 bytes 。

  • 2.SCAN(扫描):预先排列好的Decode Array(解码阵列)被分开,并分别通过DirectPath 或者VectorPath。超过6个单独的指令将发送到DirectPath,若只有单个指令将进入VectorPath和Microcode Engine 。

  • 3.ALIGN1(排列):在这个阶段,可以缓冲超过9个DP指令(超过24 bytes) 。其中3个的每个时钟将发送到三个信道执行。信道的数字(0/1/2)被分配给mOP DP 指令,并转换为需要的子阶段。该阶段的总共性能是3DP 指令/时钟。VectorPath 指令也通过这个阶段,并保持在解码器的mOP顺序,并输出到相应的源指令顺序。VectorPath 指令立即占据了三个解码器的信道,但并不和早前DirectPath 指令联合。如果最后一个时钟少于3个DirectPath,那么空信道仍旧是空的。 

     下面让我们停下来讨论一下VectorPath 指令的弱点 --- 它的宽度占据了3个解码信道,因此不允许DP 解码器并行工作。其实VectorPath 指令本身并不"坏" -- Microcode 引擎 以3倍 mOP/时钟 的速度运行,如DP 解码器一样。在这个VectorPath 的mOP就像DirectPath 一样,产生超过10个的复杂指令(例如division (分割),很多系统指令)。VectorPath 是相当不错的解决方案,在"triplet" 中,VectorPath起到了辅助的作用:

  1. 如果VP指令在一线的第一位(有第0个位置),那么它将直接到Microcode Engine 产生mOP 系列(使用它的表格)。Mops以三个为单位输出,如果最后triplet 有少于三个mOPs,空的则分配NULL -ROP 。单元的另外两个指令则通过向左移(到0位置),然后下个指令则附加到3个。

  2. 如果VP指令并不是一线的第一位,那么上述的DP指令将被首先解码,而空的mOP位置则被分配NULL-ROP 以补足3个。然后它再进行和前面一样的工作 - VP 指令在下一行被处理。

  • 4.ALIGN2

  • 5.EDEC

  • 6.IDEC

  • 7.SCHED

  • 8.EXEC

    下面让我们列举一下FP指令的各个阶段。

  • 7.STKREN

  • 8.REGREN

  • 9.SCHEDW

  • 10.SCHED:

  • 11.FREG

  • 12-15.FEXEC1-4

    所有这些阶段都是K7里面的,而对于K8目前的资料还不详细。但是从以下我们还是可以看到K8与K7的区别:

  1. FETCH1 (对应K7的 FETCH )
  2. FETCH2
  3. PICK
  4. DECODE1
  5. DECODE2
  6. PACK
  7. PACK/DECODE
  8. DISPATCH (对应K7的IDEC)

 



内容导航:
第4页: K7和K8 解码器(Decoders)和管线(Pipelines)的区别


资料来源:编译投稿
文章字数:1789
 
相关文章
采用Dothan的笔记本明年第一季度上市 (2003-10-08)
Intel被AMD所迫,新推出Xeon DP 3.2G (2003-10-08)
Intel高端产品缺货,DDR内存价格下挫 (2003-10-08)
2003年9月CPU市场用户喜爱度和价格分析报告 (2003-10-08)
节内毒龙1600MHz狂缺,节后有望缓解 (2003-10-07)
AMD的Athlon64击败APPLE的PowerMac G5 (2003-09-30)
英特尔Xeon 1M缓存3.20GHz芯片下周出台 (2003-09-30)

短信中心
[图片] [铃声] [短语] [自写短信]
圣诞老人来了
圣诞夜歌
平安夜圣诞歌
朋友(臧天朔)
I love you
First love
世界杯主题曲
谁让你流泪
精品/专题

联想“蓄谋”液晶风暴

联想智存卡-纤巧轻薄、智慧随身

让游戏做主--暑期主流显卡评测--A卡篇

让游戏做主--暑期主流显卡评测--N卡篇
当前栏目最新文章
好马配好鞍--64-bit 操作系统全接触
华硕上演X战警II 支持双至强PC-DL测试
超强解析-四大品牌八款主流散热器横向评测
决战的日子:AMD Athlon 64 @ Athlon64 FX
ZOL最新奉献--10款N卡火拼17款最新游戏
拨云见日——深入彻底了解AMD64架构
865PE主板待购者必看,内存对比测试满汉全席
左萦右拂,最大限度压榨威刚DDR500内存潜力

ZOL简介 | 用户注册 | 广告服务 | 人员招聘(月) | ZOL历程 | 互动营销中心 | 站点地图 | 联系方式 | 欢迎投稿 | RSS订阅 | 友情链接
北京海淀区知春路113号银网中心A座9F 传真:010-62529275 反馈留言板 欢迎批评指正
Copyright © 1999 - ZOL. All rights reserved. 中关村在线 版权所有. 京ICP证010391号