首 页   新闻 | 行情 | 评测 | 调研 | 数码导购 | DIY | 专题 | 报价 | 论坛 | 二手 | 下载 | 博客 | 商城 | 拍卖 | 网址 | 分类
消费数码 手机 数码相机 MP3 MP4 数字家庭 硬 件 CPU 内存/硬盘 主板 显卡 音箱 机箱/散热器 光磁 显示器 游戏库 电影 音乐 小游戏
电 脑 笔记本 电脑 服务器 办公外设 打印机/耗材 键盘/鼠标/摄像头 投影机 企 业 中小企业 网络设备 方案 安全 克丽发现
产 品 价格查询 产品大全 排行榜 术语 产品论坛 图搜 厂商 经销商 商家库 商情快报 商城 活 动 PC采购攻略 模拟攒机 DELL直销店
中关村在线 - 大中华区 最具商业价值的IT专业网站 - The most valuable and professinal IT business website in Great China
ZOL首页 > 评测中心 > 技术评测       查看全部技术评测文章

挑战全新极限-P4EE 3.4G完全对比测试

类型:编译 作者:【中关村在线 新人类】 日期:2004-02-04 14:44:13




内容导航

 

新增13个指令 - SSE3

    在IDF,我们知道13个新的指令将随同Prescott 面世,当时这些指令被称为Prescott New Instructions(PNI),并不确信一定是SSE3,这些新的指令如下:

    FISTTP, ADDSUBPS, ADDSUBPD, MOVSLDUP, MOVSHDUP, MOVDDUP, LDDQU, HADDPS, HSUBPS, HADDPD, HSUBPD, MONITOR, MWAIT

    这些指令主要被使用在以下的范围:

  • x87 到整数的转换
  • 复杂的算法
  • 视频编码
  • 图形
  • 线程同步

    这些指令与Prescott 的其它改进部分并不相同,因为如果你想从中获得好处的话,就必须更新软件。应用程序也必须重新使用这些指令进行编译或封装,那么这些指令究竟有什么亮点呢?

    FISTTP 在x87浮点到整数的转换中非常有用,这主要适用于在浮点运算中没有使用SSE 的应用程序。

    ADDSUBPS, ADDSUBPD, MOVSLDUP, MOVSHDUP 和 MOVDDUP 主要是应用于“complex arithmetic”(复杂运算/复数运算)领域的指令。这些指令主要被设计为减少在进行复杂运算时候所产生的延迟。比如MOVE 指令,它主要用于把值装载到寄存器和与其它寄存器进行相加。其它的复杂运算指令在进行Fourier 转换和回旋操作的时候特别有用 - 在信号处理存储(例如音频编辑)或者繁重的频率计算使用非常普遍(例如声音的辨认)。

    LDDQU 指令是Intel 引以为傲的地方,它可以帮助加速视频编码,目前它已经被集成到了DivX 5.1.1 codec 。更多关于这个指令的信息,建议参考Intel 的开发者文档。

    根据开发者反馈的信息,Intel 决定增加以下的指令用于3D 应用程序(例如游戏):HADDPS、HSUBPS、HADDPD、HSUBPD。Intel 告诉我们,开发者们对此期盼已久,这些指令的出现简直让他们欣喜若狂,为此我专门访问了Epic Games Inc 的主要负责人(虚幻,虚幻竞技场,虚幻竞技场2003和2004 的作者) 。下面是我们的对话:

    :自从SSE 规范发布起,很多3D 程序员一直都希望能够有个点生成指令(就像阴影汇编语言中的dp4指令),而HADDP 正是点生成的运作。那么新3D 指令的发布,对你们的意义如何?

    :点生成是任何3D 程序场景最基本的操作,例如BSP 往返移动、游戏场景等。场景的转换,冲突检测等是衡量CPU 运算性能的重要组成部分。这些指令非常有用,并使游戏的性能获得很大改观。这些指令并非每个开发工程师都渴望需要的,但对于Intel 能够听取开发人员的意见则值得称赞。

   最后我们还有两个线程同步指令 - monitor和mwait 。这两个指令协同使用,能够改进超线程的性能。根据设备驱动程序产生的空闲线程或者非生产性的线程,这些指令能够检测是否一个线程应该被发送到操作系统核心,然后通知操作系统在完成更重要的线程之后,关注这些线程。不过要值得注意的是,monitor 和mwait 都需要操作系统的支持,这意味我们只有等待Longhorn 或者windows 支持这两个指令的下个版本Service Pack 。

  Intel 没有说明是否经过简单的操作系统服务包更新就可以支持这些指令;而只是表示他们正在努力与Microsoft 合作,以期能够尽早获得支持。

  小结

  在这里,我们对Prescott 所有的微架构改变进行一下小结。

  • 在相同时钟速度的情况下,Prescott 的31 层管线使得它要比Northwood 慢。
  • Prescott 的L2 cache 虽然比Northwood 大,不过增加的延迟也导致了性能的下降。
  • 通过改进分支预测,调度表算法和整数执行,Intel 设法使增长管线带来的负面效果降到最低。
  • 大容量的L2 cache 帮助保持管线的满载率。
  • SSE3 指令大有前途,不过就今天的软件来说,性能提升可以忽略。
  • 把管线扩展到31层将帮助Prescott 在明年的时候,频率达到4 - 5GHz ,频率的提升使得Prescott 完全超越Northwood 。



内容导航:
第7页: 新增13个指令 - SSE3
第15页: OpenGL 性能
第17页: 全 文 总 结


文章字数:1569
 
相关文章
挑战全新极限-P4EE 3.4G完全对比测试 (2004-02-04)
新春第一弹!478针Prescott P4E国内首测 (2004-02-04)
650流明!梦想家钻石珑X650黄金版评测 (2004-02-03)
重返NV总部---技嘉三款A/N主流显卡测试 (2004-02-03)
全格式DVD刻录发飙!LG4081B新春提速 (2004-02-03)
新年新气象--似火车头的技嘉天鼎机箱 (2004-02-03)
新多媒体标准---微星5200 NPC深度测试 (2004-02-02)

短信中心
[图片] [铃声] [短语] [自写短信]
圣诞老人来了
圣诞夜歌
平安夜圣诞歌
朋友(臧天朔)
I love you
First love
世界杯主题曲
谁让你流泪
精品/专题

七款主流FX5700横测

今冬nVIDIA显卡急速性能体验

微软新银光鲨使用手记

微星杯DVD刻录机采购专题
当前栏目最新文章
挑战全新极限-P4EE 3.4G完全对比测试
新春第一弹!478针Prescott P4E国内首测
650流明!梦想家钻石珑X650黄金版评测
两大阵营,8款Athlon 64主板大比拼!
四强争霸:A64平台专题测试之芯片组篇
2003年度风云产品推荐—键盘,鼠标,套装
2003年度风云产品推荐—电源
2003年度风云产品推荐—准系统

ZOL简介 | 用户注册 | 广告服务 | 人员招聘(月) | ZOL历程 | 互动营销中心 | 站点地图 | 联系方式 | 欢迎投稿 | RSS订阅 | 友情链接
北京海淀区知春路113号银网中心A座9F 传真:010-62529275 反馈留言板 欢迎批评指正
Copyright © 1999 - ZOL. All rights reserved. 中关村在线 版权所有. 京ICP证010391号