作业帮 > 综合 > 作业

PIV什么意思?

来源:学生作业帮 编辑:大师作文网作业帮 分类:综合作业 时间:2024/11/13 21:17:23
PIV什么意思?
PIV什么意思?
自8月下旬在IDF演示1.5Mhz的Pentium 4以来,有关Pentium 4的消息一直是网上的热门讨论话题.毫无疑问,在Pentium 4微架构设计中有很多突破和创新,但市场才是它真正的试金石,人们更关心在现实应用中Pentium 4的性能究竟如何?
此次,我们共挑选了三种不同的平台(奔腾IV 1.5Mhz,Pentium 3 1GHz和Athlon 1.2 Ghz),六种不同的基准测试配置,几十种基准测试程序,从高端CAD,DTP,市场上常用的各种工具软件,直到最新最热门的游戏,全面测试和比较了浮点/整数性能,音频和视频编码,3D动画和渲染,以及Open GL和Direct X性能.为了更好的理解令人吃惊的比较结果,还对Pentium 4的微架构设计和各类应用特点作了简要评述.以下让我们分别加以介绍.
Pentium 4的浮点和整数性能
Intel在奔腾IV的设计中不是走加强x87浮点处理单元FPU的路子,而是不断扩充MMX,SSE1指令直到Pentium 4中128位浮点双精度运算SSE2指令,对浮点/多媒体应用提供了强有力的支持.但相对而言,Pentium 4中FPU功能较弱,以下是几点理由:
1.FXCH指令(用于交换堆栈模式的数据)在Pentium 4中比Pentium 3中受到更多限制,每个周期只能发射一条指令到FXCH执行流水线.比如,在FXCH指令发射后紧跟着一条FMUL指令,则必须等到FXCH指令执行结束,FMUL指令才能进入流水执行单元,由此造成实际的物理时延.
2.FMUL不是全流水线单元,并且,FADD和FMUL单元的时延均大于Pentium 3中的时延,分别是5周期和至少6周期(Pentium 3中为3周期和5周期),影响了浮点处理速度.
3.Pentium 4中有两个FPU单元,一个是FADD和FMUL,另一个是FSTORE和FLOAD,理论上每个周期只能执行一个浮点加或是一个浮点乘,而Athlon中是三个FPU单元,每个周期可同时执行一个浮点加和一个浮点乘.
Pentium 4要实现优异的FPU性能,必须对浮点密集应用进行SSE1或SSE2优化,否则只能提供普普通通的浮点性能,正Linpack浮点测试结果所示.请特别注意256KB前的浮点性能,Pentium 4和Athlon都将L1或L2 Cache集成到在管芯上,因此具有最低时延和充分的带宽.Pentium 4仅在120KB和230KB附近接近Athlon 1100的性能,在230KB和380KB之间,Athlon 1100再次领先Pentium 4,这是因为Pentium 4只有256KB L2 Cache,必须经常访问内存,而Athlon是独占式Cache设计缓存容量为384KB空间的缘故.随矩阵容量增加,Pentium 4充分发挥了双通道RDRAM双倍带宽的优势,性能远远超出Athlon.
显然,Athlon 1200Mhz三个FPU单元的浮点性能超出Pentium 4,以下FPUmark测试可进一步确认这个结论.从FPUmark浮点测试结果可以看出,超频到1.6Mhz的Pentinum 4才略胜Athlon 1100一点,这印证了我们的看法,Intel聚焦于SSE2而不是提供更好的x87 FPU性能.
整数性能应该是Pentium 4的强项.天才的双频ALU设计,快速执行引擎,尤其考虑到126个upos的动态指令窗口和新访问算法的L1数据Cache,是迄今最强有力的整数执行引擎.然而,由于追踪Cache每时钟周期仅能发射3条指令,限制了Pentium 4每时钟周期仅能支撑3条整数指令.在运行单纯整数测试的CPUmark评价Pentiun 4时,所有的整数处理能力似乎都消失了(附CPUmark整数性能测试结果).
分支误预测仍是Intel最弱的一环.分支预测发生在流水线的第一段,如果处理器误预测了一个分支,它必须从流水线中冲掉在错误分支方向上执行的全部指令,然后在正确的程序分支方向上重新启动指令执行和处理.流水线越长分支误预测造成的性能损失越大,20段的超流水线不仅是19个周期的分支误预测惩罚,我们还发现Pentium 4的分支预测器并不象演示声称的那样近乎完美.尽管理论上Athlon的分支预测器逊于Pentium 4,但“相对短”的10段整数流水线,使Athlon 1200全面超越Pentium 4.
简而言之,根据设计性能和综合基准测试结果,Athlon有更强的FPU能力,而Pentium 4有迄今最好的内存子系统,Intel还有最强的整数处理能力,但由于超流水线和显著的分支误预测惩罚破坏了在某些代码样品上的优势.