和Bay trail到Cherry trail的提升不太一样,Cherry trail到APL的提升可以说是十分全面的,下面我来为大家总结一下APL提升的地方:
首先是一张Goldmont微架构图:
其中FEC属于前端,IEC/FPC/MEC属于后端,另外还有缓存子系统。
从前端的情况看,整个处理器的宽度提高了大约50%。
③ 更宽的乱序执行窗口,这意味着处理器可以在更多的指令之间寻找并行关系,并能提供更多潜在的IPC。
④ 完全的乱序执行,Goldmont可以让IEC,MEC,FPC内部和之间的指令完全的乱序执行,也就是实现了完整的乱序执行技术,而他的前任silvermont只允许IEC部分的指令完全乱序执行,每个FPC scheduler本身是顺序执行(FPC和IEC以及MEC之间可以乱序执行),每个MEC scheduler本身也是顺序执行(FPC和IEC以及MEC之间可以乱序执行,所以silvermont只是严格的整数乱序执行,FP和memory是不完全乱序执行。Silvermont之前的Atom架构是严格顺序执行。
⑥ FPC内部执行延迟降低:Goldmont继续保持了和silvermont一样的128bit-wide SIMD支持(SSE级别,Core 是***X级别目前是256bit-wide明年是512bit-wide),但是SIMD指令和浮点指令的执行延迟大大降低,很多浮点指令和SIMD指令的延迟和输出能力(受益于延迟的降低和执行单元更合理的分配)都降低/提高了33-50%不等。
⑦ 特定场景加速:Goldmont在Hash和加密上提供了史无前例的硬件加速,AES加速指令级的延迟和输出对比前代都大幅度改善。Goldmont是目前第一个支持Intel SHA加速指令集的处理器(Zen和CannonLake将会在未来也支持),可以为SHA1/SHA256提供硬件加速,这些算法在浏览网页,以及需要加密的场合尤为重要。
⑧ Pause等指令级延迟降低,以获得更高的能效。
综上所述,APL所使用的Goldmont架构CPU相比于之前的Airmont/Silvermont,增加了发射宽度,提高了乱序执行,整体的IPC可以提高30-50%。当然,总体性能和频率也有很大关系。
当然,braswell的总体频率稍微高于APL一些,而Cherry trail的总体频率则也是低于Braswell的(虽然他们CPU架构相同)。
》》》》》》》Part.5 更新日志和天梯图《《《《《《《
一年一度的大版本更新,这个版本一共新加了将近250个型号,远古型号也补充到了Pentium II时代,算是初步实现了“最全”天梯图的愿望,也实现了对一些骨灰级吧友的承诺,当然问题肯定也是存在的,如果有错误或者纰漏还请大家指出来,谢谢!
这次的更新日志很庞大,希望大家不要看花眼。。。
改进天梯图整体UI,更扁平化,放大部分区域字体;
标尺上限扩展到700%+,放大1%~10%区域;
新增AMD K6-2系列数据样本(预测);
新增AMD K6-III系列数据样本(预测);
新增AMD Athlon系列数据样本(预测);
新增AMD Duron系列数据样本(预测);
新增AMD AthlonXP系列数据样本(预测);
新增AMD E1-6010(预测)移动数据样本;
新增AMD X4 840(预测)数据样本;
大幅修正AMD FX-7600P(预测)移动数据样本位置;
新增AMD FX-7500(预测)移动数据样本;
大幅修正AMD A10-7300(预测)移动数据样本分类位置;
新增AMD A8-7100(预测)移动数据样本;
调整大量高亮标记型号;
V3.50版天梯图正式版预览图如下
》》》》》》》楼下还有内容,各路大神麻烦不要插楼,谢谢《《《《《《《
和Bay trail到Cherry trail的提升不太一样,Cherry trail到APL的提升可以说是十分全面的,下面我来为大家总结一下APL提升的地方:
首先是一张Goldmont微架构图:
其中FEC属于前端,IEC/FPC/MEC属于后端,另外还有缓存子系统。
从前端的情况看,整个处理器的宽度提高了大约50%。
③ 更宽的乱序执行窗口,这意味着处理器可以在更多的指令之间寻找并行关系,并能提供更多潜在的IPC。
④ 完全的乱序执行,Goldmont可以让IEC,MEC,FPC内部和之间的指令完全的乱序执行,也就是实现了完整的乱序执行技术,而他的前任silvermont只允许IEC部分的指令完全乱序执行,每个FPC scheduler本身是顺序执行(FPC和IEC以及MEC之间可以乱序执行),每个MEC scheduler本身也是顺序执行(FPC和IEC以及MEC之间可以乱序执行,所以silvermont只是严格的整数乱序执行,FP和memory是不完全乱序执行。Silvermont之前的Atom架构是严格顺序执行。
⑥ FPC内部执行延迟降低:Goldmont继续保持了和silvermont一样的128bit-wide SIMD支持(SSE级别,Core 是***X级别目前是256bit-wide明年是512bit-wide),但是SIMD指令和浮点指令的执行延迟大大降低,很多浮点指令和SIMD指令的延迟和输出能力(受益于延迟的降低和执行单元更合理的分配)都降低/提高了33-50%不等。
⑦ 特定场景加速:Goldmont在Hash和加密上提供了史无前例的硬件加速,AES加速指令级的延迟和输出对比前代都大幅度改善。Goldmont是目前第一个支持Intel SHA加速指令集的处理器(Zen和CannonLake将会在未来也支持),可以为SHA1/SHA256提供硬件加速,这些算法在浏览网页,以及需要加密的场合尤为重要。
⑧ Pause等指令级延迟降低,以获得更高的能效。
综上所述,APL所使用的Goldmont架构CPU相比于之前的Airmont/Silvermont,增加了发射宽度,提高了乱序执行,整体的IPC可以提高30-50%。当然,总体性能和频率也有很大关系。
当然,braswell的总体频率稍微高于APL一些,而Cherry trail的总体频率则也是低于Braswell的(虽然他们CPU架构相同)。