Tya1/w4 DDR3 800-2133内存深度对比测试
RDi]2 泡泡网内存频道11月7日 1982年Intel发布了8086的继任者80286处理器,首款可插拔的SIMM(Single In-lineMemory Modules)内存(RAM,Random Access Memory)也相继诞生,虽然产品容量只有256KB-2MB,但对于当时的处理器完全可以满足计算的需求,时隔30年内存已经发展到DDR3,桌面消费级已经达到了单条8GB的容量,而服务器版本单条最高可达32GB。
`Bp.RXsd* Ad8n<zt| 内存容量和频率成千上万倍的扩展,使得其很难对CPU的性能发挥构成瓶颈,而内存也渐渐退居
DIY二线。在内存容量饱和的今天,人们的关注点逐渐向内存频率倾斜。回到目前Intel和
AMD的桌面CPU,Intel最新Ivy Bridge官方支持频率为DDR3 1600,而
AMD的FX打桩机和Trinity APU都稍高一些为DDR3 1866,这基本都代表了DDR3内存的基本盘,而现在DDR3 2133也基本降到了合理价位,成为市场的新主流。
~O0 $Suv 在容量饱和后,对于用户来说追求更高的内存频率,一直是中高端DIY用户的出发点。其实一直以来我们对内存的认识都存在一定的误区,首先影响内存性能的不仅仅是内存的频率,例如内存时序;另外更高的内存频率相对于目前已经饱和的内存带宽来说并不会带来实质的性能提升,而本文将着眼于内存频率、内存时序、内存带宽以及应用程序和游戏性能的表现来探讨用户的实际内存需求。
)JLdO*H 内存时序参数介绍
?k&Vy 在测试内存频率、内存时序、内存带宽以及应用程序和游戏性能的表现之前,我们还是来简要的介绍下内存的性能与规格表现,对于熟知的内存频率我们就不再这里赘述了,毕竟更高的内存频率可以获得更高的理论数据带宽。
_x'6]f{n 那么影响内存的性能的就剩下了内存时序,当然主板以及CPU也会对内存的性能发挥产生一定的影响。内存在与CPU建立通讯和数据传输时,为了保证数据传输的配对需要一个响应时序,根据JDEC的DDR3内存规范,影响这个响应时序的参数包括CL、tRCD、tRP、tRAS四个参数,它们的响应时间都是以整数周期来计算的。当然影响上述四个参数,其余的tRC、tRFC、tRRD、tWR等参数也会影响到内存性能发挥。
F=e8 IUr ●
tCL(CAS Latency Control)
IGQaDFr tCL是内存读写操作前列地址控制器的潜伏时间,也就是说CAS控制器从接受一个指令到执行指令之间的时间,很显然tCL周期数越短,那么对于传输前的时间效率利用率更高,不过这会引发一个问题就是会加大数据的丢失的几率,所以tCL并不允许工作在超低的时序下。
jyUjlYAAv` ●
tRCD(RAS to CAS Delay)
TH&U
j1 tRCD代表行寻址到列殉职的延迟时间,当然也是数值越小越好。对内存进行读、写或刷新操作时,需要在这两种脉冲信号之间插入延迟时钟周期。在 JEDEC规范中,它是排在第二的参数,降低此延时,可以提高系统性能。如果该值设置太低,同样会导致系统不稳定。
+>{2*\cZ5} ●
tRP(Row Precharge Timing)
m@2QnA[4 tRP代表内存行地址控制器预充电时间,同样预充电时间越短,内存性能越好,tRP用来设定在另一行能被激活之前,RAS需要的充电时间。tRP参数设置太长会导致所有的行激活延迟过长,较短的时钟周期可以更快地激活下一行。然而想要把tRP设置在较低的时钟周期对于大多数内存都有很高的要求,可能会造成行激活之前的数据丢失,内存控制器不能顺利地完成读写操作。
Uw. `7b>B ●
tRAS(Min RAS Active Timing)
QUc= &5 % tRAS代表内存行有效至预充电的最短周期,如果tRAS的周期太长,系统会因为无谓的等待而降低性能。降低tRAS周期会导致已被激活的行地址会更早的进入非激活状态。而tRAS的周期太短,则可能因缺乏足够的时间而无法完成数据的突发传输,这样会引发丢失数据或损坏数据。DDR3内存tRAS时序一般在:24-33个周期左右。
rdP[<Y9 内存SPD信息和Intel XMP技术介绍
gjwn7_ 和主板显卡一样,内存也有BIOS,我们习惯称之为SPD(Serial Presence Detect)信息,它是一颗8针的EEPROM芯片,容量只有256Byte,其中128Byte用于存储JEDEC规定的标准信息,其余部分留给厂商自定义数据,包括产品厂商产品型号等信息,另外著名的X.M.P信息也被存储在这里。除了以上信息,SPD里面还记录着内存工作频率、工作电压、速度、容量、电压与行、列地址带宽等参数。
x7&B$.>3 在平时使用时,尽管内存没有SPD芯片不会影响的正常工作,但如果内存有了SPD芯片,在启动计算机后,主板BIOS会读取内存SPD芯片中的信息,内存控制器会根据SPD芯片中的信息自动配置相应的内存工作时序与控制寄存器,从而可以充分发挥内存条的性能。
用于存储内存信息的SPD芯片
H?vdr:WlTN 而说起内存频率不得不说起Intel X.M.P(Extreme Memory Profile),由于JEDEC规范定义的内存频率无法满足高阶处理器用户的需求,早期内存超频需要手动设置频率、时序、电压等规格参数,比较麻烦,为了解决这一问题Intel通过在主板BIOS和内存SPD中授权一组更高的内存频率时序配置,只需在主板中开启X.M.P就可以获得想要的频率,当然X.M.P定义的频率都是经过内存厂商和主板厂商严格测试验证的。
3*"WG O5 在通过通过XMP认证的内存会在内存地址176--254Byte位置中记录内存的速度设定,最多可以保存2组设定值。显然如需要得到XMP的认证,厂商就必须把内存及该设定送交Intel测试,通过后就会给予认证。
t;}|tgC 当然对于发烧DIY玩家来说,Intel X.M.P技术没有多大的意义,毕竟这些设置在主板中完全通过手动设置,X.M.P技术并不会有任何的内存增加性能,不过对于普通高阶用户简化的设置能够更加容易上手,并且少去了一些繁琐的超频验证。
rNWw?_H-H( 除了Intel的X.M.P技术,AMD也将在未来推出兼容AMD芯片组主板的A.M.P(AMD Memory Profile)技术,原理基本和Intel相类似。
.+3g*Dv{& 测试平台和测试方法介绍
df4A RP+ 简要看完DDR3内存的时序和SPD信息后,接下来就开始正式的测试,我们知道JDEC官方的DDR3内存频率只有DDR3 1066、1333和1600MHz,现在的内存基本都是1333MHz起,随着工艺的进步,内存厂商为了增强产品的传输性能和增强市场号召率纷纷推出了超频版内存,DDR3 2400、DDR3 2666、DDR3 2800等规格的内存已经是屡见不鲜了。
:Uzm
为最大限度发挥内存的性能,测试使用了Intel新一代22nm Ivy Bridge处理器Core i7 3770K,搭配微星Z77A-GD80主板,产品超频最高可以支持双通道DDR3 2800内存,最大容量为32GB,当然主板支持Intel的X.M.P技术。
30#s aGV 而显卡方面选择了技嘉N680OC-4GD,产品基于NVIDIA Kepler GK104核心,采用28nm工艺,拥有1536个流处理器,核心默认频率1072MHz,BOOST频率1137MHz,并配备4GB GDDR5显存,相比公版有不小的提升。
(&F}/s gbi 内存方面自然是本次测试的重点,选用了美光铂胜智能探索者BLT2CP4G3D1869DT2TXRG(以后全部用美光DDR3 1866代替),产品内置一组X.M.P内存配置,规格为DDR3 1866,时序为9-9-9-27,电压也为标准的1.5V,美光内存在
DDR2时代的D9颗粒已经是如雷贯耳,新的美光DDR3 1866内存颗粒也采用了D9前缀命名,以延续超频传奇。
%+W{iu[| 美光DDR3 1866内存可以以9-9-9-27的时序稳定工作在DDR3 2133,而本次测试高频部分全部采用了超频设置来完成的。
|P
HT694Uz 内存测试共涉及DDR3 800、DDR3 1066、DDR3 1333、DDR3 1600、DDR3 1866、DDR3 2133,每个频率下都包含多组的测试时序。
O>bC2;+s ●
说明:接下来的所有测试数据都未经过手动修正使其符合惯性的测试规律,甚至一些可以明显的看出不合理。毕竟对于内存这种细微差别的测试(实际测试中,使用了三遍取平均值),每个数据没有几十次的测试很难获得可靠度较高的数据,由于时间限制无法做出更精确的测试,而本文的要点则是从这些数据中找出普遍的规律。
#4Rx]zW^% 基准测试:AIDA64内存带宽和延迟
dk#k bG; 与其它内存不同的是,美光DDR3 1866内存板载多颗LED发光灯,用户可以自定义发光模式,而在本次测试中LED发光灯还有另外一个作用就是监控内存的负载,闪光灯会根据内存负载状况通过LED的闪动频率对应表达,最高负载时内存LED频率闪动高到肉眼无法分辨,给人的错觉就是长亮。
=vCY?I$P 首先还是进行内存测试必备的AIDA64内存带宽测试,测试我们选取了读取带宽、写入带宽和延迟三个类别的数据。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589399.jpg[/img]
)hn6sXo+ 首先展示的一组AIDA64内存读取带宽测试数据,基本呈现两个特征,随着频率提升带宽持续稳定上升,另外同频率下随着时序的周期数增加,带宽会出现下降趋势。
C\Wmq
[ 其中最低的DDR3 800 8-8-8和最高的DDR3 2133 8-8-8带宽差了一倍还要多一些。另外总体说来内存频率比内存时序对能存带宽的影响更大一些。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589400.jpg[/img]
~ ?Qe?hB 接下来的AIDA64内存写入带宽测试数据,也基本呈现了上述的两个特征,不过在DDR3 1866频率全时序下,写入带宽出现了诡异的情况,竟然比DDR3 1600要低出不少,即使后来的DDR3 2133也比DDR3 1600稍逊一筹,目前对这一现象我们也无法给出确切的解释(猜测可能是其它内存参数Auto导致)。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589401.jpg[/img]
!21FR* 最后的延迟数据则很好的体现了时序对延迟的影响,当然频率依然占据了主要作用。
实时拍摄图片(点击可查看原始图片)
UJAv`yjG 实时拍摄视频
/ |;RV" 从实际拍摄的照片和录像来看(注意AIDA内存测试仅为开始一段,后面的测试为CPU 一、二、三级缓存的测试),AIDA64内存测试内存LED灯非常明亮,基本可以判定内存为满负载运行,也就是说内存频率或者时序仍然还强烈的影响着内存性能的发挥。
mW(W\'~_~ 基准测试:Super PI
FF`T\&u 接下来的测试Super PI测试看似和内存性能没有多大关系,但是只要和CPU计算相关的测试都和内存有密不可分的关系,测试中选择了传统的1M位模式,单位为s。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589402.jpg[/img]
m{Wu"
;e 我们知道Super PI是单核心参与的运算,理论上对内存带宽要求并不高,而实际测试中1M测试成绩基本和内存频率和内存时序并没有什么具体联系。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589403.jpg[/img]
K,;E5 如果说有些数据需要放大了看才能看出比例关系,那么接下来我们就一起来看看图标放大3倍、起始值为7s的图标表现(后文中所有测试表格数据差异不明显的全部添加一张放大3倍的图),进一步放大后,我们看到的数据依然和前面没有什么区别,相近的测试成绩并没有任何的上升趋势。
实时拍摄图片(点击可查看原始图片)
F4-$~v@ 实时拍摄视频
再来看看运行Super PI 1M时的内存负载和实时录像吧,从图片和视频可以看出运行Super PI 1M时内存的负载并不高,至少可以说明内存的传输带宽没有对其计算性能发挥构成瓶颈。
In"ZIKaC 基准测试:CineBenchmark 11.5
YNyk1cE 如果说单核计算不能充分利用内存的带宽,那么接下来选取的测试CineBenchmark 11.5则可以充分调动Core i7 3770K四核八线程的威力,挖掘出内存的传输带宽。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589404.jpg[/img]
hP%M?MKC 从上图的实际测试对照表中我们似乎也没有发现从DDR3 800到DDR3 2133频率CineBenchmark 11.5得分的提升,而内存时序的变化的影响也被淹没在里面。整个测试成绩都在7.37--7.57pts狭小范围内波动。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589405.jpg[/img]
T9E+\D 接下来还是照例拿出三倍比例放大图,如图我们似乎看到CineBenchmark 11.5得分随着内存频率和时序的变化呈现阶段性的增长,只是这种增长非常缓慢。
实时拍摄图片(点击可查看原始图片)
6RU~"C 实时拍摄视频
~|DUt 最后我们来看看内存负载照片和截图的表现,内存LED灯较Spuer PI负载时闪动频率低了一些,不过亮度却比Spuer PI高了不少,而这说明CineBenchmark 11.5相对来说需要更高的内存带宽,但是对传输延迟要求更低一些。
YlJ@XpKM 应用测试:WinRAR解压缩
<y('hI' 除了常规的Benchmark性能测试,接下来进行的是WinRAR解压缩测试,当然为了保证测试的最小误差,测试依然使用了WinRAR自带的测试工具。
[img]http://img5.pcpop.com/ArticleImages/0x0/2/2589/002589406.jpg[/img]
2G& a{ 从上述表格可以看出随着频率和时序的变化,WinRAR解压缩性能得到了显著的提升,这充分说明WinRAR对内存频率和时序有着强烈的依赖,测试成绩最低额DDR3 800 8-8-8成绩为5310KB/s,而成绩最高的DDR3 21338-8-8达到了9235KB/s,性能提升接近一倍了。鉴于巨大的差异,这部分就不再放上3倍放大图表。
实时拍摄图片(点击可查看原始图片)
"+R+6<