分类
Cache(三级快取),分为两种,早期的是外置,以后的升级产品都是内置的。而它的实际作用即是,L3快取的套用可以进一步降低记忆体延迟,同时提升大资料量计算时处理器的性能。降低记忆体延迟和提升大资料量计算能力对游戏都很有帮助。而在伺服器领域增加L3快取在性能方面仍然有显着的提升。比方具有较大L3快取的配置利用物理记忆体会更有效,故它比较慢的磁碟I/O子系统可以处理更多的资料请求。具有较大L3快取的处理器提供更有效的档案系统快取行为及较短讯息和处理器伫列长度。
AMD FX 8150CPU拥有8M三级快取其实最早的L3快取被套用在AMD发布的K6-III处理器上,当时的L3快取受限于製造工艺,并没有被集成进晶片内部,而是集成在主机板上。在只能够和系统汇流排频率同步的L3快取同主记忆体其实差不了多少。后来使用L3快取的是英特尔为伺服器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3快取的Itanium2处理器,和以后24MB L3快取的双核心Itanium2处理器。
但基本上L3快取对处理器的性能提高显得不是很重要,比方配备1MB L3快取的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端汇流排的增加,要比快取增加带来更有效的性能提升。
二级快取价格
首先来算一笔小账(2009年02月),关于Intel处理器的二级快取:
二级快取512K的赛扬双核E1200只要270元,二级快取1M的奔腾双核E2140售价为370元,需要花费100元来购买这额外的512K快取;二级快取2M的酷睿2 E4300或者奔腾双核E5200的售价在550元以上,这就意味着得再出200元来购买这额外的1M二级快取;二级快取3M的酷睿2E7200售价750元,又得掏出200元来购买这额外的1M二级快取;二级快取4M/6M的酷睿2系列处理器依次类推……
不管酷睿2、奔腾双核还是赛扬双核,他们的核心架构其实是完全相同的,频率可以随意变更,唯一不同的就是二级快取。可以毫不夸张地说,Intel就是在卖二级快取,200块钱1M。
事实上历年来Intel都是通过二级快取的大小来划分产品线,初期只有奔腾和赛扬两种规格,到了酷睿2时代Intel达到了登峰造极的境界:仅仅是双核产品就拥有512K、1M、2M、3M、4M、6M多达六个版本,四核产品也有4M、6M、8M、12M四个版本,令人眼花缭乱!Intel细分产品线的策略在每个价位都提供了优秀的产品,但也给广大使用者製造了前所未有的困惑:到底多大二级快取才够用?
二级快取发展
纵观英特尔处理器的发展,且不论核心架构如何改变,以级数成长的二级快取是最直观的。奔腾4时代0.18微米工艺的Willamette拥有256K二级快取,0.13微米的Northwood核心拥有512K,后期0.09微米的Prescott一度增大到1M。到了酷睿时代,在架构发生了翻天覆地的变化的同时,65纳米工艺让二级快取再次翻倍,即便是刚推出时低端酷睿的代表Allendale核心,二级快取也达到了2M,高端酷睿更是拥有4M的二级快取。进入45nm工艺后,二级快取的容量进一步加大,高端E8X00系列二级快取达到了惊人的6M,低端E7X00也达到了3M之多,至此Intel从512K到6M甚至12M实现了二级快取的"无缝衔接"。
市场中没有永远的落后者,当AMD进入45nm时代,Phenom II的到来,AMD也能通过核心数量和快取的搭配,设计出定位不同市场的CPU。
性能影响
而三级快取对性能影响时高时低。在游戏方面,提升三级快取的容量对游戏的性能影响很大,虽然对一般家用机没有什麽用,但是如果是网咖机或者是发烧机提升三级快取的容量还是会有显着的性能提升的。虽然三级快取也能为PC带来显着的性能提升,但毕竟三级快取是作用于伺服器的,对PC来说,三级快取还是只能做个辅助作用,在其他参数相同的情况下,三级快取容量越大,则性能更好,如果其他参数不相同的话,这时三级快取的作用就不明显了。
不管三级快取的作用大不大,它也是为电脑发展作出贡献的参数之一。
历程
纵观AMDPhenom处理器的发展,核心架构的改进相对有限,而三级快取的变化是最直观的。从早期Phenom的2MB三级快取,猛增至Phenom II的6MB三级快取,而为了市场的需要,又推出了採用Phenom II架构但没有三级快取的Athlon X4。而AMD处理器独有的双核、三核、四核架构,加上快取的不同搭配,一时间,AMD处理器呈现出门丁兴旺的景象。
从硬体系统配置看三级快取对于AMD的使用者来说,多是追求性价比的使用者,而AMD处理器这样的现象,对使用者即是好事也是坏事,好是使用者的选择更多了,坏的是使用者对CPU的选择无所适从。而细细观察,AMD处理器百龙争宠的现象,无外乎是核心与快取搭配的结果。
与65nm Phenom相比,新一代45nmPhenom II最大的变化就是升级到了45nm SOI沉浸式光刻生产工艺,好处就是主频更高、功耗更低、集成度更高,特别是三级快取从2MB猛增到了6MB!
三级快取翻了三倍,自然需要付出一定的代价,通过Phenom和Phenom II晶片示意图的对比,就能略知一二了:
Brcelona/Agena集成了4.68亿个电晶体,核心(Die)面积大约285平方毫米,Shanghai/Deneb的电晶体增加了62%,多达7.58亿个,但核心面积却减小了9.5%,只有258平方毫米,新工艺的好处可见一斑。
电晶体数量增加如此之多主要就是因为三级快取的大幅扩容,这部分在整个核心裏的面积比例也从大约六分之一提高到了足有三分之一。
其它
AMD关于三级快取的态度
第一,三级快取容量在伺服器领域的作用更明显,不过如果伺服器和桌面处理器採用不同的架构,必然会提高生产难度和成本,故而带到了桌面上;
第二,在桌面上,三级快取从2MB增加到6MB可以带来大约5%的性能提升,实际测试也证明了这一点;
第三,从前边的资料看出,三级快取增加了两倍,但得益于生产工艺的改进,核心面积反而更小了,成本也更低。
熟悉IntelNehalemCore i7(酷睿i7)处理器的人一定想到了,Intel也使用了同样的大容量共享三级快取设计,且容量多达8MB,也佔据了整个核心面积的三分之一左右,不同之处在于Core i7每核心一级快取和二级快取只有64KB和256KB,都比Phenom/Phenom II少一半。
有趣的是,同样基于45nm工艺的Core i7集成了7.31亿个电晶体,比Phenom II略少,但核心面积却稍大一些,为263平方毫米。
从成本的角度来算一笔帐,通过Phenom II X4的晶片结构示意图可以看出,三级快取所佔晶片面积比两颗核心以及L1L2加起来还要多,如此一来即便是禁止了一颗核心的Phenom II X3,其成本也并不低,这对于主打性价比路线的AMD来说,利润损失会比较大。
于是,AMD在发布Phenom II X4、X3处理器之后,也在积极準备定位主流中低端的产品,用以取代征战多年的Athlon 64 X2系列。由于L3成本较高,因此AMD把Phenom II X4的三级快取彻底删去(注意不是禁止),Athlon X4便与大家见面了。
如此一来,人们就可以通过对比评测,轻松了解到AMD的Phenom II架构处理器中,6M L3对性能的贡献有多大,也能提前了解拥有完整L3但却少一颗核心的Phenom II X3强呢,还是没有L3的但却有四颗核心的Athlon X4强?相信很多朋友都会挺感兴趣的。
AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),还有一颗神秘的没有L3的Athlon X4工程样品,让他们都工作在200*14=2.8GHz频率下,这样就能直观的对比6M/2M/0M三级快取所造成的性能差异。
另外还加入了刚刚发布的Phenom II X3 720处理器,它拥有完整的6M三级快取,但少一颗核心,这样可以反映出多一颗核心的贡献大还是6M L3的贡献更大?测试结果表明,从CPU架构上看,快取对性能的影响很大,但Athlon X4的表现,尤其是在大量运算过程中,力压上代拥有完整3级快取的9850,记忆体频宽的优势不言而喻。
Intel(16MB三级快取)6核处理器
首先推向市场的是高端桌面PC处理器品牌酷睿i7和针对高能效伺服器市场的Nehalem-EP,预计2009年第四季度即可上市。随后,新架构产品会陆续推出,包括针对可扩展伺服器市场的Nehalem-EX,桌面市场的Havendale和Lynnfield,移动市场的Auburndale和Clarksfield,预计都在2009年下半年登场。
下一代Core微架构(Nehalem)处理器均从4核起跳,但同时採用了Hyper-Threading技术,可同时处理8个执行绪。Core i7支持Turbo Mode和Power Gates技术,在不需要多执行绪运算时,可令闲置核心完全关闭。各个核心可以工作在不同的电压/频率下,单独提高某一核心频率的Turbo Mode模式可显着提升单执行绪套用性能。
Intel还同时发布了首款6核心处理器,针对多路伺服器市场的"Dunnington"Xeon X7460,内建16MB L3快取,在2008年9月上市,是Intel在转向Nehalem微架构之前的最后一颗45nm酷睿2微架构处理器。採用该处理器的伺服器机型已经打破了多项世界纪录,包括8路48核的IBM System x3950 M2伺服器在TPC Benchmark C资料库测试中首次突破100万tpmC,4路系统惠普Proliant DL580 G5打破TPC-C纪录,戴尔PowerEdge R900打破TPC-E纪录,Sun Fire X4450打破SPECjbb 2005纪录,富士通西门子PRIMERGY RX600 S4打破SPECint_rate2006纪录。
无三级快取AMD 45nm处理器
在工艺进步、技术完善后,AMD的45nm新桌面处理器将拥有齐全的五个子系列,其中拥有三级快取的属于Phenom II品牌,精简掉三级快取的则仍沿用Athlon品牌(不知道为何不是Athlon II)。至于Sempron品牌,很快就会退休了。
最高端的"Phenom II X4 900/800"系列四核心代号Deneb,二级快取4×512KB,三级快取前者6MB、后者精简到4MB。这两个系列都将于明年1月份率先发布,其中首批两款AM2+接口的Phenom II X4 940/920会在1月8日的CES 2009大展上首发,之后的全部改用AM3接口。
三核心系列"Phenom II X3 700"代号Heka,二级快取3×512KB,三级快取为完整的6MB,将在明年2月份跟进。
除了这两个系列,AMD还準备了没有三级快取的版本,而且在设计之初就没有加入三级快取,而不是简单的禁止版本,不会造成浪费。
其中四核心将是"Athlon X4 600"系列,代号Propus,二级快取4×512KB,三核心是"Athlon X3 400"系列,代号Rana,二级快取3×512KB,二者都会在明年4月份登场。
最后是代号Regor的"Athlon X2 200"系列双核心,二级快取2×1MB,比其它系列多出一倍,不过发布时间也最晚,要到明年6月才会推出,目的是避免和现有的旧架构型号产生沖突。
晶片组方面,现在的AMD 7系列主机板在更新BIOS就能支持新处理器,具体视主机板厂商的技术支持而定。另外AMD将在2009年上半年推出新的8系列整合晶片组,其中RS880和RS880C搭配SB750南桥,RS880D和RS890搭配下一代SB800。 .
一级二级三级快取谁更重要
一级最重要,但是现在CPU的一级快取几乎都一样,所以忽略。
二级快取的话对于Intel的CPU是很重要的,Intel的CPU的二级快取越大性能提升非常明显,而AMD的CPU虽然二级快取也很重要,但是二级快取大小对AMD的CPU的性能提升不是很明显。
三级快取其实只是做了个辅助的作用,除了伺服器,其实对大多数家庭机没什麽用的,记忆体还是很重要的,但如果运行大型程式或游戏来说三级快取就显得重要了,目前新型CPU已经有三级快取了。
所以说现在衡量CPU性能除了频率外,还有一个核心数量,再到快取的大小, 从理论上讲,二级快取越大处理器的性能越好,但这并不是说二级快取容量加倍就能够处理器带来成倍的性能成长。2006年,CPU处理的绝大部分资料的大小都在0-256KB之间,小部分资料的大小在256KB-512KB之间,只有极少数资料的大小超过512KB。到2009年已经有1m,2m的了。所以只要处理器可用的一级、二级快取容量达到256KB以上,那就能够应付正常的套用;512KB容量的二级快取已经足够满足绝大多数套用的需求。
主频、二级快取和三级快取哪个更重要
快取的工作原理是当CPU要读取一个资料时,首先从快取中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从记忆体中读取并送给CPU处理,同时把这个资料所在的资料块调入快取中,可以使得以后对整块资料的读取都从快取中进行,不必再调用记忆体。
正是这样的读取机製使CPU读取快取的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的资料90%都在快取中,只有大约10%需要从记忆体读取。这大大节省了CPU直接读取记忆体的时间,也使CPU读取资料时基本无需等待。总的来说,CPU读取资料的顺序是先快取后记忆体。
cpu的二级快取和三级快取的大小,并不是衡量cpu的性能的唯一标準,还得看cpu的主频,製程,比如说45纳米的就比65纳米的好,还要稍微注意一下它支持的指令集,还得看是谁的产品,二级快取对于intel的产品来说很重要但二级快取对于AMD来说就不像intel那麽重要,因为AMD除了有二级快取之外还有三级快取。
要说主频、二级快取和三级快取哪个更重要,这个问题完全还要看你使用电脑追求什麽了,主要执行什麽任务。主频高运算速度快,二级快取(L2)和三级快取(L3)起到记忆体和CPU之间的缓沖作用,缓解记忆体和CPU速度不匹配问题起到提高CPU执行效率。所以大L2、L3在CPU长时间大量资料处理的时候效率会比较高。高主频在短时间内少量资料的处理上会比较快,其实3项这都很重要 ,哪一项达不到一定标準都会出现瓶颈效应。
IntelXeon 7100系列CPU(16MB三级快取)
Intel正式发布了针对高端伺服器的最新双核Xeon处理器,代号Tulsa的Xeon 7100系列。该处理器依然基于上一代NetBurst架构,但在性能和功耗表现方面都有不小的改进。
Xeon 7100系列CPU配置
Xeon 7100系列CPU核心代号为Tulsa,双核心设计,每个核心配备了1MB L2(二级)快取,16MB L3(三级)快取。该处理器还支持超执行绪(HT : Hyper-Threading)、虚拟化(Intel Virtualization Technology)以及Intel快取安全技术(Cache Safe Technology),3.0GHz主频以上的Xeon 7100系列处理器TDP功耗为150W,3.0GHz以下的TDP为95W。
Xeon 7100系列CPU规格
CPU编号主频FSBL2快取L3快取 千颗价格
7140M 3.40GHz 800MHz 2×1MB 16MB 1980
7140N 3.33GHz 667MHz 2×1MB 16MB 1980
7130M 3.20GHz 800MHz 2×1MB 8MB 1391
7130N 3.16GHz 667MHz 2×1MB 8MB 1391
7120M 3.00GHz 800MHz 2×1MB 4MB 1177
7120N 3.00GHz 667MHz 2×1MB 4MB 1177
7110M 2.60GHz 800MHz 2×1MB 4MB 856
7110N 2.60GHz 667MHz 2×1MB 4MB 856
Xeon 7100系列处理器支持667和800MHz PSB汇流排,与8501晶片组兼容,现有的伺服器平台可以很轻松的升级到新处理器。此外Intel公司表示,65nm工艺发展的十分顺利,目前65nm产品的出货比例已经超越90nm。
















