• 1.摘要
  • 2.基本信息
  • 3.基本内容
  • 3.1.Yonah
  • 3.2.Conroe
  • 3.3.Allendale
  • 3.4.Merom
  • 3.5.woodcrest
  • 3.6.Clovertown
  • 3.7.Penryn
  • 3.8.关键特性之一:超宽动态执行单元
  • 3.9.关键特性之二:高级数字媒体加速器
  • 3.10.关键特性之三:高级智能快速缓存
  • 3.11.关键特性之四:智能内存访问技术
  • 3.12.关键特性之五:智能电源管理

Socket 479

基本信息

  • 外文名

    Socket 479

  • 属性

    Intel移动平台处理器的专用插槽

  • 支持

    400MHz533MHz667M

  • 时间

    2003年3月

基本内容

Intel在2006年度春季IDF大会宣布了下一代处理器将统一采用 Core微架构,这个消息无疑成为会上最引人注目的话题。作为Intel的杀 手锏,Core微架构拥有双核心、64bit指令集、4发射的 超标量体系结构和 乱序执行机制等技术,使用65nm制造工艺生产,支持36bit的物理寻址 和48bit的 虚拟内存寻址,支持包括SSE4在内的Intel所有 扩展指令集。

Core微架构的每个内核拥有32KB的一级指令缓存、32KB的双端口一级数据缓存,2个内核共同拥有4MB或2MB的共享式二级缓存。基于 Core微架构的移动平台的产品代号为“Merom”,桌面平台的产品代号为“Conroe”,而服务器平台的产品代号为“Woodcrest”。更另人期待的是,拥有如此强悍性能的Core微架构处理器在功耗方面将比先前的产品有大幅下降,每种产品都拥有自己的最高TDP(设计热功耗),Merom最 高为35W,Conroe最高为65W,Woodcrest最高为80W。

Core微架构是由Intel位于以色列海法的研发团队负责设计的。该以色列团队早在2003年就因为设计出兼具高性能与低功耗的 Banias 处理器而闻名天下,Core 微架构也是他们在 Yonah 微架构之后的最新杰作。Core 微架构很早就出现在 Intel 的计划之中了,早在2003年夏天 Intel 就曾经隐约提到过,原定是 Centrino 平台的第三代 Napa 平台后期和第四代 Santa Rosa 平台所采用的处理器。没想到由于 NetBurst 微架构的失败,Core 微架构被 Intel 改弦易辙,推上前台,被赋予了取代 NetBurst 微架构、一统桌面、移动与服务器平台的历史使命。 Intel 的新核心已经拥有多个名字。以色列团队在设计之初,采用 Merom 作为开发代号。Merom的原意是约旦河附近的一个湖,这也是 Intel 的一个有趣的习惯——采用研发团队居住地附近的地名作为产品的开发代号。然后,Intel 在2005年开始大规模宣传该微架构的时候,把它描述为“下一代微架构”(Next Generation Micro-Architecture,简称NGMA)。而在2006年的IDF大会上,Intel 把它正式宣布为“Core 微架构”(Core Micro-Architecture)

由于在Core之前Intel最新的X86微架构同样是出自这个设计团队之手的 Yonah微架构,因此这很容易让我们将二者关联在一起。Core微架构与Yonah之间究竟有没有联系?它们之间又会有什么样的关系?我们不妨先来 看看两种构架的结构图。

从分析上面Core微架构与Yonah微架构的结构对比图中可以得出这样的结论,Core微架构与Yonah微架构的内部结构是几乎完全相同的。 一样的解码流程,一样的简单解码单元与复杂解码单元相配合的设计,一样的乱序执行的流程,一样的一级指令缓存与一级数据缓存分离的设 计,一样的共享式二级缓存的设计,如果抛开解码单元与执行单元的数量、内部总线的宽度以及各个缓冲区的容量这些数值上的差异,二者在 架构上的设计是完全一样。

因此可以说Core微架构是Intel在Yonah微架构基础之上改进而来的下一代微架构,采取共享式二级缓存设计,2个核心共享4MB或2MB的 二级缓存,其内核采用高效的14级有效流水线设计,每个核心都内建32KB一级指令缓存与32KB一级数据缓存,而且2个核心的一级数据缓存之间 可以直接传输数据。每个核心内建4组指令解码单元,支持微指令融合与宏指令融合技术,每个时钟周期最多可以解码5条X86指令,并拥有改进 的分支预测功能。每个核心内建5个执行单元,执行资源庞大。采用新的内存相关性预测技术。加入对EM64T与SSE4指令集的支持,支持增强的 电源管理功能,支持硬件虚拟化技术和硬件防病毒功能,内建数字温度传感器,还可提供功率报告和温度报告等,配合系统实现动态的功耗控 制和散热控制。

耦合度的松紧决定四核协作的效率高低,而微架构则决定每个核心的运算效率、实际性能、功耗高低等关键的特性。英特尔Kentsfield/Yorkfield两代Core 2 Quad处理器都基于Core微架构,它所具有的卓越性能有目共睹。Core架构的优势体现在以下几个方面:一、拥有超宽的执行单元,在每个周期,Core架构的指令解码器可以同时发射4条指令,而AMD K8架构只能发射3条指令,换句话说,Core架构拥有更加出色的指令并行度;二、Core架构具有“微操作融合(Micro-Op Fusion)”和“宏操作融合(Macro-Op Fusion)”两项技术,可以对执行指令进行优化,通过减少指令的数量获得更高的效率,英特尔表示这两项技术最多可带来67%的效率提升,这也是Core架构产品在低功耗状态下依然拥有强劲效能的主要秘密;三、Core微架构的SSE执行单元首度提供完整的128位支持,每个单元都可以在一个时钟周期内执行一个128位SSE指令,而在多个执行单元的共同作用下,Core架构核心可以在一个时钟周期内同时执行128位乘法、128位加法、128位数据载入以及128位数据回存,或者是可以同时执行4个32位单精度浮点乘法和4个32位单精度浮点加法,进而显著提升多媒体性能;四、Core微架构采用共享缓存设计,缓存资源利用率也高于独占式设计,且多个核心可以高效协作,当然,双芯片的Kentsfield Core 2 Quad无法从这个优点中受益。编辑本段Core处理器的命名方式  英特尔将在下一代的处理器中,使用全新的Core微架构处理器,前面提到过,在针对笔记本、桌面级用户和服务器,Core均有不同的产 品,接下来就让我们一来来认识一下这些产品。

“扣肉”无疑是现在最为热门的话题。其实“扣肉”就是基于Core微架构的桌面平台级产品“Conroe”的音译。不过由于“Core”和“ Conroe”两个单词在结构上颇为类似,因此有不少消费者往往便认为“Core”和“Conroe”指得是同样一种产品。实际上,我们通常把“Core ”直接音译为“酷睿”,它是Intel下一代处理器产品将统一采用的微架构,而Conroe(扣肉)只是对基于Core(酷睿)微架构的Intel下一代桌面 平台级产品的亲切称呼。除Conroe(扣肉)处理器之外,Core(酷睿)微架构还包括代号为“Merom”的移动平台处理器和代号为“Woodcrest”的 服务器平台处理器。

采用Core的处理器将采用统一的命名。由于上一代采用Yonah微架构的处理器产品被命名为Intel Core Duo,因此为了便于与前代Intel 双核处理器区分,Intel下一代桌面处理器Conroe以及下一代笔记本处理器Merom都将采用相同的命名方式——Core 2 Duo。另外,Intel最高性 能的桌面服务器芯片Woodcrest将命名为Core 2 Extreme,以区分于普通桌面/笔记本处理器产品。

Conroe处理器沿用了L1 Cache设计,L1数据Cache和L1指令Cache分别为32KB,两个核心共享4MB或2MB的L2 Cache,它结合了Pentium M 高效率和NetBurst动态执行性能优越两方面的优点。Conroe处理器的数据流水线长度从Prescott的31级大幅度缩短至目前的14级。其算术逻辑 运算单元ALU数量由上代NetBurst微构架的2组提升至3组,同时在Cache构架上也经过了大幅度的改良,整体运算性能大大增加。

Conroe处理器将分为E8000、E6000和E4000三个系列,通过频率、二级缓存、前端总线的不同和是否支持VT等附加技术来进行定位。最 高端的E8000系列即Conroe Extreme Editon,将完整拥有VT等所有附加技术,并拥有最高的频率,最高的前端总线,当然同时也拥有最强的性 能和最高的价格。中高端的E6000系列主要通过频率和缓存来区别,将是DIY市场的主流。无论是频率还是价格,高端型号与低端型号的差别都 很大,覆盖面很广。低端的E4000系列把前端总线降到了800MHz,并去掉了VT等附加技术,定位于平价市场,类似于之前的Pentium D 805双核 处理器的定位,不过更低的前端总线反而更加有利于超频。

编辑本段Conroe处理器特点  流水线明显缩短

Intel在新处理器微架构上做出的调整要大刀阔斧得多,流水线架构的调整也最为明显。基于Core核心的Conroe处理器的流水线从 Prescott核心的31级缩短为14级,与目前的Pentium M相当。众所周知,流水线越长,频率提升潜力越大,但是一旦分支预测失败或者缓存不中 的话,所耽误的延迟时间越长。如果一旦发生分支预测失败或者缓存不中的情况,Prescott核心就会有39个周期的延迟。这要比其他的架构延 迟时间多得多。而对于Conroe来说,14级流水线的效率要比Prescott核心的31级要高很多,延时却要低得多。

在缩短流水线级数 的同时,Core 微架构前端的改进还包括分支预测单元。分支预测行为发生在取指单元部分。首先,它使用了很多人们已经熟知的预测单元,包 括传统的 NetBurst 微架构上的分支目标缓冲区(BranchTarget Buffer, BTB)、分支地址计算器(Branch Address Calculator, BAC)和返回 地址栈(Return AddressStack,RAS)。

然后,它还引入了2个新的预测单元—循环回路探测器(Loop Detector, LD)和间接分支 预测器(Indirect Branch Predictor,简称IBP),其中循环回路探测器可以正确预测循环的结束,而间接分支预测器可以基于全局的历史信息 做出预测。Core 微架构在分支预测方面不仅可以利用所有这些预测单元,还增加了新的特性:在之前的设计中,分支转移总是会浪费流水线的 一个周期;Core 微架构在分支目标预测器和取指单元之间增加了一个队列,在大部分的情况下可以避免这一个周期的浪费。

高效 的流水线架构和更优秀的分支预测能力,使Conroe处理器的性能远胜于前代Prescott核心的Pentium D,与AMD的AM2相比也要高出不少。当然这 不全是流水线架构改进的功劳,还有一点也相当重要,那就是Conroe的解码单元。

缩短后的14级流水线

基于Core核心的Conroe处理器的流水线从Prescott核心的31级缩短为14级,与目前的Pentium M相当。大幅度缩短后的流水线,虽然频率提升潜力会有所下降,但这使得延迟时间大大减低,效率也高得多。