本页使用了标题或全文手工转换

Nehalem微架构

维基百科,自由的百科全书
跳转至: 导航搜索
Nehalem
设计团队 Intel
生产商
指令集架构 MMXSSESSE2SSE3
SSSE3SSE4.1SSE4.2x86
x86-64EM64TEIST
XD-bitAES-NIAVX
制作工艺/制程 45nm
核心数量 2 个至 8 个
一级缓存 64KB(每核心)
二级缓存 256KB(每核心)
三级缓存 4MB~12MB(各核心共享)
CPU主频范围 至 3.33 GHz
QPI速率 4.8 GT/s 至 6.4 GT/s
DMI速率 2.5 GT/s 至 5.0 GT/s
CPU插座
封装
  • LGA(桌面平台、服务器平台)
  • PGA(移动平台)
应用/用途 服务器工作站台式机笔记本电脑超级计算机
核心代号
  • 服务器平台:
    Beckton
  • 服务器平台:
    Gainestown、Jasper Forest
  • 服务器平台:
    Bloomfield、Jasper Forest、Lynnfield
  • 桌面平台/服务器平台:
    Bloomfield、Lynnfield、Jasper Forest 、Havendale(已取消)
  • 移动平台:
    Clarksfield、Auburndale(已取消)
使用的处理器型号
上代产品 Core
继任产品 Westmere

Intel Nehalem (发音:/nəˈheɪləm/[1]) ,是Intel研发的中央处理器微架构之代号,该架构取代了前代的Core微处理器架构[2] 使用Nehalem架构的微处理器采用45纳米制程(后期改用32纳米制程),在2007年的Intel开发者论坛上Intel官方展示了一个采用两颗INehalem微架构的处理器的系统平台。首款采用Intel Nehalem架构的处理器是2008年11月正式发售的桌面型处理器Intel Core i7[3]

Intel在Pentium 4时代也使用过“Nehalem”的代号,该代号曾使用于NetBurst微架构的10Ghz版本之Pentium 4微处理器,后来改计划取消。Nehalem微架构尽管与Netburst架构不是一个时代的产物,但是两者之间有一些共同的技术和特点,如超线程、较高的默认时钟频率等。尽管Nehalem架构的微处理器默认时钟频率普遍较高,但能效比依然比Core微架构的制程改进版Penryn微架构的微处理器要高。2011年1月,Intel Nehalem微架构由其下一代微架构Intel Sandy Bridge所取代。

Intel Nehalem的架构设计有不少地方与AMD K10类似(譬如每核心独立电压及时钟频率等),但要比AMD K10的性能更佳、能耗更低。AMD后来也推出K10的改进版K10.5来与Intel的Nehalem竞争。

技术特点[编辑]

原生四核心的Nehalem微架构

集成北桥[编辑]

全部型号的微处理器核心都集成了内存控制器,一般支持双通道DDR3 SDRAM,消费级产品最高支持三通道DDR3 SDRAM,而服务器平台则可以支持四通道DDR3 SDRAM;除此以外还处理器核心还集成了PCI Express 2.0控制器。

直连式总线[编辑]

从Nehalem微架构开始,Intel改用QPI/DMI直连式总线,放弃了传统的FSB。首发的Core i7使用了新的“Quick Path Interconnect”直连式总线,与AMD的HyperTransport相似。

相比FSB,每一个处理器都可以有独立的QPI通道与其他处理器连接,处理器之间不用再共享FSB带宽,并绕路到北桥才能通信。此外,QPI是双向传输[4]

后来发布的Core i5i3,处理器内部仍使用QPI,但与外部芯片组连接则使用与QPI类似但较QPI的带宽小的DMI(Direct Media Interface)总线。

随着FSB的‘卸任’,一般意义上的‘外频’概念由‘基准时钟频率’(BLCK)所取代。[5]

模块化的多核心设计[编辑]

处理器采用模块化设计[6]。例如核心、内存控制器、以至输入输出接口控制器,都能够以不同的数量配搭,而且都能做到原生多核心设计。这样使得Nehalem架构的处理器产品线可以做成双核心、四核心、六核心乃至八核心、十核心(仅见于Xeon E7[7],可以使到产品更容易针对不同市场。与AMD K10微架构类似,每一个模块都可以有独立的电压和独立的时钟频率,让处理器在不同负载水平的性能最大化的同时更省电。

二级分支预测器和新的转译后备缓冲器(Translation Lookaside Buffer,TLB)。

超线程[编辑]

超线程技术回归:部分处理器型号支持超线程的技术。消费级市场发售的最高六核心,十二线程,企业级的更达到八核心,十六线程甚至到后期的十核心,二十线程。不仅多线程处理能力加强,Intel认为该技术还能最多提升处理器30%的性能。

缓存[编辑]

多级缓存:每核心64KB的L1缓存(32KB指令缓存+32KB数据缓存);每核心256KB的L2缓存,虽容量大小较Core微架构的小但拥有更低的读写延迟值;与AMD K10一样,Intel Nehalem微架构的处理器都内置L3缓存,每一个处理器共享最小4MB至最大12MB(企业级处理器更达到30MB)。

性能、电源管理[编辑]

性能动态调节和电源管理:中高级型号的处理器会支持Turbo Boost港澳地区没有正式官方中文名称,台湾官方中文名称为‘涡轮加速’,中国大陆官方中文名称为‘睿频’。其后该技术更名为Dynamic Speed,动态时钟频率[8])动态时钟频率调整技术,倘若有程序使用较多的处理器负载,处理器的频率可以按步骤提升,此外,可以自动往上提升倍频[9]该功能基本不需要操作系统的支持,完全由硬件监控[10]。除了时钟频率管理,电源管理方面引入Power Gates技术,核心闲置的时候可被关闭。对比上一代的Core架构,的核心电阻可以被关闭,电流可以完全不通过核心。各个处理器核心可运作于不同的频率电压[11]。Turbo Boost及Power Gates功能都是由一个单元提供,占去大约一百万个晶体管[12]。而AMD K10及后来的改进版K10.5,核心必须手动才能关闭。

指令集[编辑]

指令集更新:SIMD指令SSE4的版本会提升为SSE 4.2,SSE4.2在SSE4.1(于Core架构上)的基础上新增了7条指令[13];引入第二代Intel虚拟化技术,支持EPT(Extended Page Table,扩展标签页表)、VPIDs(virtual processor identifiers,虚拟处理器标识)以及非屏蔽中断窗口退出(non-maskable interrupt-window exiting)。[14]Intel Nehalem架构的原子操作延时降低了50%,在试图限制原子的开销上。[15]

搭配芯片组[编辑]

芯片组方面,Intel推出了5系列芯片组与之搭配,桌面平台有P5*、H5*、X5*等系列型号,其中P5*、H5*系列型号采用LGA1156插座,X5*采用LGA1366插座。代号Bloomfield的Core i7和后期第二批的Intel X58芯片组(允许更变倍频)的组合再次提升Intel平台的超频极限。核心代号Lynnfield的Core i5所使用的芯片组,更名为“PCH”(Platform Controller Hub,PCH,集成了一部分北桥和整个南桥),取代以往分离的北桥芯片和南桥芯片,成为单片机组。[16]早期,处理器核心的电压与系统内存同步。此前,Intel官方表示首批处理器产品会支持DDR3-800和DDR3-1066规格的内存。对于DDR3-1333,由于处理器只可以接受较低的电压水平(限制在1.65V或以下),高速的内存意味着需要较高的电压,所以此规格的官方支持仍然存在疑问[17]。后来第二批X58芯片组主机版上,处理器核心电压与系统内存电压可以实现异步,方便用家超频[18]。另外,原先只有XE版本处理器可以调整内存频率。后来Intel修改为所有上市的Core i7处理器,均可以修改内存和QPI总线的频率[19]

性能和能耗之改进[编辑]

尽管核心面积比Core架构要大不少,性能较Core架构系列则仍大幅提升,并没有令市场期望失望。[20]

与Core架构的45纳米制程版本Core相比,Nehalem架构:

  • 在相同的能耗下比Core架构的单线程性能高出10%至100%;
  • 同样的性能下的能耗平均比Core架构的低30%;
  • 每核心每时钟周期的性能平均比上代架构高12%至20%。

核心及其步进[编辑]

核心数量(内存通道数量、其他总线) 制程 芯片面积 CPUID Model 步进 移动平台 桌面平台、 UP Server DP Server MP Server
八核心(四通道) 45 nm 684 mm² 206E6 46 D0 Beckton (80604)
四核心(三通道) 45 nm 263 mm² 106A4
106A5
26 C0
D0
Bloomfield (80601) Gainestown (80602)
四核心(双通道、PCIe) 45 nm 296 mm² 106E4
106E5
30 B0
B1
Clarksfield (80607) Lynnfield (80605) Jasper Forest (80612)
双核心(双通道、PCIe、内置显示核心) 45 nm Auburndale (已取消) Havendale (已取消)
十核心(四通道)[21] 32 nm 513 mm² 206F2 47 A2 Westmere-EX (80615)
六核心(三通道) 32 nm 248 mm² 206C2 44 B1 Gulftown (80613) Westmere-EP (80614)
双核心(双通道、PCIe、内置显示核心) 32 nm
45 nm
81+114 mm² 20652
20655
37 C2
K0
Arrandale (80617) Clarkdale (80616)
  • 极致性能级别的处理器无倍频限制;
  • 全部微处理器使用133MHz的基准时钟频率

处理器列表[编辑]

继任微架构[编辑]

Intel遵循Tick-Tock策略,于2011年第一季度发布了Intel Sandy Bridge微架构,正式取代Intel Nehalem微架构以及其制程改进版Intel Westmere微架构。

Intel processor roadmap
Intel的微处理器架构路线图,从 NetBurst以及P6Tigerlake

参考[编辑]

外部链接[编辑]