中央处理器(Central Processing Unit,CPU)是一块超大规模的集成电路,是计算机的运算核心和控制核心。它主要包括运算器(Arithmetic and Logic Unit,ALU)和控制器(Control Unit,CU)两大部件,此外还包括若干个寄存器和高速缓冲存储器及实现它们之间联系的数据、控制及状态的总线。CPU的外观如图3-5所示。
图3-5 CPU的外观
(a)国产CPU;(b)进口CPU(正、反面)
1.CPU的主要功能
(1)处理指令(processing instructions):这是指控制程序中指令的执行顺序。程序中的各指令之间是有严格顺序的,必须严格按程序规定的顺序执行,才能保证计算机系统工作的正确性。
(2)执行操作(perform an action):一条指令的功能往往是通过计算机中的部件执行一序列的操作来实现的。CPU要根据指令的功能,产生相应的操作控制信号,发给相应的部件,从而控制这些部件按指令的要求进行动作。
(3)控制时间(control time):时间控制就是对各种操作实施时间上的定时。在一条指令的执行过程中,在什么时间进行什么操作均应受到严格的控制。只有这样,计算机才能有条不紊地工作。
(4)处理数据:对数据进行算术运算和逻辑运算,或进行其他的信息处理。
2.CPU的工作过程
CPU的工作过程可基本分为四个阶段:提取(fetch)、解码(decode)、执行(execute)和写回(writeback)。
CPU从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码。它把指令分解成一系列微操作,然后发出各种控制命令,执行微操作,从而完成一条指令的执行。指令是计算机规定执行操作的类型和操作数的基本命令。指令由一个字节或者多个字节组成,其中包括操作码字段、一个或多个有关操作数地址的字段,以及一些表征机器状态的状态字以及特征码。有的指令中也直接包含操作数本身。
3.CPU的发展
第1阶段(1971——1973年)是4位和8位低档微处理器时代,通常称为第1代,其典型产品是Intel4004和Intel8008微处理器,系统结构和指令系统都比较简单,主要采用机器语言或简单的汇编语言。
第2阶段(1974——1977年)是8位中高档微处理器时代,通常称为第2代,其典型产品是英特尔公司的8080/8085、摩托罗拉公司的M6800、Zilog公司的Z80等。指令系统比较完善,具有典型的计算机体系结构和中断、DMA等控制功能。在软件方面除了汇编语言外,还有BASIC、FORTRAN等高级语言和相应的解释程序和编译程序,在后期还出现了操作系统。
第3阶段(1978——1984年)是16位微处理器时代,通常称为第3代,其典型产品是英特尔公司的8086/8088、摩托罗拉公司的M68000、Zilog公司的Z8000等微处理器。指令系统更加丰富、完善,采用多级中断、多种寻址方式、段式存储机构、硬件乘除部件,并配置了软件系统。
第4阶段(1985——1992年)是32位微处理器时代,又称为第4代,其典型产品是英特尔公司的80386/80486、摩托罗拉公司的M69030/68040等。此时微型计算机的功能已经达到甚至超过超级小型计算机,完全可以胜任多任务、多用户的作业。同期,其他一些微处理器生产厂商(如AMD、TEXAS等)也推出了80386/80486系列的芯片。
第5阶段(1993——2005年)是奔腾(Pentium)系列微处理器时代,通常称为第5代,其典型产品是英特尔公司的奔腾系列芯片及与之兼容的AMD的K6、K7系列微处理器芯片。芯片内部采用超标量指令流水线结构,并具有相互独立的指令和数据高速缓存。随着MMX(Multi Media eXtended)微处理器的出现,微机的发展在网络化、多媒体化和智能化等方面跨上了更高的台阶。
第6阶段(2005年至今)是酷睿(Core)系列微处理器时代,通常称为第6代。“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。
2010年6月,英特尔公司再次发布革命性的处理器——第二代Core i3/i5/i7。第二代Core i3/i5/i7隶属于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架构,相比第一代产品主要带来5点重要革新:①采用全新32nm的Sandy Bridge微架构,功耗更低、性能更强;②内置高性能GPU(核芯显卡),视频编码、图形处理性能更强;③睿频加速技术2.0,更智能、效能更高;④引入全新环形架构,带来更高、带宽与更低的延迟;⑤全新的AVX、AES指令集,加强浮点运算与加密、解密运算。英特尔公司在2015年第2季度发布的第五代Core™ i7-5775R处理器,其缓存达6M,处理器基本频率达3.3 GHz,最大内存的大小为32GB。
4.CPU的主要技术参数
1)字长
字长是指CPU一次能够处理的二进制位数。CPU的字长主要根据运算器和寄存器的位数确定。比如,一个CPU有32位的寄存器,并且一次处理32个二进制位,那么就说这个CPU的字长为32位,并且把这个CPU称为“32位CPU”。字长的大小直接反映计算机的数据处理能力,字长值越大,CPU一次可处理的数据的二进制位数越多,其运算能力就越强。目前流行的CPU大多是32位或64位的。
2)主频
CPU的主频是指CPU的时钟频率(Clock Speed),它是决定执行指令速度的计时器,通常用兆赫兹(MHz)和千兆赫兹(GHz)来度量。1MHz相当于1s内有100万个时钟周期,1GHz相当于1s内有10亿个时钟周期。
时钟周期是CPU最小的时间单位,CPU执行每个任务的速度都以时钟周期来度量。应该注意,时钟频率并不等于处理器在1s内执行的指令数目。在很多计算机中,一些指令就只用一个时钟周期,也有一些指令需要多个时钟周期才能执行完。有些CPU甚至可在单一的时钟周期内执行几个指令。例如,3.6GHz的意思是CPU时钟在1s内运行3.6亿个时钟周期。在其他因素相同的情况下,使用3.6GHz处理器的计算机要比使用1.5GHz 或 933 MHz处理器的计算机快得多。
3)高速缓存(cache)
高速缓存又称为高速缓冲存储器,是一个专用的高速存储器,主要用于暂时存储 CPU运算时的部分指令和数据,CPU访问它的速度要比访问内存的速度快得多。在计算机的工作过程中,CPU的运行速度要远远高于内存的存取速度,高速缓存的主要作用是解决CPU与内存的速度不匹配问题。
4)指令集
CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效的工具之一。
CPU扩展指令集增强了CPU的多媒体、图形图像和Internet等的处理能力。这些扩展指令可以提高CPU处理多媒体和3D图形的能力。MMX(MultiMedia eXtensions,多媒体扩展)指令集包含57条命令;SSE(Streaming SIMD Extensions)包含有50条命令,是MMX的超集。SSE2包含144条命令,SSE3包含13条命令,SSE4支持47条多媒体指令集。SSE5是AMD公司为了打破英特尔公司在处理器指令集的垄断地位所提出的。SSE5初期规划加入超过100条新指令,其中最引人注目的就是三算子指令(3-Operand Instructions)及熔合乘法累积(Fused Multiply Accumulate)。理论上这些指令将对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
配合完整的128位SSE执行单元,以及庞大的执行单元数目,处理器可在一个频率周期内,同时执行128位乘法、128位加法、128位数据加载与128位数据回存,或者4个32位单倍浮点精确度乘法运算与4个32位单倍浮点精确度加法运算,这将使其更利于多媒体应用。
5.制造工艺
通常人们所说的CPU的“制作工艺”指的是在生产CPU的过程中,要加工各种电路和电子元件,制造导线连接各个元器件。现在,其生产的精度一般以纳米(nanometre,简称nm,1纳米等于百万分之一毫米)来表示,精度越高,生产工艺越先进,在同样的材料中可以制造更多的电子元件,连接线也越细。提高CPU的集成度,CPU的功耗也将降低。
密度越大的IC(IC指集成电路)电路设计,意味着在同样大小面积的IC中,可以拥有密度更大、功能更复杂的电路设计。主流的制造工艺有180nm、130nm、90nm、65nm、45nm、22nm的IC制造技术,英特尔公司已经于2010年发布32nm的制造工艺的酷睿i3/酷睿i5/酷睿i7系列,并于2012年4月发布了22nm酷睿i3/i5/i7系列。英特尔公司在2015年第2季度发布的第五代Core™ i7-5775R处理器的精度达到14nm。
6.指令处理技术
流水线是英特尔公司首次在486芯片中开始使用的。流水线的工作方式就像工业生产上的装配流水线。在CPU中由5~6个功能不同的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,由此提高CPU的运算速度。经典奔腾CPU的每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使CPU在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线的步(级)设计得越长,其完成一条指令的速度就越快,由此才能适应工作主频更高的CPU。但是流水线过长也会带来一定的副作用,很可能会出现主频较高的CPU实际运算速度较低的现象。
CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU的安装形式和器件集成设计方式。从大的分类来看,采用Socket插座进行安装的CPU通常使用PGA(栅格阵列)方式封装。
7.多核心
多核心,也指单芯片多处理器(Chip Multi Processors, CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的对称多处理器(SMP)集成到同一芯片内,各个处理器并行执行不同的进程。这种依靠多个CPU同时并行地运行程序是实现超高速计算的一个重要方向,称为并行处理。但是,当半导体工艺进入0.18μm以后,线延时已经超过了门延迟,这要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,CMP结构由于已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。IBM公司的Power 4芯片和Sun公司的MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。但这并不说明核心越多,性能越高,比如16核的CPU就没有8核的CPU运算速度快,这是因为核心太多,反而不能合理进行分配,所以导致运算速度减慢。在买电脑时请酌情选择。在2005年下半年,英特尔公司和AMD公司的新型处理器也融入了CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB内缓存,采取90nm工艺制造。它的每个单独的核心都拥有独立的L1、L2和L3 cache,包含大约10亿支晶体管。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。