基本信息
微处理器(英语:Microprocessor,缩写:µP或uP)是可程式化特殊积体电路。一种处理器,其所有组件小型化至一块或数块积体电路内。一种积体电路,可在其一端或多端接受编码指令,执行此指令并输出描述其状态的信号。这些指令能在内部输入、集中或存放起来。又称半导体中央处理机(CPU),是微型电脑的一个主要部件。微处理器的组件常安装在一个单片上或在同一组件内,但有时分布在一些不同晶片上。在具有固定指令集的微型电脑中,微处理器由算术逻辑单元和控製逻辑单元组成。在具有微程式控製的指令集的微型电脑中,它包含另外的控製存储单元(源自:英汉双解电脑字典)。用作处理通用资料时,叫作中央处理器。这也是最为人所知的套用(如:Intel Pentium CPU);专用于作图像资料处理的,叫作Graphics Processing Unit图形处理器(如Nvidia GeForce 7X0 GPU);用于音频资料处理的,叫作Audio Processing Unit音频处理单元(如Creative emu10k1 APU)等等。物理性来说,它就是一块集成了数量庞大的微型电晶体与其他电子组件的半导体积体电路晶片。
之所以会称为微处理器,并不只是因为它比迷你电脑所用的处理器还要小而已。最主要的原因,还是因为当初各大晶片厂之製程,已经进入了1 微米的阶段,用1 微米的製程,所产製出来的处理器晶片,厂商就会在产品名称上用“微”字,强调他们很高科技。就如同现在的许多商业广告一样,很喜欢用“奈米”字眼。
早在微处理器问世之前,电子电脑的中央处理单元就经历了从真空管到电晶体以及再后来的离散式TTL积体电路等几个重要阶段。甚至在电子电脑以前,还出现过以齿轮、轮轴和杠桿为基础的机械结构电脑。文艺复兴时期的着名画家兼科学家列奥纳多·达·芬奇就曾做过类似的设计[来源请求],但那个时代落后的製造技术根本没有能力将这个设计付诸实现。微处理器的发明使得复杂的电路群得以製成单一的电子组件。
最新讯息
昨天,英特尔宣布推出为高密度微型伺服器以及新级别节能存储和网路设备打造的凌动(Atom)S1200产品家族,同时这也是全球首个低功耗64位伺服器级系统晶片(SoC)。该家族目前包含三款新品(S1220/S1240/S1260),最低功耗仅为6瓦,处理器主频为1.6GHz。
面对这一战略性举动,英特尔副总裁兼资料中心与互联系统事业部总经理柏安娜表示:“资料中心正在不断演变成为一个独特的细分市场,英特尔将继续引领这一发展趋势。几年前,我们就意识到市场对新型高密度高能效比伺服器和其它资料中心设备的需求。”
英特尔为何要推出基于凌动平台的微处理器,它将如何平衡凌动和至强两大产品平台之间的关系;英特尔微伺服器与竞争对手相比,有哪些独特的优势,产业链的支持能力如何;其后续产品技术路线图又将怎样,带着这些问题,中国联保网编辑对英特尔存储产品市场经理亢海峰进行了专访。
无关竞争对手 面向三大类市场
在亢海峰看来,英特尔之所以推出超低功耗的微伺服器,与ARM进入伺服器市场并没有必然关联。“多样化的IT使用场景和不同的工作负载,才是英特尔进入微伺服器市场的最根本因素。”
亢海峰简略的将IT套用分为三个场景:首先是企业级套用,非常看重IT基础设施的可用性、可靠性、高效率和易用性;其次是科学计算,更加强调性能和浮点计算能力,而对于功耗和TCO等的需求没有计算能力需求那麽强烈;第三是云服务提供商,与前两者套用场景不同的是,IT不再是支撑手段而是核心业务,这类客户非常看重TCO,需要在成本收入、性能功耗等方面找到平衡。
“而从工作负载角度来看,之前业界主要简略划分为处理器密集型、记忆体密集型和IO密集型,”亢海峰说,“其实还有一种类型是节点密集型,强调的是高密度和多节点,特别是满足轻量级横向可扩展的工作负载。比如对于云服务提供商而言,通过部署高密度多节点的IT基础设施,可以服务于更多的有需求的使用者,因为很多使用者并不愿意採用多租户模式。”
在他看来,英特尔微处理器主要面向专用主机托管、存储和网路交换市场。“採用传统的伺服器晶片,单机柜的节点数量是有限的,而採用微伺服器晶片单机柜节点数量将会超过1000个,可以满足主机托管市场需求;在存储方面,则主要面向入门级中低端存储和大资料,未来我们会对所有资料做归档,具备计算能力的存储节点将会优于磁带存储;在网路交换方面,微处理器同样是面向入门级产品。”
生态系统延伸 至强凌动和平共处
其实,英特尔早在数年之前就开始关注低功耗伺服器,并对至强E3产品家族进行了扩展。那麽至强E3和凌动微伺服器是否会有沖突呢?
亢海峰表示,虽然至强E3和凌动微伺服器都是面向低功耗市场,但两者之间还是有明显的区别。至强E3和凌动微伺服器主要追求的是性能和功耗的平衡,E3突出效能,而凌动微伺服器则突出高密度。
目前E3低功耗伺服器的功耗在17瓦到45瓦之间,而凌动则在6瓦到8瓦。从两个平台的技术路线图来看,E3和凌动都将在明年引入22纳米製程工艺,2014年引入14纳米。
亢海峰不断强调新推出的凌动S1200是资料中心级产品:英特尔凌动微处理器可确保伺服器级的可靠性和可管理性,同时大幅降低总成本。具备2颗物理核心,可通过使用英特尔超执行绪技术共支持4条执行绪。同时它还包括64位支持、支持最多可达8GB DDR3记忆体的记忆体控製器、英特尔虚拟化技术(Intel VT)、8个 PCI Express 2.0通道、可提高可靠性的错误代码纠正(ECC)支持,以及与英特尔晶片组集成的其它I/O接口。
其实,我们不难发现英特尔凌动S1200系列晶片与竞争对手相比,还有一个非常大的特征,就是完全兼容资料中心常用的x86软体。“这将使集成新的低功率设备成为可能,并且避免导入和维护新软体堆的额外投资。要知道,软体测试与平台移植的成本是非常高的。”英特尔凌动S1200系列处理器在12月11日开始向使用者出货,建议起始零售价为每千颗54美元。
基本简介
微处理器用一片或少数几片大规模积体电路组成的中央处理器。这些电路执行控製部件和算术逻辑部件的功能。微处理器与传统的中央处理器相比,具有体积小、重量轻和容易模组化等优点。
微处理器的基本组成部分有:暂存器堆、运算器、时序控製电路,以及资料和地址汇流排。微处理器能完成取指令、执行指令,以及与外界存储器和逻辑部件交换信息等操作,是微型电脑的运算控製部分。它可与存储器和外围电路晶片组成微型电脑。
自从人类1947年发明电晶体以来,50多年间半导体技术经历了硅电晶体、
积体电路、超大规模积体电路、甚大规模积体电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。中央处理器是指电脑内部对资料进行处理并对处理过程进行控製的部件,伴随着大规模积体电路技术的迅速发展,晶片集成密度越来越高,CPU可以集成在一个半导体晶片上,这种具有中央处理器功能的大规模积体电路器件,被统称为“微处理器”。
主要组成
微处理器由算术逻辑单元(ALU,Arithmetic Logical Unit);累加器和通用暂存器组;程式计数器(也叫指令指标器);时序和控製逻辑部件;资料与地址锁存器/缓沖器;内部汇流排组成。其中运算器和控製器是其主要组成部分.
算术逻辑单元
算术逻辑单元ALU主要完成算术运算(+,-、×、÷、比较)和各种逻辑运算(与、或、非、异或、移位)等操作。ALU是组合电路,本身无暂存运算元的功能,因而必须有储存运算元的两个暂存器:暂存器TMP和累加器AC,累加器既向ALU提供运算元,又接收ALU的运算结果。
暂存器阵列实际上相当于微处理器内部的RAM,它包括通用暂存器组和专用暂存器组两部分,通用暂存器(A,B,C,D)用来存放参加运算的资料、中间结果或地址。它们一般均可作为两个8位的暂存器来使用。处理器内部有了这些暂存器之后,就可避免频繁地访问存储器,可缩短指令长度和指令执行时间,提
高机器的运行速度,也给编程带来方便。专用暂存器包括程式计数器PC、堆叠指示器SP和标志暂存器FR,它们的作用是固定的,用来存放地址或地址基值。其中:
A)程式计数器PC用来存放下一条要执行的指令地址,因而它控製着程式的执行顺序。在顺序执行指令的条件下,每取出指令的一个位元组,PC的内容自动加1。当程式发生转移时,就必须把新的指令地址(目标地址)装入PC,这通常由转移指令来实现。
B)堆叠指示器SP用来存放堆顶地址。堆叠是存储器中的一个特定区域。它按“后进先出”方式工作,当新的资料压入堆叠时,堆中原存信息不变,只改变堆顶位置,当资料从堆弹出时,弹出的是堆顶位置的资料,弹出后自动调正堆顶位置。也就是说,资料在进行压堆、出堆操作时,总是在堆顶进行。堆叠一旦初始化(即确定了堆底在记忆体中的位置)后,SP的内容(即堆顶位置)使由CPU自动管理。
C)标志暂存器也称程式状态字(PSW)暂存器,用来存放算术、逻辑运算指令执行后的结果特征,如结果为0时,产生进位或溢出标志等。
定时与控製逻辑是微处理器的核心控製部件,负责对整个电脑进行控製、包括从存储器中取指令,分析指令(即指令解码)确定指令操作和运算元地址,取运算元,执行指令规定的操作,送运算结果到存储器或I/O连线埠等。它还向微机的其它各部件发出相应的控製信号,使CPU内、外各部件间协调工作。
内部汇流排用来连线微处理器的各功能部件并传送微处理器内部的资料和控製信号。
必须指出,微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程式,必须配上存储器、输入输出设备构成一个完整的微型电脑后才能独立工作。
存储器
微型电脑的存储器用来存放当前正在使用的或经常使用的程式和资料。存储器按读、写方式分为随机存储器RAM(Random Access Memory)和唯读存储器ROM(Read only Memory)。RAM也称为读/写存储器,工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是易失性存储器,即其内容在断电后会全部丢失,因而只能存放暂时性的程式和资料。ROM的内容只能读出不能写入,断电后其所存信息仍保留不变,是非易失性存储器。所以ROM常用来存放永久件的程式和资料。如初始导引程式、监控程式、作业系统中的基本输入、输出管理程式BIOS等。
输入/输出接口电路 I/O接口
输入/输出接口电路是微型电脑的重要组成部件。他是微型电脑连线外部输入、输出设备及各种控製对象并与外界进行信息交换的逻辑控製电路。由于外设的结构、工作速度、信号形式和资料格式等各不相同,因此它们不能直接挂接到系统汇流排上,必须用输入/输出接口电路来做中间转换,才能实现与CPU间的信息交换。I/O接口也称I/O适配器,不同的外设必须配备不同的I/O适配器。I/O接口电路是微机套用系统必不可少的重要组成部分。任何一个微机套用系统的研製和设计,实际上主要是I/O接口的研製和设计。因此I/O接口技术是本课程讨论的重要内容之一,我们将在第八章中详细介绍。
汇流排BUS
汇流排是电脑系统中各部件之间传送信息的公共通道,是微型电脑的重要组成部件。它由若干条通信线和起驱动,隔离作用的各种三态门器件组成。微型电脑在结构形式上总是採用汇流排结构,即构成微机的各功能部件(微处理器、存储器、I/O接口电路等)之间通过汇流排相连线,这是微型电脑系统结构上的独特之处。採用汇流排结构之后,使系统中各功能部件间的相互关系转变为各部件面向汇流排的单一关系,一个部件(功能板/卡)只要符合汇流排标準,就可以连线到採用这种汇流排标準的系统中,从而使系统功能扩充或更新容易、结构简单、可靠性大大提高。在微型电脑中,根据他们所处位置和套用场合,汇流排可被分为以下四级。
(1)片内汇流排:它位于微处理器晶片内部,故称为晶片内部汇流排。用于微处理器内部ALU和各种暂存器等部件间的互连及信息传送(如图1.3中的内部汇流排就是片内汇流排)。由于受晶片面积及对外引脚数的限製,片内汇流排大多採用单汇流排结构,这有利于晶片集成度和成品率的提高,如果要求加快内部资料传送速度,也可採用双汇流排或三汇流排结构。
(2)片汇流排:片汇流排又称元件级(晶片级)汇流排或局部汇流排。微机主机板、单扳机以及其它一些外挂程式板、卡(如各种I/O接口板/卡),它们本身就是一个完整的子系统,板/卡上包含有CPU,RAM,ROM,I/O接口等各种晶片,这些晶片间也是通过汇流排来连线的,因为这有利于简化结构,减少连线,提高可靠性,方便信息的传送与控製。通常把各种板、卡上实现晶片间相互连线的汇流排称为片汇流排或元件级汇流排。
相对于一台完整的微型电脑来说,各种板/卡只是一个子系统,是一个局部,故又把片汇流排称为局部汇流排,而把用于连线微机各功能部件插卡的汇流排称为系统汇流排。局部汇流排是一个重要的概念,我们将在第七章中讨论。
(3)内汇流排:内汇流排又称系统汇流排或板级汇流排。因为该汇流排是用来连线微机各功能部件而构成一个完整微机系统的,如图1.2中所示,所以称之为系统汇流排。系统汇流排是微机系统中最重要的汇流排,人们平常所说的微机汇流排就是指系统汇流排,如PC汇流排、AT汇流排(ISA汇流排)、PCI汇流排等。系统汇流排是我们要讨论的重点内容之一。
系统汇流排上载送的信息包括资料信息、地址信息、控製信息,因此,系统汇流排包含有三种不同功能的汇流排,即资料汇流排DB(Data Bus)、地址汇流排AB(Address Bus)和控製汇流排CB(Control Bus),如图1.2中所示。
资料汇流排DB用于传送资料信息。资料汇流排是双向三态形式的汇流排,即他既可以把CPU的资料传送到存储器或I/O接口等其它部件,也可以将其它部件的资料传送到CPU。资料汇流排的位数是微型电脑的一个重要指标,通常与微处理的字长相一致。例如Intel 8086微处理器字长16位,其资料汇流排宽度也是16位。需要指出的是,资料的含义是广义的,它可以是真正的资料,也可以指令代码或状态信息,有时甚至是一个控製信息,因此,在实际工作中,资料汇流排上载送的并不一定仅仅是真正意义上的资料。
地址汇流排AB是专门用来传送地址的,由于地址只能从CPU传向外部存储器或I/O连线埠,所以地址汇流排总是单向三态的,这与资料汇流排不同。地址汇流排的位数决定了CPU可直接定址的记忆体空间大小,比如8位微机的地址汇流排为16位,则其最大可定址空间为216=64KB,16位微型机的地址汇流排为20位,其可定址空间为220=1MB。一般来说,若地址汇流排为n位,则可定址空间为2n位元组。
控製汇流排CB用来传送控製信号和时序信号。控製信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断回响信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、汇流排请求信号、限备就绪信号等。因此,控製汇流排的传送方向由具体控製信号而定,一般是双向的,控製汇流排的位数要根据系统的实际控製需要而定。实际上控製汇流排的具体情况主要取决于CPU。
(4)外汇流排:也称通信汇流排。用于两个系统之间的连线与通信,如两台微机系统之间、微机系统与其他电子仪器或电子设备之间的通信。常用的通信汇流排有IEEE-488汇流排,VXI汇流排和RS-232串列汇流排等。外汇流排不是微机系统本身固有的,只有微型机套用系统中才有。
根据微处理器的套用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数位信号处理器、微控製器。一般而言,通用处理器追求高性能,它们用于运行通用软体,配备完备、复杂的作业系统;嵌入式微处理器强调处理特定套用问题的高性能,主要用于运行面向特定领域的专用程式,配备轻量级作业系统,主要用于蜂窝电话、CD播放机等消费类家电;微控製器价位相对较低,在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备。
CPU是Central Processing Unit(中央微处理器)的缩写,它是电脑中最重要的一个部分,由运算器和控製器组成。如果把电脑比作人,那麽CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到现在的Pentium 4时代,只经过了不到二十年的时间。
从生产技术来说,最初的8088集成了29000个电晶体,而PentiumⅢ的集成度超过了2810万个电晶体;CPU的运行速度,以MIPS(百万个指令每秒)为单位,8088是0.75MIPS,到高能奔腾时已超过了1000MIPS。不管什麽样的CPU,其内部结构归纳起来都可以分为控製单元、逻辑单元和存储单元三大部分,这三个部分相互协调,对命令和资料进行分析、判断、运算并控製电脑各部分协调工作。
发展历史
CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。
微机是指以大规模、超大规模积体电路为主要部件,以集成了电脑主要部件——控製器和运算器的微处理器MP(Micro Processor)为核心,所构造出的计算系经过30多年的发展,微处理器的发展大致可分为:
第一代微处理器 1971—1973年
通常以字长是4位或8位微处理器,典型的是美国 Intel 4004和Intel 8008微处理器。Intel 4004是一种4位微处理器,可进行4位二进位的并行运算,它有45条指令,速度0.05MIPs(Million Instruction Per Second,每秒百万条指令)。Intel 4004的功能有限,主要用于电脑、电动打字机、照相机、台秤、电视机等家用电器上,使这些电器设备具有智慧型化,从而提高它们的性能。Intel 8008是世界上第一种8位的微处理器。存储器採用PMOS工艺。该阶段电脑工作速度较慢,微处理器的指令系统不完整,存储器容量很小,只有几百位元组,没有作业系统,只有汇编语言。主要用于工业仪表、过程控製。
第二代微处理器 1974—1977年
典型的微处理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比,集成度提高了1~4倍,运算速度提高了10~15倍,指令系统相对比较完善,已具备典型的电脑体系结构及中断、直接存储器存取等功能。存储容量达64KB,配有荧光屏显示器、键盘、软碟驱动器等设备构成。
第三代微处理器 1978—1984年
1978 年,Intel公司率先推出16位微处理器8086,同时,为了方便原来的8位机使用者,Intel公司又提出了一种準16位微处理器8088。在Intel公司推出8086、8088 CPU之后,各公司也相继推出了同类的产品,有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的定址空间、更强的运算能力、更快的处理速度和更完善的指令系统。所以,16位微处理器已能够替代部分小型机的功能,特别在单任务、单使用者的系统中,8086等16位微处理器更是得到了广泛的套用。1982年,Intel公司又推出16位高级微处理器80286。微处理器採用短沟道高性能NMOS工艺。在体系结构方面吸纳了传统小型机甚至大型机的设计思想,如虚拟存储和存储保护等,时锺频率提高到5~25MHz。在20世纪80年代中、后期至1991年初,80286一直是微机的驻留CPU。
第四代微处理器
1985年,Intel公司推出了第四代微处理器80386。它是一种与8086向上兼容的32位微处理器80386,它具32位的资料汇流排和32位的地址汇流排,存储器可定址空间达4GB,运算速度达到每秒300~400万条指令,即3~4MPIS。CPU内部採用6级流水线结构,使用二级存储器管理方式,支持带有存储器保护的虚拟存储机製。随着积体电路工艺水準的进一步提高,1989年,Intel公司又推出了性能更高的32位微处理器80486,在晶片上集成约120万个电晶体,是80386的4倍,80486由3个部件组成:一个是80386体系结构的主处理器,一个是与80387兼容的数位协处理器和一个8KB容量的高速缓沖存储器,并採用了RISC(精简指令集电脑)技术和突发汇流排技术,提高了速度,在相同频率下,80486的处理速度一般比80386快2~4倍。以这些高性能32位微处理器为CPU构成的微机的性能指标已达到或超过当时的高档小型机甚至大型机的水準,被称为高档或超级微机。同期推出的产品还有MC68040和NEC公司的V80,
第五代微处理器
1993年,Intel公司推出了第五代微处理器Pentium(中文译名为奔腾)。Pentium微处理器的推出使微处理器的技术发展到了一个崭新的阶段,标志着微处理器完成从CISC向RISC 时代的过渡,也标志着微处理器向工作站和超级小型机沖击的开始。
亚微米CMOS工艺,它具有64位的资料汇流排和32位的地址汇流排,CPU内部採用超标量流水线设计,Pentium晶片内採用双Cache结构(指令Cache和资料Cache),每个Cache容量为8KB,资料宽度为32位,资料Cache採用回写技术,大大节省了处理时间。Pentium 处理器为了提高浮点运算速度,採用8级流水线和部分指令固化技术,晶片内设定分支目标缓沖器(BTB),可动态预测分支程式的指令流向,节省了CPU判别分支的时间,大大提高了处理速度。Pentium系列处理器有多种工作频率,工作在60MHz和66MHz时,其速度可达每秒1亿条指令。同期推出的第五代微处理器还有IBM、Apple和Motorola这3家公司联盟PowerPC(这是一种完全的RISC微处理器),以及AMD公司的K5和Cyrix公司的M1等。
第六代微处理器
1996年Intel公司将其第六代微处理器正式命名为Pentium Pro(奔腾)。该处理器的积体电路採用了0.35的工艺,时锺频率为200MHz,在处理方面,Pentium Pro引入了新的指令执行方式,其内部核心是PISC处理器,运算速度达200MIPs。Pentium Pro允许在一个系统裏安装4个处理器,因此,Pentium Pro最合适的位置是作为高性能伺服器和工作 站。
2001年Intel公司发布了Itanium(安腾)处理器。Itanium处理器是Intel公司第一款64位元的产品。这是为顶级、企业级伺服器及工作站设计的,在Itanium处理器中体现了一种全新的设计思想,完全是基于平行并发计算而设计(EPIC)。对于最苛求性能的企业或者需要高性能运算功能支持的套用(包括电子交易安全处理、超大型资料库、电脑辅助机械引擎、尖端科学运算等)而言,Itanium处理器基本是电脑处理器中唯一的选择。
2002年Intel公司发布了Itanium2处理器。代号为McKinley的Itanium2处理器是Intel公司的第二代64位系列产品,Itanium2处理器是以Itanium架构为基础建立与扩充的产品,可与专为第一代Itanium处理器最佳化编译的应用程式兼容,并大幅提升了50%~100%的效能。Itanium2处理器系列以低成本与更高效能,提供高阶伺服器与工作站各种平台与套用支持。
第七代微处理器
1999年,AMD推出了世界上第一款第七代微处理器,取名为速龙MP处理器,可支持高性能多处理器平台的伺服器及工作站。新一代的应用程式需要一个稳定可靠的操作环境进行大量的运算,AMD速龙 MP处理器可以满足这类套用软体的需要。
2000年11月,Intel也推出了他的第七代微处理器:奔腾4(Pentium 4,或简称奔4或P4),这一新的架构称做NetBurst。Pentium 4有着非常快速到400MHz的前端汇流排,之后更有提升到533MHz、800MHz。它其实是一个为100MHz的四条并列汇流排(100Mhz x4 并列),因此理论上它可以传送比一般汇流排多四倍的容量,所以号称有400MHz的速度。
初期CPU
Intel 4004
1971年,英特尔公司推出了世界上第一款微处理器4004,这是第一个可用于微型电脑的四位微处理器,它包含2300个电晶体。随后英特尔又推出了8008,由于运算性能很差,其市场反应十分不理想。1974年,8008发展成8080,成为第二代微处理器。8080作为代替电子逻辑电路的器件被用于各种套用电路和设备中,如果没有微处理器,这些套用就无法实现。
由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各半导体公司开始竞相生产微处理器晶片。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,英特尔公司于1976年又生产了增强型8085,但这些晶片基本没有改变8080的基本特点,都属于第二代微处理器。它们均採用NMOS工艺,集成度约9000只电晶体,平均指令执行时间为1μS~2μS,採用汇编语言、BASIC、Fortran编程,使用单使用者作业系统。
Intel 8086
1978年英特尔公司生产的8086是第一个16位的微处理器。很快Zilog公司和摩托罗拉公司也宣布计画生产Z8000和68000。这就是第三代微处理器的起点。
8086微处理器最高主频速度为8MHz,具有16位资料通道,记忆体定址能力为1MB。同时英特尔还生产出与之相配合的数学协处理器i8087,这两种晶片使用相互兼容的指令集,但i8087指令集中增加了一些专门用于对数、指数和三角函式等数学计算的指令。人们将这些指令集统一称之为 x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的x86指令,而且英特尔在后续CPU的命名上沿用了原先的x86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数位命名。
1979年,英特尔公司又开发出了8088。8086和8088在晶片内部均採用16位资料传输,所以都称为16位微处理器,但8086每周期能传送或接收16位资料,而8088每周期只採用8位。因为最初的大部分设备和晶片是8位的,而8088的外部8位资料传送、接收能与这些设备相兼容。8088採用40针的DIP封装,工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个电晶体。
8086和8088问世后不久,英特尔公司就开始对他们进行改进,他们将更多功能集成在晶片上,这样就诞生了80186和80188。这两款微处理器内部均以16位工作,在外部输入输出上80186採用16位,而80188和8088一样是採用8位工作。
1981年,美国IBM公司将8088晶片用于其研製的PC机中,从而开创了全新的微机时代。也正是从8088开始,个人电脑(PC)的概念开始在全世界範围内发展起来。从8088套用到IBM PC机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时代的开始。
Intel 80286
1982年,英特尔公司在8086的基础上,研製出了80286微处理器,该微处理器的最大主频为20MHz,内、外部资料传输均为16位,使用24位记忆体储器的定址,记忆体定址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。
在实模式下,微处理器可以访问的记忆体总量限製在1兆位元组;而在保护方式之下,80286可直接访问16兆位元组的记忆体。此外,80286工作在保护方式之下,可以保护作业系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常套用时会使系统停机。
IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动。80286在以下四个方面比它的前辈有显着的改进:支持更大的记忆体;能够模拟记忆体空间;能同时运行多个任务;提高了处理速度。最早PC机的速度是4MHz,第一台基于80286的AT机运行速度为6MHz至8MHz,一些製造商还自行提高速度,使80286达到了20MHz,这意味着性能上有了重大的进步。
80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装,它有一块内部和外部固体插脚,在这个封装中,80286集成了大约130000个电晶体。
IBM PC/AT微机的汇流排保持了XT的三层汇流排结构,并增加了高低位位元组汇流排驱动器转换逻辑和高位位元组汇流排。与XT机一样,CPU也是焊接在主机板上的。
那时的原装机仅指IBM PC机,而兼容机就是除了IBM PC以外的其它机器。在当时,生产CPU的公司除英特尔外,还有AMD及西门子公司等,而人们对自己电脑用的什麽CPU也不关心,因为AMD等公司生产的CPU几乎同英特尔的一样,直到486时代人们才关心起自己的CPU来。
8086~80286这个时代是个人电脑起步的时代,当时在国内使用甚至见到过PC机的人很少,它在人们心中是一个神秘的东西。到九十年代初,国内才开始普及电脑。
从386到奔腾
1985年春天的时候,英特尔公司已经成为了第一流的晶片公司,它决心全力开发新一代的32位核心的CPU—80386。Intel给80386设计了三个技术要点:使用“类286”结构,开发80387微处理器增强浮点运算能力,开发高速快取解决记忆体速度瓶颈。
1985年10月17日,英特尔划时代的产品——80386DX正式发布了,其内部包含27.5万个电晶体,时锺频率为12.5MHz,后逐步提高到20MHz、25MHz、33MHz,最后还有少量的40MHz产品。
80386DX的内部和外部资料汇流排是32位,地址汇流排也是32位,可以定址到4GB记忆体,并可以管理64TB的虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力。
80386DX有比80286更多的指令,频率为12.5MHz的80386每秒锺可执行6百万条指令,比频率为16MHz的80286快2.2倍。80386最经典的产品为80386DX-33MHz,一般我们说的80386就是指它。
由于32位微处理器的强大运算能力,PC的套用扩展到很多的领域,如商业办公和计算、工程设计和计算、资料中心、个人娱乐。80386使32位CPU成为了PC工业的标準。
虽然当时80386没有完善和强大的浮点运算单元,但配上80387协处理器,80386就可以顺利完成许多需要大量浮点运算的任务,从而顺利进入了主流的商用电脑市场。另外,30386还有其他丰富的外围配件支持,如82258(DMA控製器)、8259A(中断控製器)、8272(磁碟控製器)、82385(Cache控製器)、82062(硬碟控製器)等。针对记忆体的速度瓶颈,英特尔为80386设计了高速快取(Cache),採取预读记忆体的方法来缓解这个速度瓶颈,从此以后,Cache就和CPU成为了如影随形的东西。
严格地说,80387并不是一块真正意义上的CPU,而是配合80386DX的协处理晶片,也就是说,80387只能协助80386完成浮点运算方面的功能,功能很单一。 1989年英特尔公司又推出準32位微处理器晶片80386SX。这是Intel为了扩大市场份额而推出的一种较便宜的普及型CPU,它的内部资料汇流排为32位,外部资料汇流排为16位,它可以接受为80286开发的16位输入/输出接口晶片,降低整机成本。
80386SX推出后,受到市场的广泛的欢迎,因为80386SX的性能大大优于80286,而价格只是80386的三分之一。英特尔在1990年推出了专门用于笔电的80386SL和80386DL两种型号的386晶片。这两个类型的晶片可以说是80386DX/SX的节能型,其中,80386DL是基于80386DX核心,而80386SL是基于80386SX核心的。这两种类型的晶片,不但耗电少,而且具有电源管理功能,在CPU不工作的时候,自动切断电源供应。
摩托罗拉的68000是最早推出的32位微微处理器,当时是1984年,推出后,性能超群,并获得如日中天的苹果公司青睐,在自己的划时代个人电脑“PC-MAC”中採用该晶片。但80386推出后,日渐没落。 AMD的Am386SX/DX是兼容80386DX的第三方晶片,性能上和英特尔的80386DX相差无己,也成为当时的主流产品之一。
这个是由IBM在研究80386的基础上设计的,和80386完全兼容,由英特尔生产製造。386SLC基本上是一个在80386SX的基础上配上内置Cache,同时包含80486SX的指令集,性能也不错。
1989年,我们大家耳熟能详的80486晶片由英特尔推出。这款经过四年开发和3亿美元资金投入的晶片的伟大之处在于它首次实破了100万个电晶体的界限,集成了120万个电晶体,使用1微米的製造工艺。80486的时锺频率从25MHz逐步提高到33MHz、40MHz、50MHz。80486是将80386和数学协微处理器80387以及一个8KB的高速快取集成在一个晶片内。80486中集成的80487的数位运算速度是以前80387的两倍,内部快取缩短了微处理器与慢速DRAM的等待时间。并且,在80x86系列中首次採用了RISC(精简指令集)技术,可以在一个时锺周期内执行一条指令。它还採用了突发汇流排方式,大大提高了与记忆体的资料交换速度。由于这些改进,80486的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。
随着晶片技术的不断发展,CPU的频率越来越快,而PC机外部设备受工艺限製,能够承受的工作频率有限,这就阻碍了CPU主频的进一步提高。在这种情况下,出现了CPU倍频技术,该技术使CPU内部工作频率为微处理器外频的2~3倍,486 DX2、486 DX4的名字便是由此而来。
常见的80486 CPU有80486 DX-33、40、50。486 CPU与386 DX一样内外都是32位的,但是最慢的486 CPU也比最快的386 CPU要快,这是因为486 SX/DX执行一条指令,只需要一个振蕩周期,而386DX CPU却需要两个周期。
因为80486 DX CPU具有内置的浮点协微处理器,功能强大,当然价格也就比较昂贵。为了适应普通的使用者的需要,尤其是不需要进行大量浮点运算的使用者,英特尔公司推出了486 SX CPU。80486 SX主机板上一般都有80487协微处理器插座,如果需要浮点协微处理器的功能,可以插上一个80487协微处理器晶片,这样就等同于486 DX了。常见的80486 SX CPU有:80486 SX-25、33。
其实这种CPU的名字与频率是有关的,这种CPU的内部频率是主机板频率的两/四倍,如80486 DX2-66,CPU的频率是66MHz,而主机板的频率只要是33MHz就可以了。
80486 SL CPU最初是为笔电和其他便携机设计的,与386SL一样,这种晶片使用3.3V而不是5V电源,而且也有内部切断电路,使微处理器和其他一些可选择的部件在不工作时,处于休眠状态,这样就可以减少笔电和其他便携机的能耗,延长使用时间。
升级486 SX可以在主机板的协微处理器插槽上安装一个80487SX晶片,使其等效于486 DX,但是这样升级后,只是增加了浮点协微处理器的能力,并没有提高系统的速度。为了提高系统的速度,还有另外一种升级的方法,就是在协微处理器插槽上插上一个486 OverDrive CPU,它的原理与486 DX2 CPU一样,其内部操作速度可以是外部速度的两倍。如一个20MHz的主机板上安插了OverDrive CPU之后,CPU内部的操作速度可以达到40MHz。486 OverDrive CPU也有浮点协微处理器的功能,常见的有:OverDrive-50、66、80。
作为全球知名的半导体厂商之一,美国德州仪器(TI)也在486时代异军突起,它自行生产了486 DX系列CPU,尤其在486DX2成为主流后,其DX2-80因较高的性价比成为当时主流产品之一,TI 486最高主频为DX4-100,但其后再也没有进入过CPU市场。
这是Cyrix公司生产的486 CPU,说它是486 CPU,是指它的效率上逼近486 CPU,却并不是严格意义上的486 CPU,这是由486 CPU的特点而定的。486DLC CPU只是将386DX CPU与1K Cache组合在一块晶片裏,没有内含浮点协微处理器,执行一条指令需要两个振蕩周期。但是由于486DLC CPU设计精巧,486DLC-33 CPU的效率逼近英特尔公司的486 SX-25,而486DLC-40 CPU则超过了486 SX-25,并且486DLC-40 CPU的价格比486 SX-25便宜。486DLC CPU是为了升级386DM而设计的,如果原来有一台386电脑,想升级到486,但是又不想更换主机板,就可以拔下原来的386 CPU,插上一块486DLC CPU就可以了。
自从英特尔另闢蹊径,开发了Pentium之后,Cyrix也很快推出了自己的新一代产品5x86。它仍然延用原来486系列的CPU插座,而将主频从100MHz提高到120MHz。5x86比起486来说性能是有所增加,可是比起Pentium来说,不但浮点性能远远不足,就连Cyrix一向自豪的整数运算性能也不那麽高超,给人一种比上不足比下有余的感觉。由于5x86可以使用486的主机板,因此一般将它看成是过渡产品。
AMD 486DX是AMD公司在 486市场的利器,它内置16KB回写快取,并且开始了单周期多指令的时代,还具有分页虚拟记忆体管理技术。由于后期TI推出了486DX2-80,价格非常低,英特尔又推出了Pentium系列,AMD为了抢佔市场的空缺,推出了5x86系列CPU。它是486级最高主频的产品,为5x86-120及133。它採用了一体的16K回写快取,0.35微米工艺,33×4的133频率,性能直指Pentium 75,并且功耗要小于Pentium。
1993年,全面超越486的新一代586 CPU问世,为了摆脱486时代微处理器名称混乱的困扰,英特尔公司把自己的新一代产品命名为Pentium(奔腾)以区别AMD和Cyrix的产品。AMD和Cyrix也分别推出了K5和6x86微处理器来对付晶片巨人,但是由于奔腾微处理器的性能最佳,英特尔逐渐佔据了大部分市场。
Pentium最初级的CPU是Pentium 60和Pentium 66,分别工作在与系统汇流排频率相同的60MHz和66MHz两种频率下,没有我们现在所说的倍频设定。
早期的奔腾75MHz~120MHz使用0.5微米的製造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。经典奔腾的性能相当平均,整数运算和浮点运算都不错。 为了提高电脑在多媒体、3D图形方面的套用能力,许多新指令集应运而生,其中最着名的三种便是英特尔的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions,多媒体扩展指令集)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指令,这些指令可以一次处理多个资料,MMX技术在软体的配合下,就可以得到更好的性能。
多能奔腾(Pentium MMX)的正式名称就是“带有MMX技术的Pentium”,是在1996年底发布的。从多能奔腾开始,英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强,而且还可以通过提高核心电压来超倍频,所以那个时候超频是一个很时髦的行动。超频这个词语也是从那个时候开始流行的。
多能奔腾是继Pentium后英特尔又一个成功的产品,其生命力也相当顽强。多能奔腾在原Pentium的基础上进行了重大的改进,增加了片内16KB资料快取和16KB指令快取,4路写快取以及分支预测单元和返回堆叠技术。特别是新增加的57条MMX多媒体指令,使得多能奔腾即使在运行非MMX最佳化的程式时,也比同主频的Pentium CPU要快得多。
这57条MMX指令专门用来处理音频、影片等资料。这些指令可以大大缩短CPU在处理多媒体资料时的等待时间,使CPU拥有更强大的资料处理能力。与经典奔腾不同,多能奔腾採用了双电压设计,其核心电压为2.8V,系统I/O电压仍为原来的3.3V。如果主机板不支持双电压设计,那麽就无法升级到多能奔腾。
多能奔腾的代号为P55C,是第一个有MMX技术(整量型单元执行)的CPU,拥有16KB资料L1 Cache,16KB指令L1 Cache,兼容SMM,64位汇流排,528MB/s的频宽,2时锺等待时间,450万个电晶体,功耗17瓦。支持的工作频率有:133MHz、150MHz、166MHz、200MHz、233MHz。 曾几何时,Pentium Pro是高端CPU的代名词,Pentium Pro所表现的性能在当时让很多人大吃一惊,但是Pentium Pro是32位资料结构设计的CPU,所以Pentium Pro运行16位应用程式时性能一般,但仍然是32位的赢家,但是后来,MMX的出现使它黯然失色。
Pentium Pro(高能奔腾,686级的CPU)的核心架构代号为P6(也是未来PⅡ、PⅢ所使用的核心架构),这是第一代产品,二级Cache有256KB或512KB,最大有1MB的二级Cache。工作频率有:133/66MHz(工程样品),150/60MHz、166/66MHz、180/60MHz、200/66MHz。 K5是AMD公司第一个独立生产的x86级CPU,发布时间在1996年。由于K5在开发上遇到了问题,其上市时间比英特尔的Pentium晚了许多,再加上性能不好,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力不如Cyrix的6x86,但是仍比Pentium略强,浮点运算能力远远比不上Pentium,但稍强于Cyrix。综合来看,K5属于实力比较平均的那一种产品。K5低廉的价格显然比其性能更能吸引消费者,低价是这款CPU最大的卖点。
AMD 自然不甘心Pentium在CPU市场上呼风唤雨,因此它们在1997年又推出了K6。K6这款CPU的设计指标是相当高的,它拥有全新的MMX指令以及64KB L1 Cache(比奔腾MMX多了一倍),整体性能要优于奔腾MMX,接近同主频PⅡ的水準。K6与K5相比,可以平行地处理更多的指令,并运行在更高的时锺频率上。AMD在整数运算方面做得非常成功,K6稍微落后的地方是在运行需要使用到MMX或浮点运算的应用程式方面,比起同样频率的Pentium 要差许多。
K6拥有32KB资料L1 Cache,32KB指令L1 Cache,集成了880万个电晶体,採用0.35微米技术,五层CMOS,C4工艺反装晶片,核心面积168平方毫米(新产品为68平方毫米),使用Socket7架构。 Cyrix 也算是一家老资格的CPU开发商了,早在x86时代,它和英特尔,AMD就形成了三雄并立的局面。
自从Cyrix与美国国家半导体公司合并后,使它终于拥有了自己的晶片生产线,成品也日益完善和完备。Cyrix的6x86是投放到市场上与Pentium兼容的微处理器。 美国IDT公司(Integrated Device Technology)作为新加入此领域的CPU生产厂商,在1997年推出的第一个微微处理器产品是WinChip(即C6),在整个CPU市场上所佔的份额还不足1%。1998年5月,IDT宣布了它的第二代产品WinChip 2 。
WinChip 2在原有WinChip的基础上作了一些改进,增加了一个双指令的MMX单元,增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10%,基本达到Intel Pentium微处理器的性能。 1997年~1998年是CPU市场竞争异常激烈的一年,这一时期的CPU晶片异彩纷呈,令人目不暇接。
PentiumⅡ的中文名称叫“奔腾二代”,它有Klamath、Deschutes、Mendocino、Katmai等几种不同核心结构的系列产品,其中第一代採用Klamath核心,0.35微米工艺製造,内部集成750万个电晶体,核心工作电压为2.8V。
PentiumⅡ微处理器採用了双重独立汇流排结构,即其中一条汇流排连通二级快取,另一条负责主要记忆体。PentiumⅡ使用了一种脱离晶片的外部高速L2 Cache,容量为512KB,并以CPU主频的一半速度运行。作为一种补偿,英特尔将PentiumⅡ的L1 Cache从16KB增至32KB。另外,为了打败竞争对手,英特尔第一次在PentiumⅡ中採用了具有专利权保护的Slot 1接口标準和SECC(单边接触盒)封装技术。
1998年4月16日,英特尔第一个支持100MHz额定外频的、代号为Deschutes的350、400MHz CPU正式推出。採用新核心的PentiumⅡ微处理器不但外频提升至100MHz,而且它们採用0.25微米工艺製造,其核心工作电压也由2.8V降至2.0V,L1 Cache和L2 Cache分别是32KB、512KB。支持晶片组主要是Intel的440BX。
在1998年至1999年间,英特尔公司推出了比PentiumⅡ功能更强大的CPU--Xeon(至强微处理器)。该款微处理器採用的核心和PentiumⅡ差不多,0.25微米製造工艺,支持100MHz外频。Xeon最大可配备2MB Cache,并运行在CPU核心频率下,它和PentiumⅡ採用的晶片不同,被称为CSRAM(Custom StaticRAM,定製静态存储器)。除此之外,它支持八个CPU系统;使用36位记忆体地址和PSE模式(PSE36模式),最大800MB/s的记忆体频宽。Xeon微处理器主要面向对性能要求更高的伺服器和工作站系统,另外,Xeon的接口形式也有所变化,採用了比Slot 1稍大一些的Slot 2架构(可支持四个微处理器)。
英特尔为进一步抢佔低端市场,于1998年4月推出了一款廉价的CPU—Celeron(中文名叫赛扬)。最初推出的Celeron有266MHz、300MHz两个版本,且都採用Covington核心,0.35微米工艺製造,内部集成1900万个电晶体和32KB一级快取,工作电压为2.0V,外频66MHz。Celeron与PentiumⅡ相比,去掉了片上的L2 Cache,此举虽然大大降低了成本,但也正因为没有二级快取,该微处理器在性能上大打折扣,其整数性能甚至不如Pentium MMX。
为弥补缺乏二级快取的Celeron微处理器性能上的不足,进一步在低端市场上打击竞争对手,英特尔在Celeron266、300推出后不久,又发布了採用Mendocino核心的新Celeron微处理器—Celeron300A、333、366。与旧Celeron不同的是,新Celeron採用0.25微米工艺製造,同时它採用Slot 1架构及SEPP封装形式,内建32KB L1 Cache、128KB L2 Cache,且以CPU相同的核心频率工作,从而大大提高了L2 Cache的工作效率。 AMD于1998年4月正式推出了K6-2微处理器。它採用0.25微米工艺製造,晶片面积减小到了68平方毫米,电晶体数目也增加到930万个。另外,K6-2具有64KB L1 Cache,二级快取集成在主机板上,容量从512KB到2MB之间,速度与系统汇流排频率同步,工作电压为2.2V,支持Socket 7架构。
K6-2是一个K6晶片加上100MHz汇流排频率和支持3D Now!浮点指令的“结合物”。3D Now!技术是对x86体系的重大突破,它大大加强了处理3D图形和多媒体所需要的密集浮点运算性能。此外,K6-2支持超标量MMX技术,支持100MHz汇流排频率,这意味着系统与L2快取和记忆体的传输率提高近50%,从而大大提高了整个系统的表现。 作为Cyrix公司独自研发的最后一款微处理器,Cyrix MⅡ是于1998年3月开始生产的。除了具有6x86本身的特徵外,该微处理器还支持MMX指令,其核心电压为2.9V,具有256位元组指令;3.5X倍频;核心内集成650万个电晶体,功耗20.6瓦;64KB一级快取。 Rise公司是一家成立于1993年11月的美国公司,主要生产x86兼容的CPU,在1998年推出了mP6 CPU。mp6不仅价格便宜,而且性能优异,有着很好的多媒体性能和强大的浮点运算。mp6使用Socket 7/Super 7兼容插座,只有16KB的一级快取。
1999年春节刚过,英特尔公司就发布了採用Katmai核心的新一代微处理器—PentiumⅢ。该微处理器除採用0.25微米工艺製造,内部集成950万个电晶体,Slot 1架构之外,它还具有以下新特点:系统汇流排频率为100MHz;採用第六代CPU核心—P6微架构,针对32位应用程式进行最佳化,双重独立汇流排;一级快取为32KB(16KB指令快取加16KB资料快取),二级快取大小为512KB,以CPU核心速度的一半运行;採用SECC2封装形式;新增加了能够增强音频、影片和3D图形效果的SSE(Streaming SIMD Extensions,资料流单指令多资料扩展)指令集,共70条新指令。PentiumⅢ的起始主频速度为450MHz。
和PentiumⅡ Xeon一样,英特尔同样也推出了面向伺服器和工作站系统的高性能CPU—PentiumⅢ Xeon至强微处理器。除前期的PentiumⅡ Xeon500、550採用0.25微米技术外,该款微处理器是採用0.18微米工艺製造,Slot 2架构和SECC封装形式,内置32KB一级快取和512KB二级快取,工作电压为1.6V。 为进一步巩固低端市场优势,英特尔于2000年3月29日推出了採用Coppermine核心CeleronⅡ。该款微处理器同样採用0.18微米工艺製造,核心集成1900万个电晶体,採用FC-PGA封装形式,它和赛扬Mendocino一样内建128KB和CPU同步运行的L2 Cache,故其核心也称为Coppermine 128。CeleronⅡ不支持多微处理器系统。但是,CeleronⅡ的外频仍然只有66MHz,这在很大程度上限製了其性能的发挥。
AMD于1999年2月推出了代号为“Sharptooth”(利齿)的K6-Ⅲ,它是该公司最后一款支持Super 7架构和CPGA封装形式的CPU,採用0.25微米製造工艺、核心面积是135平方毫米,集成了2130万个电晶体,工作电压为2.2V/2.4V。
相对于K6-2而言,K6-Ⅲ最大的变化就是内部集成了256KB二级快取(新赛扬只有128KB),并以CPU的主频速度运行。K6-Ⅲ的这一变化将能够更大限度发挥高主频的优势。此外,该微处理器还带有64KB一级快取(32KB用于指令,另32KB用于资料),而且在主机板上还集成了以系统汇流排频率同步运行的三级快取,其容量大小从512KB到2MB之间。 1999年6月23日,AMD公司推出了具有重大战略意义的K7微处理器,并将其正式命名为Athlon。K7有两种规格的产品:第一种採用0.25微米工艺製造,使用K7核心,工作电压为1.6V(其快取以主频速度的一半运行);第二种採用0.18微米工艺製造,使用K75核心;工作电压有1.7V和1.8V两种。上述两种类型的K7微处理器内部都集成了2130万个电晶体,外频均为200MHz。
Athlon包含128KB的L1 Cache(PⅡ/PⅢ只有32KB);512KB~1MB L2 Cache的片外快取。同时,它还採用了全新的宏处理结构,拥有三个并行的x86指令解码器,可以动态推测时序,乱序执行;K7拥有一个强劲的浮点处理单元,在3DNOW!指令的帮助下会有更进一步的3D和多媒体处理能力,这个先进的FPU使K7拥有超越其他x86微处理器2倍的性能!另外,K7採用了一种类似于Slot 1的全新的Slot A架构,从物理结构上两者可以互换,但后者的电器性能和前者完全不兼容。在汇流排方面,使用的是Digital公司的Alpha系统汇流排协定EV6,外频达200MHz;Athlon是AMD第一个具有SMP(对称多微处理器技术)能力的桌面CPU,即使用者可以用Athlon构建双微处理器甚至4微处理器系统!
AMD公司在2000年6月份连续推出了新款的Thunderbird(雷鸟)、Duron(毒龙)微处理器,再次向英特尔Coppermine(铜矿)核心的微处理器发出了强有力的挑战。
Thunderbird是AMD面向高端的Athlon系列延续产品,採用0.18微米的製造工艺,共有Slot A和Socket A两种不同的架构,但它们在设计上大致相同:均内置128KB的一级快取和256KB的二级快取,其二级快取与CPU主频速度同步运行;工作电压为1.70V~1.75V,相应的功耗也比老的Athlon要小;集成3700万个电晶体,核心面积达到120平方毫米。
另外,Thunderbird微处理器支持200MHz系统汇流排频率,提供巨大的频宽,且支持Alpha EV6汇流排协定,具有多重并行x86指令解码器。
Duron微处理器是AMD首款基于Athlon核心改进的低端微处理器,它原来的研发代号称为“Spitfire”。Duron外频也是200MHz,内置128KB的一级快取和64KB的全速二级快取,它的工作电压为1.5V,因而功耗要较Thunderbird小。而且它核心面积是100平方毫米,内部集成的电晶体数量为2500万个,比K7核心的Athlon多300万个。这些特点符合了AMD面对低端市场的策略,即低成本低功耗而又高性能。在浮点性能上,基于K7体系的Duron明显优于採用P6核心设计的Intel系列微处理器,它具有三个全流水乱序执行单元,一个用于加/减运算,一个用于复合指令还有一个是浮点存储单元。
VIA公司在收购Cyrix之后,同期正式推出了代号为Joshua的第一款微处理器,它採用0.18微米工艺製造,Socket 370架构,支持133MHz外频,并拥有256KB L2 Cache及3D NOW!指令集。
另外,VIA后来还推出了採用新一代Samuel核心的CyrixⅢ微处理器,它加入新一代的3D Now!多媒体指令集,提供133MHz系统外频,128K一级高速快取,採用0.18微米製造工艺生产,晶片面积仅76平方毫米。它还採用了动态电源快取结构(Dynamic Power Caching Architecture,DPCA)技术,使新CyrixⅢ微处理器的耗电量已不到10瓦,因此新CyrixⅢ微处理器也可适用在笔记型电脑或其它IA产品上。 在AMD推出Athlon后不久,2000年11月,Intel同样推出了一台强大的第7代x86微处理器,名为奔腾4(Pentium 4,或简称奔4或P4),并且是继1995年出品的Pentium Pro之后的第一款重新设计过的处理器,这一新的架构称做NetBurst。
首款产品代码为:Willamette,拥有1.4GHz左右的核心时锺,并使用Socket 423脚位架构,首款处理器于2000年11月发布。不同于Pentium II、Pentium III和各种Celeron处理器,因为是全新设计的产品,所以与Pentium Pro的关联很小。值得注意的是,Pentium 4有着非常快速到400MHz的前端汇流排,之后更有提升到533MHz、800MHz。它其实是一个为100MHz的四条并列汇流排 (100Mhz x4 并列),因此理论上它可以传送比一般汇流排多四倍的容量,所以号称有400MHz的速度。AMD Athlon的前端汇流排则有266MHz的速度(133MHz双倍并列汇流排)。
内部结构
16位微处理器(图中为8086微处理器)可分成两个部分,一部分是执行部件(EU),即执行指令的部分;另一部分是汇流排接口部件(BIU),与8086汇流排联系,执行从存储器取指令的操作。微处理器分成EU和BIU后,可使取指令和执行指令的操作重叠进行。EU部分有一个暂存器堆,由8个16位的暂存器组成,可用以存放资料、变址和堆叠指针、算术运算逻辑单元 (ALU)执行算术运算和逻辑操作,标志暂存器暂存这些操作结果的条件。
执行部件中的这些部件是通过资料汇流排传送资料的。汇流排接口部件也有一个暂存器堆,其中CS、DS、SS和ES是存储空间分段的分段暂存器。IP是指令指针。内部通信暂存器也是暂时存放资料的暂存器。指令伫列是把预先取来的指令流存放起来。汇流排接口部件还有一个地址加法器,把分段暂存器值和偏置值相加,取得20位的物理地址。资料和地址通过汇流排控製逻辑与外面的8086系统汇流排相联系。
其他资料
中国微处理器简介
2004年2月18日,由清华大学自主研发的32位微处理器THUMP晶片终于领到了由国家教育部颁发的“身份证”:典型工作频率400MHz,功耗1.17mW/MHz,晶片颗粒40片,最高工作频率可达500MHz,是目前国内工作频率最高的微处理器。 “这标志着我国在自主研发CPU晶片领域迈开了实质性的一大步。”教育部对THUMP的诞生给予了较高评价。
在龙芯1号、龙芯2号的基础上,中国正在自主研发新一代的龙芯3号。
龙芯3A的工作频率为900MHz~1GHz,功耗约15W,频率为1GHz时双精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次。龙芯3A採用意法半导体公司(STMicro)65纳米CMOS工艺生产,电晶体数目达4.25亿个,晶片採用BGA封装,引脚的数目为1121个,功耗小于15瓦。 龙芯3A集成了四个64位超标量处理器核、4MB的二级Cache、两个DDR2/3记忆体控製器、两个高性能HyperTransport控製器、一个PCI/PCIX控製器以及LPC、SPI、UART、GPIO等低速I/O控製器。龙芯3A的指令系统与MIPS64兼容并通过指令扩展支持X86二进位翻译。 龙芯3号在包括伺服器、高性能电脑、低能耗资料中心、个人高性能电脑、高端桌面套用、高吞吐计算套用、工业控製、数位信号处理、高端嵌入式套用等产品中具有广阔的市场套用前景。
工作原理
可用电晶体的数量对处理器性能有巨大影响。如上所述,在8088这样的处理器中,通常要花费15个时锺周期才能执行一条指令。由于乘法器的设计方式,在 8088上进行16位的乘法运算大约需要80个时锺周期。而电晶体越多,就越有可能在一个周期中执行更多的乘法运算。
电晶体数量的增多还使我们能够使用一种称为流水线的技术。在流水线式的体系结构中,指令的执行过程是相互重叠的。所以,虽然需要花费5个时锺周期来执行每条指令,但是可以同时执行5条指令的各个阶段。这样,表面看起来在每个时锺周期内即可执行完一条指令。
许多现代的处理器具有多个指令解码器,每一个都有自己的流水线。这样便存在多个指令流,也就是说每个时锺周期可以完成多条指令。但是这种技术实现起来非常复杂,因此需要使用大量的电晶体。
发展趋势
处理器设计的发展趋势主要是:完全32位的ALU(内置快速浮点处理器)和多指令流的流水线式执行方式。处理器设计的最新进展是64位ALU,预计在下一个十年中家用PC就会用上这种处理器。此外,还存在为处理器增加可高效执行某些操作的特殊指令(例如MMX指令)的趋势,以及在处理器晶片中增加硬体虚拟记忆体支持和L1快取的趋势。所有这些趋势都进一步增加了电晶体的数量,导致现在的处理器包含数千万个电晶体。而这些处理器每秒大约可以执行十亿条指令。


















