中国聚U网-CPU新闻,资料 (News/Documents)-CPU的概念与重要性能指标

收藏本页
联系我们
论坛帮助

>> 这里时常会公布当前CPU发展的一些新闻，各大厂商的动态，以及一些网上有关CPU收藏以及相关技术的有趣的文章。(注意：转载其它网站文章请注明出处。)

中国聚U网 → 中国聚U网社区 - (China CPU Collector's Site BBS) → CPU新闻,资料 (News/Documents) → CPU的概念与重要性能指标

您是本帖的第 3532 个阅读者

标题：CPU的概念与重要性能指标	树形打印收藏推荐

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	楼主

CPU的概念与重要性能指标

在向大家介绍CPU详细的情形之前，务必要让大家弄清楚到底CPU是什么？它到底有那些重要的性能指标呢？

CPU的英文全称是Central Processing Unit，我们翻译成中文也就是中央处理器。CPU（微型机系统）从雏形出现到发壮大的今天（下文会有交代），由于制造技术的越来越现今，在其中所集成的电子元件也越来越多，上万个，甚至是上百万个微型的晶体管构成了CPU的内部结构。那么这上百万个晶体管是如何工作的呢？看上去似乎很深奥，其实只要归纳起来稍加分析就会一目了然的，CPU的内部结构可分为控制单元，逻辑单元和存储单元三大部分。而CPU的工作原理就象一个工厂对产品的加工过程：进入工厂的原料（指令），经过物资分配部门（控制单元）的调度分配，被送往生产线（逻辑运算单元），生产出成品（处理后的数据）后，再存储在仓库（存储器）中，最后等着拿到市场上去卖（交由应用程序使用）。 CPU作为是整个微机系统的核心，它往往是各种档次微机的代名词，如往日的286、386、486，到今日的奔腾、奔腾二、K6等等，CPU的性能大致上也就反映出了它所配置的那部微机的性能，因此它的性能指标十分重要。在这里我们向大家简单介绍一些CPU主要的性能指标：

第一、主频，倍频，外频。经常听别人说：“这个CPU的频率是多少多少。。。。”其实这个泛指的频率是指CPU的主频，主频也就是CPU的时钟频率，英文全称：CPU Clock Speed，简单地说也就是CPU运算时的工作频率。一般说来，主频越高，一个时钟周期里面完成的指令数也越多，当然CPU的速度也就越快了。不过由于各种各样的CPU它们的内部结构也不尽相同，所以并非所有的时钟频率相同的CPU的性能都一样。至于外频就是系统总线的工作频率；而倍频则是指CPU外频与主频相差的倍数。三者是有十分密切的关系的：主频=外频x倍频。

第二：内存总线速度，英文全称是Memory-Bus Speed。CPU处理的数据是从哪里来的呢？学过一点计算机基本原理的朋友们都会清楚，是从主存储器那里来的，而主存储器指的就是我们平常所说的内存了。一般我们放在外存（磁盘或者各种存储介质）上面的资料都要通过内存，再进入CPU进行处理的。所以与内存之间的通道棗内存总线的速度对整个系统性能就显得很重要了，由于内存和CPU之间的运行速度或多或少会有差异，因此便出现了二级缓存，来协调两者之间的差异，而内存总线速度就是指CPU与二级(L2)高速缓存和内存之间的通信速度。

第三、扩展总线速度，英文全称是Expansion-Bus Speed。扩展总线指的就是指安装在微机系统上的局部总线如VESA或PCI总线，我们打开电脑的时候会看见一些插槽般的东西，这些就是扩展槽，而扩展总线就是CPU联系这些外部设备的桥梁。

第四：工作电压，英文全称是：Supply Voltage。任何电器在工作的时候都需要电，自然也会有额定的电压，CPU当然也不例外了，工作电压指的也就是CPU正常工作所需的电压。早期CPU（286棗486时代）的工作电压一般为5V，那是因为当时的制造工艺相对落后，以致于CPU的发热量太大，弄得寿命减短。随着CPU的制造工艺与主频的提高，近年来各种CPU的工作电压有逐步下降的趋势，以解决发热过高的问题。

第五：地址总线宽度。地址总线宽度决定了CPU可以访问的物理地址空间，简单地说就是CPU到底能够使用多大容量的内存。16位的微机我们就不用说了，但是对于386以上的微机系统，地址线的宽度为32位，最多可以直接访问4096 MB（4GB）的物理空间。而今天能够用上1GB内存的人还没有多少个呢（服务器除外）。

第六：数据总线宽度。数据总线负责整个系统的数据流量的大小，而数据总线宽度则决定了CPU与二级高速缓存、内存以及输入/输出设备之间一次数据传输的信息量。

第七：协处理器。在486以前的CPU里面，是没有内置协处理器的。由于协处理器主要的功能就是负责浮点运算，因此386、286、8088等等微机CPU的浮点运算性能都相当落后，相信接触过386的朋友都知道主板上可以另外加一个外置协处理器，其目的就是为了增强浮点运算的功能。自从486以后，CPU一般都内置了协处理器，协处理器的功能也不再局限于增强浮点运算，含有内置协处理器的CPU，可以加快特定类型的数值计算，某些需要进行复杂计算的软件系统，如高版本的AUTO CAD就需要协处理器支持。

第八：超标量。超标量是指在一个时钟周期内CPU可以执行一条以上的指令。这在486或者以前的CPU上是很难想象的，只有Pentium级以上CPU才具有这种超标量结构；486以下的CPU属于低标量结构，即在这类CPU内执行一条指令至少需要一个或一个以上的时钟周期。

第九：L1高速缓存，也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率，这也正是486DLC比386DX-40快的原因。内置的L1高速缓存的容量和结构对CPU的性能影响较大，容量越大，性能也相对会提高不少，所以这也正是一些公司力争加大L1级高速缓冲存储器容量的原因。不过高速缓冲存储器均由静态RAM组成，结构较复杂，在CPU管芯面积不能太大的情况下，L1级高速缓存的容量不可能做得太大。

第十：采用回写(Write Back)结构的高速缓存。它对读和写操作均有效，速度较快。而采用写通(Write-through)结构的高速缓存，仅对读操作有效.

第十一：动态处理。动态处理是应用在高能奔腾处理器中的新技术，创造性地把三项专为提高处理器对数据的操作效率而设计的技术融合在一起。这三项技术是多路分流预测、数据流量分析和猜测执行。动态处理并不是简单执行一串指令，而是通过操作数据来提高处理器的工作效率。

动态处理包括了棗1、多路分流预测：通过几个分支对程序流向进行预测，采用多路分流预测算法后，处理器便可参与指令流向的跳转。它预测下一条指令在内存中位置的精确度可以达到惊人的90%以上。这是因为处理器在取指令时,还会在程序中寻找未来要执行的指令。这个技术可加速向处理器传送任务。2、数据流量分析：抛开原程序的顺序，分析并重排指令，优化执行顺序：处理器读取经过解码的软件指令，判断该指令能否处理或是否需与其它指令一道处理。然后，处理器再决定如何优化执行顺序以便高效地处理和执行指令。3、猜测执行：通过提前判读并执行有可能需要的程序指令的方式提高执行速度：当处理器执行指令时(每次五条)，采用的是“猜测执行”的方法。这样可使奔腾II处理器超级处理能力得到充分的发挥，从而提升软件性能。被处理的软件指令是建立在猜测分支基础之上，因此结果也就作为“预测结果”保留起来。一旦其最终状态能被确定，指令便可返回到其正常顺序并保持永久的机器状态。

经过了上面的描述，相信大家对CPU已经有一个简单的概念和少许了解了，你一定想知道，一块CPU是怎样制造出来的呢？

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:09

举报帖子
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	第 2 楼

CPU是怎样“炼成”的

CPU发展至今已经有二十多年的历史，其中制造CPU的工艺技术也经过了长足的发展，以前的制造工艺比较粗糙，而且对于读者了解最新的技术也没有多大帮助，所以我们舍之不谈，用今天比较新的制造工艺来向大家阐述：

许多对电脑知识略知一二的朋友大多会知道CPU里面最重要的东西就是晶体管了，提高CPU的速度，最重要的一点说白了就是如何在相同的CPU面积里面放进去更加多的晶体管。由于CPU实在太小，太精密，里面组成了数目相当多的晶体管，所以人手是绝对不可能完成的（笑），只能够通过光刻工艺来进行加工的。这就是为什么一块CPU里面为什么可以数量如此之多的晶体管。晶体管其实就是一个双位的开关：即开和关。如果您回忆起基本计算的时代，那就是一台计算机需要进行工作的全部。两种选择，开和关，对于机器来说即0和1。那么您将如何制作一个CPU呢?以下我们用英特尔为例子告诉大家：

首先：取出一张利用激光器刚刚从类似干香肠一样的硅柱上切割下来的硅片，它的直径约为20cm。除了CPU之外，英特尔还可以在每一硅片上制作数百个微处理器。每一个微处理器都不足一平方厘米。

接着就是硅片镀膜了。相信学过化学的朋友都知道硅（Si）这个绝佳的半导体材料，它可以电脑里面最最重要的元素啊！在硅片表面增加一层由我们的老朋友二氧化硅(SiO2)构成的绝缘层。这是通过CPU能够导电的基础。其次就轮到光刻胶了，在硅片上面增加了二氧化硅之后，随后在其上镀上一种称为“光刻胶”的材料。这种材料在经过紫外线照射后会变软、变粘。然后就是光刻掩膜，在我们考虑制造工艺前很久，就早有一非常聪明的美国人在脑子里面设计出了CPU，并且想尽方法使其按他们的设计意图工作。CPU电路设计的照相掩模贴放在光刻胶的上方。照相字后自然要曝光“冲晒”了，我们将于是将掩模和硅片曝光于紫外线。这就象是放大机中的一张底片。该掩模允许光线照射到硅片上的某区域而不能照射到另一区域，这就形成了该设计的潜在映像。

一切都办妥了之后，就要到相当重要的刻蚀工艺出场了。我们采用一种溶液将光线照射后完全变软变粘的光刻胶“块”除去，这就露出了其下的二氧化硅。本工艺的最后部分是除去曝露的二氧化硅以及残余的光刻胶。对每层电路都要重复该光刻掩模和刻蚀工艺，这得由所生产的CPU的复杂程度来确定。尽管所有这些听起来象来自“星球大战”的高科技，但刻蚀实际上是一种非常古老的工艺。几个世纪以前，该工艺最初是被艺术家们用来在纸上、纺织品上甚至在树木上创作精彩绘画的。在微处理器的生产过程中，该照相刻蚀工艺可以依照电路图形刻蚀成导电细条，其厚度比人的一根头发丝还细许多倍。

接下来就是掺杂工艺。现在我们从硅片上已曝露的区域开始，首先倒入一化学离子混合液中。这一工艺改变掺杂区的导电方式，使得每个晶体管可以通、断、或携带数据。将此工艺一次又一次地重复，以制成该CPU的许多层。不同层可通过开启窗口联接起来。电子以高达400MHz或更高的速度在不同的层面间流上流下，窗口是通过使用掩膜重复掩膜、刻蚀步骤开启的。窗口开启后就可以填充他们了。窗口中填充的是种最普通的金属－铝。终于接近尾声了，我们把完工的晶体管接入自动测试设备中，这个设备每秒可作一万次检测，以确保它能正常工作。在通过所有的测试后必须将其封入一个陶瓷的或塑料的封壳中，这样它就可以很容易地装在一块电路板上了。

目前，单单Intel具有14家芯片制造厂。尽管微处理器的基本原料是沙子（提炼硅），但工厂内空气中的一粒灰尘就可能毁掉成千上万的芯片。因此生产CPU的环境需非常干净。事实上，工厂中生产芯片的超净化室比医院内的手术室还要洁净1万倍。“一级”的超净化室最为洁净，每平方英尺只有一粒灰尘。为达到如此一个无菌的环境而采用的技术多令人难以置信。在每一个超净化室里，空气每分钟要彻底更换一次。空气从天花板压入，从地板吸出。净化室内部的气压稍高于外部气压。这样，如果净化室中出现裂缝，那么内部的洁净空气也会通过裂缝溜走－防止受污染的空气流入。但这只是事情一半。在芯片制造厂里，Intel有上千名员工。他们都穿着特殊的称为“兔装”的工作服。兔装是由一种特殊的非棉绒、抗静电纤维制成的，它可以防止灰尘、脏物和其它污染损坏生产中的计算机芯片。这兔装有适合每一个人的各种尺寸以及一系列颜色，甚至于白色。员工可以将兔装穿在在普通衣服的外面，但必须经过含有54个单独步骤的严格着装程序。而且每一次进入和离开超净化室都必须重复这个程序。因此，进入净化室之后就会停留一阵。在制造车间里，英特尔的技术专家们切割硅片，并准备印刻电路模板等一系列复杂程序。这个步骤将硅片变成了一个半导体，它可以象晶体管一样有打开和关闭两种状态。这些打开和关闭的状态对应于数字电码。把成千上万个晶体管集成在英特尔的微处理器上，能表示成千上万个电码，这样您的电脑就能处理一些非常复杂的软件公式了。

CPU——回望过去的脚步

任何东西从发展到壮大都会经历一个过程，CPU能够发展到今天这个规模和成就，其中的发展史更是耐人寻味。作为电脑之“芯”的全攻略，我们也向大家简单介绍一下：

如果要刨根问底的，那么CPU的溯源可以一直去到1971年。在那一年，当时还处在发展阶段的INTEL公司推出了世界上第一台微处理器4004。这不但是第一个用于计算器的4位微处理器，也是第一款个人有能力买得起的电脑处理器！！4004含有2300个晶体管，功能相当有限，而且速度还很慢，被当时的蓝色巨人IBM以及大部分商业用户不屑一顾，但是它毕竟是划时代的产品，从此以后，INTEL便与微处理器结下了不解之缘。可以这么说，CPU的历史发展历程其实也就是INTEL公司X86系列CPU的发展历程，我们就通过它来展开我们的“CPU历史之旅”。

1978年，Intel公司再次领导潮流，首次生产出16位的微处理器，并命名为i8086，同时还生产出与之相配合的数学协处理器i8087，这两种芯片使用相互兼容的指令集，但在i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算指令。由于这些指令集应用于i8086和i8087，所以人们也这些指令集统一称之为X86指令集。虽然以后Intel又陆续生产出第二代、第三代等更先进和更快的新型CPU，但都仍然兼容原来的X86指令，而且Intel在后续CPU的命名上沿用了原先的X86序列，直到后来因商标注册问题，才放弃了继续用阿拉伯数字命名。至于在后来发展壮大的其他公司，例如AMD和Cyrix等，在486以前（包括486）的CPU都是按Intel的命名方式为自己的X86系列CPU命名，但到了586时代，市场竞争越来越厉害了，由于商标注册问题，它们已经无法继续使用与Intel的X86系列相同或相似的命名，只好另外为自己的586、686兼容CPU命名了。

1979年，INTEL公司推出了8088芯片，它仍旧是属于16位微处理器，内含29000个晶体管，时钟频率为4.77MHz，地址总线为20位，可使用1MB内存。8088内部数据总线都是16位，外部数据总线是8位，而它的兄弟8086是16位。1981年8088芯片首次用于IBM PC机中，开创了全新的微机时代。也正是从8088开始，PC机（个人电脑）的概念开始在全世界范围内发展起来。

1982年，许多年轻的读者尚在襁褓之中的时候，INTE已经推出了划时代的最新产品棗80286芯片，该芯片比8006和8088都有了飞跃的发展，虽然它仍旧是16位结构，但是在CPU的内部含有13.4万个晶体管，时钟频率由最初的6MHz逐步提高到20MHz。其内部和外部数据总线皆为16位，地址总线24位，可寻址16MB内存。从80286开始，CPU的工作方式也演变出两种来：实模式和保护模式。

1985年INTEL推出了80386芯片，它是80X86系列中的第一种32位微处理器，而且制造工艺也有了很大的进步，与80286相比，80386内部内含27.5万个晶体管，时钟频率为12.5MHz，后提高到20MHz，25MHz，33MHz。80386的内部和外部数据总线都是32位，地址总线也是32位，可寻址高达4GB内存。它除具有实模式和保护模式外，还增加了一种叫虚拟86的工作方式，可以通过同时模拟多个8086处理器来提供多任务能力。除了标准的80386芯片，也就是我们以前经常说的80386DX外，出于不同的市场和应用考虑，INTEL又陆续推出了一些其它类型的80386芯片：80386SX、80386SL、80386DL等。1988年推出的80386SX是市场定位在80286和80386DX之间的一种芯片，其与80386DX的不同在于外部数据总线和地址总线皆与80286相同，分别是16位和24位(即寻址能力为16MB)。1990年推出的80386 SL和80386 DL都是低功耗、节能型芯片，主要用于便携机和节能型台式机。80386 SL与80386 DL的不同在于前者是基于80386SX的，后者是基于80386DX的，但两者皆增加了一种新的工作方式：系统管理方式(SMM)。当进入系统管理方式后，CPU就自动降低运行速度、控制显示屏和硬盘等其它部件暂停工作，甚至停止运行，进入“休眠”状态，以达到节能目的。

1989年，我们大家耳熟能详的80486芯片由INTEL推出，这种芯片的伟大之处就在于它实破了100万个晶体管的界限，集成了120万个晶体管。80486的时钟频率从25MHz逐步提高到33MHz、50MHz。80486是将80386和数学协处理器80387以及一个8KB的高速缓存集成在一个芯片内，并且在80X86系列中首次采用了RISC（精简指令集）技术，可以在一个时钟周期内执行一条指令。它还采用了突发总线方式，大大提高了与内存的数据交换速度。由于这些改进，80486的性能比带有80387数学协处理器的80386DX提高了4倍。80486和80386一样，也陆续出现了几种类型。上面介绍的最初类型是80486DX。1990年推出了80486SX，它是486类型中的一种低价格机型，其与80486DX的区别在于它没有数学协处理器。80486 DX2由系用了时钟倍频技术，也就是说芯片内部的运行速度是外部总线运行速度的两倍，即芯片内部以2倍于系统时钟的速度运行，但仍以原有时钟速度与外界通讯。80486 DX2的内部时钟频率主要有40MHz、50MHz、66MHz等。80486 DX4也是采用了时钟倍频技术的芯片，它允许其内部单元以2倍或3倍于外部总线的速度运行。为了支持这种提高了的内部工作频率，它的片内高速缓存扩大到16KB。80486 DX4的时钟频率为100MHz，其运行速度比66MHz的80486 DX2快40%。80486也有SL增强类型，其具有系统管理方式，用于便携机或节能型台式机。

看完这里，相信大家会对CPU的发展历程有一个初步的认识，至于这段时期其他公司：譬如AMD，CYRIX等等推出的CPU，由于名字和INTEL的都是一个样，也就不再重复叙述了。

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:09

举报帖子
删除单贴
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	第 3 楼

CPU——辉煌的今日（INTEL）

相信大家最关心的要算是今日CPU的发展状况了，我们就从Pentium（奔腾），俗称的586开始，一直说到才数天前发布的最新K7吧。由于这段时间简直就是CPU发展的战国时期，市场上面群雄奋起，风云突变，竞争异常的激烈，新技术出现的速度相当快，为免大家看了之后会产生混乱的感觉，我就就通过介绍不同公司在不同时期推出的产品，提大家详细介绍一些，让已经拥有电脑的朋友了解多一些，还没有电脑的朋友也可以从中得到一点启示。

INTEL

说到CPU，当然不能不提到这位一直领导CPU制造新潮流的老大哥。正是因为有了INTEL，电脑才脱下了高贵的“外衣”，走到了我们的身边，成为真正的个人电脑，今天，当我们用电脑玩游戏、看电影，听CD，甚至上网的时候你可千万得记住INTEL的功劳啊！

Pentium:

继承着80486大获成功的东风，赚翻了几倍资金的INTEL在1993年推出了全新一代的高性能处理器棗Pentium。由于CPU市场的竞争越来越趋向于激烈化，INTEL觉得不能再让AMD和其他公司用同样的名字来抢自己的饭碗了，于是提出了商标注册，由于在美国的法律里面是不能用阿拉伯数字注册的，于是INTEL玩了哥花样，用拉丁文去注册商标。Pentium在拉丁文里面就是“五”的意思了。INTEL公司还替它起了一个相当好听的中文名字棗奔腾。奔腾的厂家代号是P54C，PENTIUM的内部含有的晶体管数量高达310万个，时钟频率由最初推出的60MHZ和66MHZ，后提高到200MHZ。单单是最初版本的66MHZ的PENTIUM微处理器，它的运算性能比33MHZ的80486 DX就提高了3倍多，而100MHZ的PENTIUM则比33MHZ的80486 DX要快6至8倍。也就是从PENTIUM开始，我们大家有了超频这样一个用尽量少的钱换取尽量多的性能的好方法。作为世界上第一个586级处理器，PENTIUM也是第一个令人超频的最多的处理器，由于Pentium的制造工艺优良，所以整个系列的CPU的浮点性能也是各种各样性能是CPU中最强的，可超频性能最大，因此赢得了586级CPU的大部分市场。Pentium家族里面的频率有60/66/75//90/100/120/133/150/166/200，至于CPU的内部频率则是从60MHz到66MHz不等。值得一提的是，从奔腾75开始，CPU的插座技术正式从以前的Socket4转换到同时支持Socket 5和7同时支持，其中Socket 7还一直沿用至今。而且所有的Pentium CPU里面都已经内置了16K的一级缓存，这样使它的处理性能更加强大。

Pentimu Pr

初步占据了一部分CPU市场的INTEL并没有停下自己的脚步，在其他公司还在不断追赶自己的奔腾之际，又在1996年推出了最新一代的第六代X86系列CPU棗P6。P6只是它的研究代号，上市之后P6有了一个非常响亮的名字棗Pentimu Pro。Pentimu Pro的内部含有高达550万个的晶体管，内部时钟频率为133MHZ，处理速度几乎是100MHZ的PENTIUM的2倍。Pentimu Pro的一级(片内)缓存为8KB指令和8KB数据。值得注意的是在Pentimu Pro的一个封装中除Pentimu Pro芯片外还包括有一个256KB的二级缓存芯片，两个芯片之间用高频宽的内部通讯总线互连，处理器与高速缓存的连接线路也被安置在该封装中，这样就使高速缓存能更容易地运行在更高的频率上。Pentium Pro 200MHZCPU的L2 CACHE就是运行在200MHZ，也就是工作在与处理器相同的频率上。这样的设计领Pentium Pro达到了最高的性能。而Pentimu Pro最引人注目的地方是它具有一项称为“动态执行”的创新技术，这是继PENTIUM在超标量体系结构上实现实破之后的又一次飞跃。Pentimu Pro系列的工作频率是150/166/180/200，一级缓存都是16KB，而前三者都有256KB的二级缓存，至于频率为200的CPU还分为三种版本，不同就在于他们的内置的缓存分别是256KB，512KB，1MB。如此强大的性能，难怪许多服务器系统都采用了Pentimu Pro甚至是双Pentimu Pro系统呢！

Pentium MMX:

也许是INTEL认为Pentium 系列还是有很大的潜力可挖，与1996年底又推出了Pentium 系列的改进版本，厂家代号P55C，也就是我们平常所说的Pentium MMX（多能奔腾）。MMX技术是INTEL最新发明的一项多媒体增强指令集技术，它的英文全称可以翻译“多媒体扩展指令集”。MMX是Intel公司在1996年为增强Pentium CPU在音像、图形和通信应用方面而采取的新技术，为CPU增加了57条MMX指令，除了指令集中增加MMX指令外，还将CPU芯片内的L1缓存由原来的16KB增加到32KB（16K指命+16K数据），因此MMX CPU比普通CPU在运行含有MMX指令的程序时，处理多媒体的能力上提高了60％左右。MMX技术不但是一个创新，而且还开创了CPU开发的新纪元，目前的什么KNI，3D NOW！也是从MMX发展演变过来的。Pentium MMX可以说是直到99年在电脑市场上占有率最高的CPU产品，直到今天还有不少人（包括笔者）在内使用MMX的CPU。Pentium MMX系列的频率只要有三种：166/200/233，一级缓存都是32KB，核心电压2.8v，倍频分别为2.5,3,3.5。插槽都是Socket 7。

Pentium Ⅱ:

1997年五月，INTEL又推出了和Pentium Pro同一个级别的产品，也就是影响力最大的CPU棗Pentium Ⅱ。有人这样评价Pentium Ⅱ，说它是为了弥补Pentium Pro里面的缺陷，然后再加上MMX指令而生产开发出来的产品，他们这样说有他们的道理，我以下就替大家剖析一下Pentium Ⅱ：

PentiumⅡCPU有众多的分支和系列产品，其中第一代的产品就是PentiumⅡKlamath芯片。作为PentiumⅡ的第一代芯片，它运行在66MHz总线上，主频分233、266、300、333四种。PentiumII采用了与Pentium Pro相同的核心结构,从而继承了原有Pentium Pro处理器优秀的32位性能。PentiumⅡ虽采用了与Pentium Pro相同的核心结构,但它加快了段寄存器写操作的速度,并增加了MMX指令集,以加速16位操作系统的执行速度。由于配备了可重命名的段寄存器,因此PentiumⅡ可以猜测地执行写操作，并允许使用旧段值的指令与使用新段值的指令同时存在。在PentiumⅡ里面，Intel一改过去BiCMOS制造工艺的笨拙且耗电量大的双极硬件,将750万个晶体管压缩到一个203平方毫米的印模上。PentiumⅡ只比Pentium Pro大6平方毫米,但它却比Pentium Pro多容纳了200万个晶体管。由于使用只有0.28微米的扇出门尺寸,因此加快了这些晶体管的速度,从而达到了X86前所未有的时钟速度。

在总线方面，PentiumⅡ处理器采用了双独立总线结构，即其中一条总线联接二级高速缓存,另一条负责主要内存。然而PentiumⅡ的二级高速缓存实际上还是比Pentium Pro的二级缓存慢一些。这是因为由于PentiumPro使用了一个双容量的陶瓷封装,Intel在Pentium Pro中配置了板上的L2高速缓存,可以与CPU运行在对等的时钟速度下。诚然，这种方案的效率相当高，可是在制造的成本方面却非常昂贵。为了降低生产成本，PentiumⅡ使用了一种脱离芯片的外部高速缓存，可以运行在相当于CPU自身时钟速度一半的速度下。所以尽管PentiumⅡ的高速缓存仍然要比Pentium的高速缓存快得多，但比起200MHz的Pentium Pro里面的高速缓存就要逊色一些了。作为一种补偿，Intel将PentiumⅡ上的L1高速缓存从16K加倍到32K,从而减少了对L2高速缓存的调用频率。由于这一措施，再加上更高的时钟速度，PentiumⅡ(配有512K的L2高速缓存)在WindowsNT下性能比Pentium Pro(配有256K的L2高速缓存)超出大约25%。

在接口技术方面，为了击跨INTEL的竞争对手，以及获得更加大的内部总线带宽，PentiumⅡ首次采用了最新的solt1接口标准，它不再用陶瓷封装，而是采用了一块带金属外壳的印刷电路板，该印刷电路板不但集成了处理器部件，而且还包括32KB的一级缓存。如要将PentiumⅡ处理器与单边插接卡(也称SEC卡)相连，只需将该印刷电路板(PCB)直接卡在SEC卡上。SEC卡的塑料封装外壳称为单边插接卡盒，也称SEC(Single-edgecontactCartridge)卡盒，其上带有PentiumⅡ的标志和PentiumⅡ印模的彩色图像。在SEC卡盒中，处理器封装与L2高速缓存和TagRAM均被接在一个底座(即SEC卡)上，而该底座的一边(容纳处理器核心的那一边)安装有一个铝制散热片，另一边则用黑塑料封起来。PentiumⅡCPU内部集合了32KB片内L1高速缓存(16K指令/16K数据)；57条MMX指令；8个64位的MMX寄存器。750万个晶体管组成的核心部分，是以203平方毫米的工艺制造出来的。处理器被固定到一个很小的印刷电路板(PCB)上，对双向的SMP有很好的支持。至于L2高速缓存则有，512K，属于四路级联片外同步突发式SRAM高速缓存。这些高速缓存的运行速度相当于核心处理器速度的一半(对于一个266MHz的CPU来说，即为133MHz)。PentiumⅡ的这种SEC卡设计是插到Slot1(尺寸大约相当于一个ISA插槽那么大)中。所有的Slot1主板都有一个由两个塑料支架组成的固定机构。一个SEC卡可以从两个塑料支架之间滑入Slot1中。将该SEC卡插入到位后，就可以将一个散热槽附着到其铝制散热片上。266MHz的PentiumⅡ运行起来只比200MHz的PentiumPro稍热一些(其功率分别为38.2瓦和37.9瓦)，但是由于SEC卡的尺寸较大，PentiumⅡ的散热槽几乎相当于Socket7或Socket8处理器所用的散热槽的两倍那么大。

Pentium Celeron:

在Pentium Ⅱ又再次获得成功之际，INTEL的头脑开始有点发热，飘飘然了起来，将全部力量都集中在高端市场上，从而给AMD，CYRIX等等公司造成了不少乘虚而入的机会，眼看着性能价格比不如对手的产品，而且低端市场一再被蚕食，INTEL不能眼看着自己的发家之地就这样落入他人手中，又与1998年全新推出了面向低端市场，性能价格比相当厉害的CPU，也就是本文的重要介绍产品棗Celeron，赛扬处理器。

Pentium Celeron可以说是Intel为抢占低端市场而专门推出的。1000美元以下PC的热销，另AMD与Cyrix在与Intel的抗争中打了个漂亮的翻身仗，也令Intel如芒刺在背。于是，Intel把Pentium II的二级缓存和相关电路抽离出来，再把塑料盒子也去掉，再改一个名字，这就是Pentium Celeron。中文名称为奔腾赛扬处理器。 Celeron采用0.35微米工艺制造，外频为66MHz，最初推出的有266与300两款。接着又出现了333，直到刚刚新鲜出炉不久的赛扬500。从赛扬333开始，就已经采取了0.25微米的制造工艺。开始阶段，Celeron最为人所诟病的是其抽掉了芯片上的L2 Cache，这使人不禁想起当年的486SX。我们知道，在486时代，CPU就已经内置了8K缓存，而在主板上还另有插槽可供大家再加上二级缓存（高档一点的是板上自带的），到了奔腾时代，更是一发不可收拾，板上的二级缓存由256K到现在最大的2MB（MVP3芯片组支持）PII的更厉害，把二级缓存也放到CPU板上，CPU与内存和二级缓存有两条总线，这就是Intel引以为豪的DIB双重总线技术，这样装置的二级缓存能比Soecket7上的提供更高的性能，因为它是运行在CPU一半时钟频率上的，当CPU为PII333时，二级Cache就运行在167MHz，这远比现在100MHZ外频的Soecket7上的Cache速度要高的多，也就是说，在PII上，二级缓存的重要性比在Soecket7上的要高。大家也知道了二级缓存的作用，相信就已经知道赛扬其实是一只掉了牙的老虎（再也凶不起来了），在实际应用中，Celeron266装在技嘉BX主板上，性能比PII266下降超过25%！而相差最大的就是经常须要用到二级缓存的项目。不过什么马配什么鞍，Intel专门为赛扬配备了EX芯片组。Intel的440EX芯片组为Celeron做了优化，因此C266+EX与PII266+BX的性能只相差了10%。400,366,333,300A,300和266MHz英特尔赛扬处理器将英特尔处理功能扩展到基本PC市场部分.英特尔赛扬处理器在如Windows98操作系统上运行当今最常用的应用程序。它们同奔腾II处理器一样受益于同一P6微构架。400,366,333和300AMHz英特尔赛扬处理器包括集成的L2缓存128K,300和266MHz英特尔赛扬内核有7.5M晶体管.400,366,333和300A部件的内核由于集成128KL2缓存,有19M的晶体管。所有的英特尔赛扬处理器建立在英特尔的高级0.25micronCMOS处理技术上.此处理器以单边处理器包装提供(S.E.P.P.)设计简单,成本低。从某种意义上来说，英特尔赛扬处理器没有辜负广大用户的期望，提供了高可*性，融合了二十多年来的设计和制造高性能产品的经验。

赛扬处理器现有主频为400,366,333,300A,300和266MHz. 400MHz英特尔赛扬处理器比333MHz赛扬处理器整数性能高13%(由SYSmark32测出),多媒体性能高14%(由NortonMediaBenchmark测出),浮点性能高19%(FPUmark测出)。其中还包括了英特尔的MMX媒体增强技术提供动态执行技术。为提高处理器内核频率和降低电消耗而采用英特尔0.25微米制造技术。在三个性能矢量上提供有竞争力的功能性椄〉?整数和多媒体. 使用英特尔P6微架构的66MHz多重任务系统总线.

一个32K(16K/16K)一级缓存，对常用数据能进行快速访问。 400,366,333和300AMHz英特尔赛扬处理器包括集成128KL2缓存. 所有的英特尔赛扬处理器使用英特尔P6微架构的多事项系统总线。400,366,333和300AMHz处理器使用增加了L2缓存界面的英特尔P6微架构多事项系统总线。L2缓存总线和处理器到主储存器系统总线的结合增加了在单总线处理器上的带宽和性能。英特尔440EXAGPset以基本PC机价格点优化整个以英特尔赛扬处理器基础的系统性能,在考虑基本PC机价格因素同时为终端用户提供AGPset的改进。

赛扬CPU还有一个“变形”的兄弟棗Socket 370架构的处理器,它可以说是由INTEL推出的一个使用PII为核心、Socket架构为主板的“杂交品种”。Socket 370 CPU插槽外观上和Socket 7差不多，只不过Socket 7有321个Pin脚，而Socket 370有370个Pin脚；另外Socket 7只有一个斜脚，而Socket 370有两个斜脚，因此Intel发布的Socket 370 Celeron处理器不适用于目前既有的Socket 7主板，这对热衷于升级的用户来说可不是个好消息。不过对于Slot 1主板的用户来说，可以通过转换卡来实现升级哦！价钱可是非常便宜的。按Intel的计划，Socket 370全部支持带二级缓存的300MHz以上的Celeron(PPGA)处理器。而将来所有的Celeron处理器都会转向Socket 370的架构，这也更加符合Intel推出Socket 370和Celeron的本意。 Socket370架构CPU的和目前市面上流行的Celeron 300A是相同核心，而接口部分由Solt1改为Socket形式。从外观上看，特别象Socket7的Pentium MMX，只是中央的Die封装部分要比MMX要大些，CPU的底部比较明显，Socket370 CPU底部中央的封装部分呈长方形，明显与MMX不同，标记着Intel Celeron表明它的正式名称仍然会是Celeron，通过一个和Pentium Ⅱ上类似的序号（譬如：FV524RX366128)我们可以辨认出其频率是366Mhz并带128K缓存；虽同为Socket，Socket370是370针,比Socket7 CPU的321针多出49针,不仅针脚多出一圈,脚的位置也不同,注定两种Socket是无法兼容了。Intel使用了440ZX 芯片组来搭配Socket 370，将支持100 MHz 外频。经过我们的特别测试，发现socket370 的Celeron 366几乎每项测试中均超过了PII，可见其性能之好。

赛扬由于没有了二级缓存的限制，而且是用0.25技术制造的，因此超频能力特强，那么在超频的过程中有什么东西是需要特别注意的呢？

首先就是CPU本身，不过作为超频“先锋”，几乎所有的赛扬CPU都能超频二级以上，有写特别的序列号的赛扬CPU甚至还能够超上三、四级。

其次就是好的主板和内存了，现在的市面上有相当一部分的主板是为了超频而设，大家在购买的时候必须要自己看清楚。如今大家都知道内存是CPU提速的瓶颈之一，因此常常有人提问某种型号的内存芯片性能如何或是干脆直接问它们耐不耐超频。其实内存芯片的性能固然重要，但在实际挑选内存的同时，除芯片的型号外，同时还应该注意内存条本身设计是否成熟、做工是否精。要知道即使采用的是高性能的内存芯片，如果设计不当，那么作为内存条而言仍然是不耐超频的失败品。那么，什么样的内存条才算是合格的呢？（这里的合格，当然指耐超频喽）做工精细与否可以由目视判断，而设计成熟与否主要看线路板上的通透孔（Through Hole）数目的多少，一般通透孔的数目越少越耐超频。何谓通透孔呢？就是线路板上的那些看似线路终端的小洞。电脑里使用的线路板是由很多层构成的，我们平时能看见的只是最表层的线路。在最表层之下，还存在有许多层，每层的线路都是互相独立的。要使最外层的线路与里层线路导通，就必须利用通透孔。有些设计不成熟的内存条，就连同在表层的线路之间的导通，都要先从通透孔进入里层，绕上一圈后再从另一个通透孔穿出。这样一来，导致了线路总长度的增加。而在高达100MHz的工作频率下，无谓地加长线路极易产生杂波干扰。这就很可能导致超频失败。顺便提一下，内存芯片与CPU一样，也存在批号不同导致性能不同的现象：即使批号相同，生产日期也会影响芯片的性能。因此想掌握确切的资料，唯一的办法就是坚持不懈地从网上搜寻最新情报。我个人觉得HYUNDAI、NEC和TOSHIBA的芯片性能不错。下面再来看看CL（CAS Latency）值对超频的影响。CAS Latency指的是CPU在接到读取某列内存地址上数据的指令后到实际开始读出数据所需的等待时间，CL=2指等待时间为2个CPU时钟周期，而CL=3的则为3个CPU时钟周期。对今天的高速CPU而言，1个时钟周期的长度微乎其微。因此不论CL2还是CL3的内存，用户在实际使用中是感觉不到性能差距的。而厂家在制造内存条时，不论CL2还是CL3，用的都是同样的原料和设备。只是在生产完成后检测时，挑出精度高的当CL2的卖，精度相对低一些的则当CL3的卖。实际上有不少被当作CL3卖的内存条可以在CL=2的设定下工作。因此CL2的内存条的最大优势就在于更精密一些，换而言之就是为超频所留的余地更大一些、超频后工作会更稳定一些。我试过的几种名牌的128MB/CL2的内存都可以在外频133MHz的环境下稳定地工作，而散装的CL3的内存则大多无法在112MHz以上的外频下持续稳定地工作。在将外频超到100时，也不必使用符合PC100规格的内存，尽管一般不推荐在外频100MHz的系统中使用非PC100的内存条，但实际上甚至有非PC100的内存条在外频133MHz下稳定工作的记录。据说这是因为早期的内存条不带SPD（一块记录有该内存条性能特征的EPPROM，是符合PC100规范所必须的），用户可以自由设定有关内存的各项参数，易于进行优化。当然，如果您的Money很多，那么自然不必犹豫，挑贵的买准没错。又或是您正准备购买新的内存，那么我奉劝您，从长远看还是购买符合PC100规范的吧！就笔者个人而言，赛扬超频之后的稳定性是相对下降了不少，这是因为发热量太大的问题，如果超频后某些特定的应用程序经常报出错，一般将内核电压加上0.1V到0.2V即可缓解。不过为防万一，用于处理重要数据的电脑，最好不要超频使用。

值得一提的是，PⅡ系列CPU设置了倍频锁，你不能通过加高倍频来超频，不过，最近情况有所改观，已经有一些新型号的主板（例如中国台湾A－Trend和日本Free Way共同开发的FW－6400GX/ATC－6400系列）能够破解倍频锁，允许用户自由设定CPU的倍频。为了超频成功，你除了加CPU的内核电压外，还可以加高外CPU的外部电压，这样可以使内存等外部设备工作更加稳定，对提高超频的成功率和超频后的稳定性都有帮助，但是能加高外部电压的主板实在不多。有些主板（例如华硕的P2B系列），在出厂时设定的外部电压就高于额定的3.3V，而有3.5V左右。而另一些主板（例如上面提到的ATC－6400系列）则允许用户在BIOS中自由设定CPU的内、外电压值。

另外，还有一种办法就是找那些可以改变输出电压值的电源。据我所知，中国台湾Seven Team产的ST－301HR（ATX版本2.01的300W电源）就带有调节外部电压的旋钮。不过，这种办法有一定风险，大家最好别贸然尝试。

Pentium ⅡXeon :

在98与99年间，INTEL公司还最新推出了新一款比Pentium Ⅱ还要更加强大的CPU——Pentium ⅡXeon （至强处理器）。Pentium II Xeon CPU的目标就是挑战高端的、基于RISC的工作站和服务器。Xeon系列处理器具有在x86时代从未见过的强大功能。此系列处理器幕后的真正变化并不在于时钟速率(从400MHz起)，而是该种CPU那些足以成为头条新闻的新型插槽、L2高速缓存、新的芯片组和扩展系统内存支持。这些变化足以证明：x86架构现在已经长大了，正在接近中级和高端Unix服务器的功能。Pentium ⅡXeon处理器把英特尔结构的性能/价格比优势扩展到技术计算及企业计算的新高度。它专门为在中、高级服务器及工作站上运行的应用软件设计了其所需要的存储器设置。

至于Pentium ⅡXeon 的内部结构包括了：兼容前几代英特尔微处理器结构；奔腾II处理器具有的P6微结构中的双独立总线结构和动态指令执行技术；同时，还有其它一些特性。它的一系列先进的特性加强了服务器平台对其环境的监测和保护能力。这些特性能帮助顾客建立一个健壮的信息技术环境，最大限度地增加系统正常运转时间，并保证服务器获得优化的设置及运行。

而且还具有先进的管理特性，譬如：热敏传感器、检错纠错(ECC)、功能冗余检查、系统管理总线等等。Pentium ⅡXeon 处理器的功能还得到加强，能在具有可扩展性和可维护性的结构中为执行大量计算任务提供更高的性能。为此加入了512K或1M字节的二级高速缓冲存储器，其运行速度与处理器内核相同(450兆赫兹)。这使得向处理器内核传送的数据量达到了前所未有的程度。通过高容量的100兆赫兹的多事务处理系统总线，实现了与系统其它部分的数据共享；而多任务处理系统总线是一项突破性的技术，使系统的其余部分也有可能实现较高的处理速度。可供寻址和高速缓存用的内存容量高达64G字节，从而提高对绝大多数高级应用软件的处理性能和数据吞吐量。系统总线支持同时处理多项未完成事务，从而使可用带宽增加。支持多达8个处理器的多处理系统，而且各个处理器都能充分发挥效率。这样的系统总线实现了低成本的4通道、8通道对称多处理，并使得针对多任务操作系统和多线程应用软件的性能得到大幅度加强。完全支持英特尔扩展服务器结构--加强的36位处理器支持(新的PSE-36模式)结合了36位缓冲存储器和超过4G字节的芯片组，从而允许企业级应用程序使用超过4G的内存，实现更好的系统性能。

至于Pentium ⅡXeon 的其他特性还有：由英特尔开发的单边接触盒(S.E.C.)封装能充分发挥运算能力、改善了处理保护能力并实现了未来奔腾II至强处理器的通用形式。群集支持，或者称为对数个4通道服务器系统的群集能力。这使得顾客的基于奔腾II至强处理器的系统实现了可扩展性从而满足各自不同的需求。 Pentium ⅡXeon 是首例采用了系统管理总线接口的英特尔微处理器，为英特尔产品系列增加了一些可维护性的特征。在盒中，有两个新的部件(除热敏传感器之外)使用这个接口与其它系统管理硬件和软件进行通讯。Pentium ⅡXeon 还可以支持全面的功能冗余检查(FRC)以提高重要应用软件的完整性。功能冗余检查对多处理器的输出进行对比，以检查它们之间的差别。在功能冗余度检查中,一个处理器充当主处理器,另一个则充当检查器。检查器负责向系统报告是否发现两个处理器的输出有差异。纠错码功能可以帮助保护对执行任务过程中不容出错的数据。奔腾II至强处理器支持对所有二级高速缓存总线和系统总线事务中的数据信号的检错纠错功能，能够自动纠正单字节错误，并向系统提示所有双字节错误。所有的错误都被定位后，系统可以进行误码率追踪以确定出故障的系统部件。

在Pentium ⅡXeon 里，INTEL更加用上了最新的插口技术棗Slot 2。Pentium ⅡXeon 是放置在金属封装壳中的，然后通过边缘连接触点插在主板上，其连接插座更像是常见的PCI或ISA扩展卡的插槽(因此也就有了术语SECC即单边接触插盒)。Slot 2将这个概念又向前发展了一步：每个Slot 1 CPU使用了242个连接触点，而每个Slot 2处理器使用330个连接触点。所以，大家熟悉的盛放Slot 2 CPU的黑色金属封装壳就比Slot 1要稍大一些。Slot 2的显著特性还不是其连接触点，而是其二级L2高速缓存。也就是说，与Slot 1 Pentium II (与L2高速缓存以半倍速CPU时钟速率通信)不同，Slot 2 Xeon处理器以全速时钟速率?00MHz椨隠2高速缓存通信。对工作站和服务器厂商来说，这是一个巨大的吸引力，因为在这些平台运行的应用在高端是CPU极度密集型的。因此，CPU从L2高速缓存访问数据的速度越快，它就能越快地处理数据。实际上，使用0.25微米工艺生产的400 MHz Xeon处理器的内核与Pentium II 是一样的。但是，为了适应Xeon极快的L2高速缓存，Intel必须得将PCB(印刷电路板)的高度增加一倍，所以处理器插盒本身要比Pentium II 的SECC高得多。Xeon具有两种类型：一种带有512K L2高速缓存，另一种带有1MB L2高速缓存。99年晚些时候，用于高端服务器的450-MHz、2MB L2高速缓存的Xeon CPU也将推出。

由于Pentium ⅡXeon 是面向工作站和服务器市场推出的，所以也要开发出相应的芯片组，那就是440GX和450NX二者都支持100MHz前端总线、USB(GX有4个USB口，NX有两个USB口)和到ISA总线的南桥。 440GX AGPset 芯片组为工作站和中级服务器设计，支持最新的Xeon处理器，支持 Slot1和Slot2结构的100MHz系统总线速度；能最多支持两个CPU，更完善的AGPX2，支持高达2GB的SDRAM内存，采用 492 脚的 BGA 封装。另外还支持Pentium II 处理器，所以如果厂商愿意，他们可以将Pentium II 系统移植到这种新的芯片组。450NX PCIset 芯片组则是专门为服务器设计的，该芯片组有两种类型：五芯片组的450NX基础型和九芯片组的全能450NX。其中450NX基础型，最多支持2个32位PCI总线以及一个64位PCI总线，最大内存支持4GB。比较起来，450NX全能型最多支持四个32位PCI总线和两个64位PCI总线，最多支持8GB内存。二者都使用了Intel的PSE36，这是一种新型的36位内存寻址模式，从而能支持4GB以上(450NX最高为8GB)内存，并为最高支持64GB主内存提供了空间。二者均支持最多四个处理器、100MHz前端总线和100MHz的EDO DRAM。450NX最酷的功能是其内置的群集支持。服务器厂商可以(为90-MHz系统总线)加一个群集桥，就可以让终端用户将多个Xeon服务器串在一起。于99晚些时候推出的群集桥系统，能对关键重要的应用提供故障恢复功能，满足7天24小时可用的要求；同时，它还能将应用提高扩展到x86平台前所未有的水平。另外，你还会见到使用Profusion架构(去年Intel购买Corollary后由Intel拥有)的八路群集Xeon服务器，以及其他一些专利群集技术。由此可见，Pentium ⅡXeon 是真正能与数据中心竞争的第一款Intel处理器。

Pentium ⅡXeon 性能：400MHz主频；32KB(16KB数据/16KB指令)无障碍一级高速缓存，可对最常用数据进行快速存取；双重独立总线结构使性能更佳，并为处理器核心提供更多数据，100MHz系统总线加速了处理器与系统间数据的传输；具有512KB及1MB的统一、无障碍二级高速缓存；高速缓存总线速度与处理器核心运行速度一致，可提供更大的峰值带宽；缓存寻址空间可达64GB；支持多达8个处理器，并通过其他集群技术支持8处理器以上的系统；支持36位扩充内存，使操作系统可更有效地使用多达4GB以上的内存。

经过笔者的亲身测试，Pentium ⅡXeon在进行表格处理，文书编辑，以及图形，图象处理方面都比Pentium 有了不少的提高，可能是因为比较大的二级缓存的缘故吧，不过就执行游戏的效果来看就和Pentium Ⅱ没有什么区别，毕竟它的出现不是为了游戏吧。

Katmai：

在Xeon（至强处理器）上市后，英特尔公司的首要事情就是为新一代奔腾II－－Katmai(奔腾III)作准备，它可能是本世纪X86产品的最后一作，因为INTEL宣布了要将Merced推迟6个月发布，或许到2000年才上市，现在就让我们看看正式推出的Katmai的详细情况：

Katmai为MMX 添加了70条新指令，以增强三维和浮点应用，并让原来支持MMX的软件和WEB开发程序运行得更快。这个技术被命名为MMX2，它可兼容以前的所有MMX程序，此规格是英特尔公司在1998年1月宣布的。新指令包括浮点数据类型的SIMD，CPU会并行处理指令，因而在软件重复做某项工作时可以发挥很大的优势。与之相比较的是，MMX新增57条指令所提供的SIMD仅对整数类型有效。众所周知，三维应用与浮点的关系很密切，强化了浮点运算即是加快了三维处理，以下软件都能从中受益。

首先是三维几何学，进行变换3D坐标（特别是同时变换几个）工作时，SIMD会在一秒中做出更多的操作，所以利用SIMD浮点指令将得到更高的性能，它能进一步对场景做渲染、实时影子效果、倒映之类的工作。对于最终用户来说，这意味着物体更生动，表面更光滑。在图中可以看出各种新增的变换指令，其中光线的控制是3D环境的关键，一种类似于浮点矩阵操作决定从物体表面反射光线的颜色和数量。游戏开发商们为了减低CPU的计算量常常去掉那些额外或复杂的光线，但一个场景的复杂光线能比普通着色起到更好的视觉效果。MMX2中的SIMD浮点指令就能对之进行平行编码，可以大大减轻处理器的负担，以获取更高水准的“现实”。究竟新指令还能带来多少性能增益呢？这取决于精确的代码和外界的支持。英特尔相信，这些改变是引人注目和显而易见的。它会对娱乐和教育软件，工作站软件，使用3D技术的商业数据，电子商业产生重大影响。

开发商还可以充分利用MMX2，以新指令集重新编码自己的3D库。要知道，只有使用标准的3D API，英特尔才能保证它们会得到相应的优化。

其次是三维物体，MMX2不仅对3D场景有作用，而且能对游戏中活动的物体和人物加以改善。Katmai提供的额外计算能力能够支持现有技术，如：在复杂目标和移动物体上的碰撞侦察和对象物理化。它也可以使用未来的技术，如：前置运动和后置运动（它们能改善应用程序中的刚性和固态物体，让之接近真实）。最终用户将感受到交互性和真实性都有巨大的变化，在动作游戏中会“碰到”或“抓住”人物，在飞行游戏中机翼的收缩等等。现在的游戏开发者开始使用一种可变形的“网皮”技术，比较于传统的刚性着色来说，它可进一步表现出物体的弯曲与柔和。现在大多数游戏人物的身体都是由一块块方格组成，因为它们还缺少每个坐标的实时定位运算，所以拥有牵线木偶般的外貌是不足为奇的。

再次是成像计算。图像处理（特别是一些不常用的操作）亦受益于Katmai的平行编码和数据结构，图像变形的操作使用浮点计算比整数运算减少了一些CPU时钟周期。它可增加图像尺寸和图像混合操作，这对商业和个人绘图软件，高分辨率数字相机，高端图形工作站都有极大的帮助。

第四，视频加速。视频编辑软件比成像计算的要求更苛刻，高配置的机器是必不可少的。因为它需要大量的实时运算，不论是个人视频创造软件，还是专业视频生产软件，都要保证视频流数据运行于24－30帧/秒。除了图像操作之外，作为视频计算核心的压缩/解压运算法则也很重要，加入MMX2可以使应用程序得到更高分辨率的图像和更快的帧数，它们是：MPEG，DVD/MPEG2和Indeo。

第五，语音识别。IBM的ViaVoice曾指名要MMX技术，那么MMX2又能为语音识别系统带来什么呢？Katmai可对前置语音处理作加速，把新的代码增加到软件中能增强它搜索所需匹配单词的能力，它能减少出错的比率和缩短响应时间，越来越多商业和个人软件将采用语音识别技术，这绝对是一个令人兴奋的消息。

第六，音频输出。大多数音频输入和输出采样率是16位，许多中介音频处理都需要强大的浮点处理，包括FFT，FIR，IIR，平行信号处理滤波技术。SIMD浮点处理能让开发者容易利用杜比数字音频之类软件技术，作用包括：以多音源产生3D音效，修改声音样品取得不同效果，实时生成相应音乐，用物理建模造出高品质的乐曲和音轨，动态和交互式语音。

MMX2的其它好处在以后一定还会被发掘出来，但愿它不要像MMX技术一样，只获得了不太多的支持。

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:10

举报帖子
删除单贴
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	第 4 楼

CPU——辉煌的今日（AMD）

作为排位在INTEL公司之后世界第二大CPU制造商的AMD，在X86时代，一直都能够紧跟着INTEL的步伐，产品的技术与推出时间和INTEL相比并没有什么明显的差别，以致与在那个时候，我们就知道有286、386和486，可是并没有详细地去分是INTEL还是AMD，或者是CYRIX的。我们应该感激AMD这位一直以来都在不断努力，力图超越自己和CPU巨人INTEL的急先锋。正因为有了AMD和其他公司在不断地给予INTEL强有力的挑战，CPU才会如此快速地降低价格，而且CPU的发展也一日千里，介绍AMD公司的产品，就要从他们从X86的“阴影”里面脱离出来的第一款产品：K5说起。

由于INTEL在486之后就再也没有出过以阿拉伯数字命名的CPU，而是推出了一个拉丁文的Pentium，AMD也被迫着改换门庭，另起炉灶，推出了自己设计并且生产的K5CPU。K5系列CPU的频率一共有六种：75/90/100/120/133/166，内部总线的频率和Pentium差不多，都是60或者66MHz，至于倍频则全部都是1.5，核心电压都是3.3v。作为一款与Pentium竞争的产品，AMD的确做得非常出色，虽然再浮点运算方面比起INTEL的来说是略逊一筹，但是再整数运算方面却一点也不会比INTEL差，由于K5系列CPU都内置了24KB的一级缓存，比Pentium内置的16KB多出了一半，因此在整数运算和系统整体性能方面甚至要比同样时钟频率INTEL要高。

K6：

在INTEL发表了新一代的P6结构CPU：Pentium Pro以及多能奔腾MMX之后，市场上继续出现一款能够与两者相抗衡的产品，在这个时候，AMD推出了自己研制的新产品棗K6。

K6这款CPU的设计指标是相当高的，从一开始，AMD就想利用K6的优秀性能将Pentium比下去，K6具有MMX技术、更多的片上高级缓存（32K指令、32K数据）与K5相比，可以平行地处理更多的指令，并运行在更高的时钟频率上。在整数运算方面，AMD无疑是做得非常成功得，基于AMD的K6/233在Windows95的商业测试中性能已相当接近PentiumII/233，但仍有几个百分点的落后。由于K6具有更大的L1缓存，所以随着频率的增长，它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地方是在运行需要使用到MMX或FP（浮点指令）的应用程序方面，比起同样频率的Pentium MMX，甚至没有MMX的奔腾都要差许多，这样就使K6在某些3D游戏方面的表现远不如INTEL的出色了。另外，AMD的MMX单元一次只能处理一条指令，而Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要差一些。AMD没有象Intel那样为这些功能投入资源。浮点和MMX 性能主要取决于两点：处理周期和吞吐量。处理周期是指从一个指令开始到完成所用的时间。这个性能描述了处理器完成一个操作所需的时间。吞吐量指的是一定时间内可以开始进行处理的指令数量；在一个管线化的乘法单元或浮点单元中，两个或多个操作可以并行执行，这增加了吞吐量，但同时也延长了处理周期。所有Intel的CPU都具有完全管线化的MMX和浮点单元，所以在每个时钟周期内都可以开始一个新的操作，虽然每个操作的结果可能在几个时钟周期后才能出来。但执行一个长的顺序计算操作时(这种操作是典型的多媒体应用中常用的)，吞吐量比处理周期更重要。

AMD的K6在处理某些MMX操作的时候具有比Intel的CPU更短的处理周期，但单个操作的吞吐量是一样的，而且较短的处理周期并不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处理两个MMX指令，但它的MMX单元只含有一个乘法单元和一个移位单元，所以它不能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点处理方面起作用，因此K6在某些操作上的处理周期仍比Intel的短，但它每两个时钟周期才能开始一个操作，而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮点操作来说，AMD的芯片的吞吐量只能达到Intel芯片的一半。这种弱点在ZD 3D WinMark 97 测试中充分的暴露了出来，这个测试综合了浮点运算，包括Pro/Engineer，AutoCAD和一些PhotoShop 测试。在这些测试中，K6/233要比Pentium II/233 慢，有时甚至比Pentium MMX/233慢。在3D WinMark 测试中，如果使用软件模拟方式来完成所有3-D任务，K6/233的性能只有Pentium II/233的三分之二，使用一个好的3-D图形卡，这种差距缩小到18%，仍然相当可观。与Pentium MMX/233 比较，K6/233在软件模拟方式下慢18%，使用好的图形卡也慢7%。

但是作为AMD对 INTEL的沉重一击，K6的确是光荣地完成了任务，市场在占有率因为这样而上升到了历史的最高点。由于在一段时间里INTEL出现了放弃低端市场的念头，因此AMD的名声可谓到达了颠峰！

K6系列CPU一共有五种频率，分别是：166/200/233/266/300，五种型号都采用了66外频，但是后来推出的233/266/300已经可以通过升级主板的BIOS而支持100外频，是CPU的性能得到了一个飞跃。在倍频方面，K6系列是从2.5~4.5不等，核心电压则是有2.9，3.2，22三种，特别值得一提的是他们的一级缓存都提高到了64KB，比MMX足足多了一倍，这也是K6的整数性能为什么要比MMX好的缘故了。

正所谓山雨欲来风满楼，AMD公司连续推出的好几款CPU的性能与INTEL公司的都十分接近，这表明AMD已经有足够的实力来研制比INTEL更加先进，而且性能价格比更加高的产品了，不出所料，1998年中，AMD最新K6-2处理器正式推出。这是首款采用3DNow!技术的微软视窗操作系统兼容型X86微处理器，内置3DNow!指令及超标量MMX功能，可以产生栩栩如生的影象和图形效果、大屏幕的影音效果，并为用户带来更精彩的因特网经历。K6-2从诞生的那一天起，就凭借其最新的技术得到了包括微软在内的各独立软/硬件供应商的支持。这款K6-2是AMD公司自推出K6CPU后又推出的一款采用最新3DNow技术的CPU，它采用了全新的硅晶体制造技术（学名叫CS44E IC，并用C4倒装），将硅晶精度提高到了0.25微米，硬是将原来K6晶体面积（Die size）的168mm2降到了现在的68mm2，同时晶体数量也增加了50万个（成为930万个），其余结构基本同K6相同，L1 CACHE仍是64KB，但它的面积也比以前的小了，仅有原来的1/2大。此外它的工作电压也从2.9/3.2伏降到了2.2伏，据推测，它的耗电量有可能还不到10瓦。并采用最先进的3DNow技术。当前，随着新一代CPU运算速度的提升，以及许多新的显示芯片纷纷内建了3D图形加速功能，毫无疑问，3D图形加速技术已成为98年的新主流。可是谁才真正是3D运算的核心呢，看来CPU与显示卡厂商还有的比拼。

尽管Intel宣布了MMX指令集能够加速多媒体的应用，尤其是影像处理方面，不过直到MMX一代为止，这还仅限于2D方面，3D的许多图形函数库的运作是不可能*这区区57组MMX指令集就可以实现了的，而且它还需要浮点运算指令的配合，更要花上数百千行的程式执行码才能尽其职能。但事实上应用MMX加速的效应虽然也有，但极为有限，偏偏MMX的规划又跟浮点运算的区域重叠，造成了MMX与FPU指令过于频繁的切换，反而把MMX加速所节省下来的时间给抵消掉了！AMD在K6获得MMX指令集支持后，就看到了这个问题的弊端。于是在它K6获得成功之后，AMD就提出了自己的AMD 3D技术结构。一个3D影像实体的产生，依先后次序分为四个阶段：第一，是应用软件或游戏软件提供3D环境的素材（类似于基本数据的传送），此部分着重浮点运算；第二，是通过空间几何学，画出物品的框架与轮廓，此阶段仍然要*浮点运算；第三，进行视野修正（三角形修正法），依视角作形体的修正；最后再进行实体着色，画出真正的3D立体实体。AMD的3D技术，就是针对第一阶段、第二阶段、第三阶段的重点部分做加强支持，事实上这三部分也是比较依赖CPU的部分；至于第四阶段因为要涉及到具体的着色、合成等运算，AMD就将其就完全交给3D加速卡去全权负责，因为各个显卡厂商都有自己影像合成、着色方面的的独门秘诀，AMD想挤进去还做不到呢！这也比较合理一些，业有所长，术有专攻嘛。怎么样，看了AMD的3D技术有何想法？别着急，K6 3D从880万颗晶体加到了930万颗，它可是还增加了不少新功能啊。其中包括增加Superscalar MMX Unit，现在K6 3D在一个时钟内可以执行解码/执行两条MMX指令。而且不受指令配对的限制。（P55C/Pentium II中有个限制：不能在同时钟下执行两个MMX乘法指令）增加24组专门为3D加速的新指令（AMD 3D指令集），它可以一道指令执行多个浮点运算。针对此24组指令，它还可以加快3D影像处理、声音合成等的执行速度，当然它的3D指令要配合3D加速卡才行。而且它不会再象MMX那样使用重复的浮点运算的区域，造成指令的重叠了。100MHz的外部总线频率，它可以大幅度提高CPU与L2 CACHE和DRAM之间的交换速度，进而提升整个系统的性能。

说到了K6-2，自然要向大家介绍一些有关3DNow!技术的知识：

AMD为确保系统发挥更高的三维图形性能而对x86处理器结构作了改进，3DNow!技术便是这个研发过程的第一项成果。这项新技术可提高三维图形、多媒体、以及浮点运算密集的个人电脑应用程序的运算能力，使“逼真的运算平台”成为现实。3DNow!是一组共21条新指令，可采用单指令多数据(SIMD)及其它加强的性能以缓解主处理器与三维图形加速卡之间在三维图形通道上所形成的传输瓶颈。3DNow!技术可加强三维图形通道前端的物理及几何运算功能，使三维图形加速器可以全面发挥其性能。由于K6-2处理器备有SIMD式的指令以及双寄存器执行通道，因此可以在每一时钟周期内执行四个浮点运算。K6-2/333的浮点性能最高可达1.333 Gflops，较Pentium Ⅱ 333及Pentium Ⅱ 400的浮点性能优胜很多(这两款Pentium的最高浮点性能分别只有0.333 Gflop及0.4 Gflop)。AMD-K-2-300可发挥1.2Gflop的最高浮点性能，若与最高性能只有0.3 Gflop的Pentium Ⅱ 300比较，K6-2-300的三维处理性能要高3倍。在3DNow!技术的支持之下，供应商可开发性能更强劲的软硬件应用方案，Windows兼容型个人电脑可以发挥更卓越的三维图形性能及更逼真的视觉效果。3DNow!若与各大三维图形加速器配合使用，可发挥各种不同的优点，其中包括以更高的帧速率播放高清晰度画面、建造更接近真实世界的物理模型、更逼真的三维图形及影像、以及可与影院媲美的影音效果。在制定3DNow!技术标准及整个计划执行的过程中，Microsoft、应用程序开发商、图形供应商、以及x86处理器供应商均提供意见，整个计划获得业界广泛支持。3DNow!技术可与现在的x86软件兼容，经过优化，适用于3DNow!技术的应用程序可以与现时所有的操作系统配合运行。

由此可见，AMD公司的产品是首次在整数性能以及浮点运算性能上同时超越INTEL，这是何等令人兴奋的消息，也正是因为K6-2的推出，让INTEL感觉到了危机感，不但CPU的价格一路下降，而且本已经打算停止生产的赛扬系列CPU又推出了最新版本棗内置128KB一级缓存的赛扬A。让我们广大的电脑爱好者欣喜若狂！

再说回去K6-2，它的频率目前也是有五种：266/300/333/350/400，核心电压都是2.2伏特，所以发热量比较低，一级缓存比起K6没有丝毫的改变，同样是64KB，不过在这五种型号里面，我们应该注意一下K6-2-400，可以这样说，它是目前CPU市场上性能价格比最高的产品，为什么？且听我慢慢道来：

K6-2自从上市以来一直被超频爱好者所“不齿”，就是因为它的超频性能不好，但是K6-2-400的发布却是值得我们骄傲的，我拿到一块K6-2 400的样品之后马上对其进行测试，使我惊奇的发现，这颗小小的芯片竟有如此潜能，一举甩掉了K6-2不好超频的历史，足以与和PII争个你死我活。当Intel Celeron 300A 以其最优的性价比赢得市场后，K6-2的日子越来越不好过了，具有重大意义的K6-2 400也就在这个时候横空出世，如果你说AMD K6-2的优势何在？可能就是它的低价格和接近PII的高性能。可自从Intel Celeron 300A 处理器的产生，改变了INTEL一贯的高价格，并且赛扬的价格比K6-2还要低，这时K6-2的价格可没有任何优势可言，但同频率的赛扬在综合性能和K6-2还有一点差距，这对K6-2来说可能是个好消息。但别望了，赛扬的超级超频能力可以说有此疯狂的地步。Intel Celeron 266可以超到450MHz，Intel Celeron 300可以超到500MHz，这不能不说对K6-2是个压力。为此，K6-2自从K6-2 350后，就开始注重芯片潜在的能力的研制和开发。在今天他推出的K6-2 400就能说明这一点。K6-2 350可以上400MHz，甚至有人超到450MHz，而更让我们惊奇的是K6-2 400可以超到500MHz（准确地说是504MHz），我甚至向更高的550MHz冲剌，可是失败了，开机能自检为550MHz，但一会就当机了。对于超频的方法在往后再慢慢阐述，我要声明的是，K6-2 400超到500后系统非常稳定，能完整地通过全面测试，至少我是这样。

经过详细测试，赛扬300A已被锁死在100x4.5上，而Celeron 333Mhz 已被锁死在100 x5之上。而且测试之后还可以看出 K6-2 和Celeron 只差 0.97%,可以忽略不计，要知道因为PII的L2快取是主频的一半，在500MHz时即为250MHz，而此时的K6-2 500MHz的L2快取还是100MHz，所以K6的分数低一点也是有原因的，至于3D图形性能实在太令我吃惊了，K6-2的性能居然超过了对手33%，性能的巨大提升不能不说明了AMD的实力，尤其是K6-2的3D NOW！K6-2 400的性能表现非常出色，它能更好地实现性能和价格两者的关系，这使我们在选购电脑时又多了一种选择，并且延长了S7主板的寿命。

K7:

是AMD公司刚刚推出不久的全新CPUMD目前采用3D NOW！指令集的K6-2处理器，广受好评。而新一代功能强大的K7继续采用3D NOW！指令集。AMDK7采用200MHz的外频！而Inter公司明年有可能只会推出133MHz外频的处理器。AMD甚至表示，2000年时，将会推出基于1000MHz外频的产品。而且在K7的设计之中，AMD放弃了一直都沿用的Socket 7结构，转向将采用卡匣式结构，这样看起来，AMD K7更像是PII了。据AMD所公布的资料显示，K7第一个版本采用的是0.25微米的制造技术，而后将采用0.18微米新工艺。K7加强了整数、浮点运算和多媒体运算的能力，具有每次可发出九条指令的超阶层微架构、超阶层管线的浮点运算单元。K7并没有采用INTEL的GTL+系统总线协议，它使用的是Digital公司的Alpha系统总线协议EV6。EV6系统总线有许多的优点，首先它有许多比GTL+更为优秀的构造，例如点对点布局。其次它可以支持200mhz的外频，也就是说我们一年以后见到的K7有可能工作在200mhz的外频下，K7将是第一个真正支持RDRAM或DDR SDRAM的CPU，其中RDRAM可以提供1.6GB/S的数据传输。K7没有把Cache内建在处理器里。但是，K7具有64位可编程控制的后置式L2 cache界面，可支持512KB~8MB的二级缓存。

现在我们就来看看K7的结构到底是怎么样的：

　　·3个并行的X86指令解码器；
　　·9个为高频率优化的超标量微结构；
　　·动态推测时序，乱序执行；
　　·2048个入口分支预测表和12个入口返回堆栈；
　　·3个超标量乱序整数管道，每个包含：
　　　整数执行单元
　　　地址产生单元
　　·3个超标量乱序多媒体管道；
　　·64K指令一级CACHE＋64K数据一级CACHE，每两路相关；
　　·2个通用64位数据CACHE装载/存储端口；
　　·高速64位后方2级CACHE控制器：
　　　支持512K到8MB二级CACHE
　　　可编程接口速度
　　·高速64位系统接口：
　　　200MHz系统总线。

接下来我们就看看K7各种详细的性能指标：

一、K7采用的系统总线：

AMD的K7处理器并没有采用和Intel的GTL＋相同的系统总线协议，它使用的是Digital公司的Alpha系统总线协议EV6。顺便说一下,Alpha处理器是一种用于服务器系统的纯64位处理器,其性能优于现在用于PC系统的处理器。K7使用的EV6系统总线有许多的优点，首先,它有许多比GTL＋更为优秀的构造，例如它使用点对点布局。其次它可以支持200MHz的外频，也就是说我们一年以后见到的K7有可能是工作在200MHz的外频下，K7 CPU将成为第一个从高带宽内存如Direct RDRAM和DDR SDRAM中受益的CPU。Intel的GTL＋结构在100MHz总线下的尖峰带宽只有800MB/s;在133MHz时只有1066MB/s。Direct RDRAM和DDR SDRAM在100MHz总线下能提供1.6GB/s的带宽,这种带宽正好配合K7的200MHz EV6总线。到K7发布的时候,我想大家手上的SDRAM都得扔掉了（到那时SDRAM也已经落伍了），因为能和200MHz外频相配的内存只有Direct RDRAM和DDR SDRAM。没办法,如果你是一个狂热的电脑爱好者,手头又有足够的银子的话,就可以去买了，当然花这些钱还是值得，这对于计算机的性能会有较大的提高。

二、K7中的Cache：

AMD将在1999年底推出内建L2 Cache的“Sharptooth棗钢牙”（K6－3）处理器，不过新一代的K7没有将L2 Cache建在处理器内，但是，K7内置的tag RAM足以支持和Intel的PentiumⅡ处理器一样的512KB的L2 Cache，同时AMD还考虑生产像Intel的P6 CPU一样的外置的tag RAM，来支持不少于2MB～8MB的具有64位可编程控制的后置L2 Cache。虽然K7将不会把L2 Cache内建在处理器里，但是L2 Cache的速度将占CPU主频的1/3至全速，并且L2 Cache将使用SRAM或者DDR SRAM以保证其速度。K7将拥有不少于128KB的L1 Cache，其中，64KB将作为数据缓存，剩下的64KB将作为指令缓存。要知道PentiumⅡ只提供了仅有32KB容量的L1 Cache。有传言说Katmai可能会有不少于64KB的L1 Cache，但这也仅是K7的L1 Cache容量的一半。拥有大量的L1 Cache对高速的处理器来说是必须的，没有足够的缓存是导致处理器性能提高的一大瓶颈。灵活的L2 Cache设计，使得AMD可以像Intel一样，通过L2 Cache的大小和速度来决定CPU的用途，工作站或是服务器。K7将和Intel的Deschutes内核一样有64GB的寻址空间，但Slot 1只有4GB的寻址空间，而Slot A可以有64GB，故而K7的缓存空间也能达到64GB。因此，我认为使用加大缓存容量和DDR SDRAM作为L2 Cache的K7一定能够提供非常优秀的性能。

K7微结构优点：

K7有三条并行的x86指令译码器，用于将X86指令翻译成定长的微指令，每条微指令可以执行1到2个操作。K7有两种不同的译码流水线做这个工作，直接路径译码器快速地译码通用指令，而辅助路径译码器在微代码ROM中检索复杂的X86指令。K7有72个指令控制单元指令，控制单元分配微指令到乱序整数管道和乱序多媒体管道中去。乱序整数管道可以支持15个微指令，最大可同时进行30个操作，它的工作是分配3个独立的操作到3个并行的整数执行单元中去，每个执行单元都带有一个地址发生单元。地址发生单元能够通过优化L1和L2缓存数据的存取来保证最快的操作速度。

总之：K7的推出，所造成的最大的挑战是Intel即将发布的Coppermine棗带有同步L2缓存的0.18um工艺的Katmai。Coppermine的结构仍将与Katmai类似，因此Coppermine只有通过更高的主频来还击K7。这将是Intel公司1999年7月以前的主要任务。也许KNI与3D Now!的对抗将使得一切都不同。很明显，AMD不仅仅是发布一种新的CPU，而是一个正面进攻计划，对Intel的逐步进攻，直到K7的最后攻击。这就是为什么引入像Slot A这样的新的平台。K7卓越的设计将会吸引众多人的注意。Intel将不得不面临一场艰苦的战役。只有一个全新设计的CPU才有机会击败K7，因此他们只能比计划大大提前地推出Willamette，总而言之CPU发展下去将是好戏连场，绝对不容错过呢！

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:10

举报帖子
删除单贴
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	第 5 楼

CPU——辉煌的今日（Cyrix，IDT，RISE）

Cyrix

Cyrix 也算是一家老资格的CPU开发商了，早在X86时代，它和INTEL，AMD就形成了三雄并立的局面。自从INTEL另辟途径，开发了Pentium之后，CYRIX也很快推出了自己的新一代产品棗5X86。可能是CYRIX低估了独立研制一块CPU的难度吧，5X86可以说是一款失败的产品，没错，比起486来说性能是有所增加，可是比起Pentium来说，不但浮点性能远远不足，就连CYRIX一向自豪的整数运算性能也不那么高超，给人一种比上不足比下有余的感觉。有余5X86可以使用486的主板，因此我们一般将它看成是过渡产品。

后来CYRIX见势头不对，为了挽回面子，又匆匆推出了6X86系列的CPU，自从Cyrix与美国国家半导体公司合并后，使其终于拥有了自己的芯片生产线，其成品将会日益完善和完备。Cyrix的6x86是其投放到市场上的与Pentium兼容的处理器。它使用的是PR等级评定来进行CPU的标称。其PR-133CPU，运行在120MHZ，性能却同Pentium 133是相同的。但其发热量巨大。后期发布的是6x86LCPU，该CPU使用的是双电压设计，即核芯电压是3.3，I/O电压是5V。从而大大降低了CPU的温度，该档次的CPU，PR-200+使用的是75MHZ的外频在150MHZ的时候就提供了与Pentium 200相同的性能，可见CPU外频的重要性。到了MMX时代，Cyrix推出了他们的MX CPU，这一档次的CPU全是采用双电压设计，频率从166-233MHZ，到266-300时用MII来命名。Cyrix的MX CPU的整数性能是无与伦比的，但其MMX和FP性能和AMD一样，都比同档次的Pentium要差，MX的MMX和FP性能比K6还差，这些好像是Cyrix CPU的一贯特色。其MX的CPU发售的有60、66、75MHZ的几种，60MHZ的是测试版，66和75MHZ都是正式发行版，为什么有两种版本呢？因为当时Cyrix还没与美国国家半导体公司合并，其生产工艺还不过关，它就把上不了75MHZ的CPU标成同档次的66MHZ外频的来卖。

Cyrix作为非Intel阵营的另一个重要成员，1998年主要是在原有产品基础上进行改进，推出新的升级产品。1997年Cyrix曾推出了低价位和高集成度的Media GX，促进了1000美元以下PC机市场的兴起。Cyrix在1998年作的第一件事，就是把Media GX升级为具有MMX功能的版本。同时，Cyrix对它的拳头产品6X86MX作了进一步的改进，采用了新的名称MⅡ，并在1998年4月问世。MⅡ采用了更先进的技术，因此具有更快的内核速度和总线速度。

而为了继续向中、低端市场进攻，CYRIX又打算推出最新一代的CPU——Jalapeno。

Jalapeno的内部与6X86、6X86MX、MII等第六代芯片不相同，完全是一种新的架构。Cyrix发现了对机器性能有影响的内存反应周期瓶颈，于是使用芯片自带缓存/内存控制器与高速I/O接口，以及缩小芯片体积的方法，减少内存反应时间和增加数据传输带宽(3.2GB/秒)，从而加快了CPU的运算。Cyrix的方法有以下几种：二级I缓冲预示，2个不确定的预测命中；二级D缓冲预示，4个不确定的预测命中；独立地从DRAM中取得二级I错误和D错误(25~50%的二级错误预示，强制性错误时减少预示延迟，256KB做到512KB的工作)；自带内存控制器减少内核到DRAM的存取时间，使Socket7系统的存取时间达到20毫微秒(DRAM存取时间除外)，而普通的Socket 7/Slot 1总线只有50毫微秒；内存控制器有32个开放页，比一般的芯片组还要多；使用RDRAM(Rambus Direct RAM，直接型RambusRAM)。高速处理器受限于纵深管道和二级缓存，Jalapeno的11条纵深管道可达到GHz级，8路互联交*256KB二级缓存能工作在与芯片相同的速度下，所以Jalapeno能拥有较高的时钟频率。另外，图形子系统会使用二级缓存来作纹理缓冲区，在进行3D图形应用时，全速的256KB L2 Cache甚至可以比得上传统的512KB L2 Cache。

Jalapeno的新浮点单元是个双重FPU/MMX结构，它包括了两个完整的指令管道，独立的X87加法器和乘法器，因而两个FPU都支持MMX和3DNow!指令，而且它们不会相互干扰。新内核还集成了3D图形引擎，这是Cyrix第一次利用双重FPU来对图形子系统作优化，再加上CPU内部集成的3D图形控制器，使Jalapeno得到了极强的三维应用能力。因为M3使用了UMA(Unified Memory Architecture，统一内存架构)，所以无须再购买图形帧缓存，而且GART(Graphic Address Remappng Table，图形地址重绘表)的速度也比帧缓冲快，可谓少花钱办大事。同时，它亦运用了NS(National Semiconductor，国家半导体)的Mediamatics多媒体辅助技术，增强了DVD的播放。

下面是Jalapeno的详细内部结构：

一，Jalapeno的X86内核技术参数：

1，双重X86注册重命名和乱序执行(2个整数单元、2个FP/MMX单元、1个分支单元和1个读取/存储单元)

2，11个纵深管道(使用0.18微米工艺，时钟频率可达600MHz，芯片面积为110~120平方毫米，由NS的南波特兰市实验室研制)

3，分支预测(1K入口，拥有7位历史记录和预测ROM的4路BTB，16K返回堆栈入口)

4，16KB，4路IC，2个不确定的预测命中

5，16KB，4路双端口DC，4个不确定的预测命中

6，256KB，8路二级缓存，8个不确定的预测命中

二，Jalapeno的指令解码步骤：

1，从BTB中取得下一条预测指令。

2，IC和缓冲区流出32字节的数据。

3，上行的2个完全X86指令进行检验和缓冲(先上行2个位于前面的字节，这个过程没有缓冲预先确定的数据位数)。

4，解码和流出要运算的数据(本过程仅用了1个内存操作周期)。

5，指令解码到内核中。

三，节点数据发送

1，每条指令将映射到1，2或更多的节点中(每个节点包含来源地址、目标地址和控制代码)。

2，数据将并列地上行到2EX、1AC、1BR和2 FPU节点中。

3，大多数指令都可以通过两个并行处理单元双重流出(这些指令包括padd reg,mem/pand reg,reg；faddreg,reg/fmul reg,reg; add mem,reg/shl reg,reg; cmp reg,mem/jcc)。

4，每个节点由检查、重命名、流出并执行等几个单元组成。

5，Jalapeno内共有16个检查点(96节点)。

四，分支处理

1，独立的分支单元(可获得更多的内核带宽)。

2，标记结果以产生乱序指令。

3，按顺序执行分支。

4，在分支执行和开始改正错误时把其它错误分离。

5，在12个时钟周期内改正错误。

6，分支执行后刷新BTB。

五，整数运算单元

1，完全管道架构。

2，大部分执行指令和结果都能在1个时钟周期内到达双处理单元。RCL/RCR/BSF/BSR需要2个时钟周期，整数乘法(MMX乘法)需要8~12个时钟周期，整数除-1的每位商结果需要1个时钟周期。

3，使用整数乘法和除法对整数进行并列执行操作。

4，快速地把整数变换成FPU/MMX结果。

六，FP/MMX单元

1，完全管道型X87加法器，4/1

2，完全管道型X87乘法器，5/1

3，FDIV 23(SP),33(DP,EP)

4，双重单元同时支持MMX和3DNow(MMX：1/1，转换：2/1，mul 4/1；3DNow：3/1，pfrcp/pfsqrt/pfmul：5/1)

七，读取/存储单元

1，单精度型读取/存储单元的特点有：16KB，4路，非模块型数据缓冲(3周期存取，1周期读入，1周期存储/载满数据)；32入口，完全联合型一级DTLB；512入口，8路二级TLB(Translate Look side Buffers，翻译旁视缓冲器)；12入口的数据存储序列。

2，按请求顺序传输数据。

3，数据可上行到4个一级不确定预测单元(预测错误的数据将变回无序状态)。

4，数据可按序补充到执行单元中

八，二级缓存

1，256KB，8路联合，8路交*存取

2，每时钟周期交*存取可支持：1个一级预测错误或1个一级存储或二级载满。

3，所有管道都运行于同内核一样的频率下

4，从一级缓存到二级缓存有7时钟周期的存取反应时间。

5，256位一级缓存重新载满(非后置式载入)

6，充许用真实代码或运行图形引擎时锁住二级缓存。

九，图形性能及特性

1，3百万个多边形/秒、266M像素/秒，时钟频率230MHz

2，支持Direct3D等工业标准API，雾化，Alpha混合，反混和(Anti-Aliasing)，各向异性纹理过滤(Anisotropic Texture Filtering)，集成MPEG2/DVD回放。

综上所述，Jalapeno系统性能的增强得益于它的新X86内核，256KB二级全速缓存，双浮点单元和一个3D图形引擎，这些都能大大加强新CPU的功能，因此Cyrix准备把新内核用于1999年低发布的处理器M3(速度可达600~800MHz)，以此来迎击英特尔Katmai、AMD K6-3和IDT Winchip 4。Cyrix CPU一向都以价廉物美著称，而Jalapeno面对仍是主流PC，相信公司会继续走原来的低价格路线，用便宜货来占领市场。

IDT

自Intel宣布不再进行基于Socket7的CPU开发后，这一领域的其他开发商和芯片组、主板生产厂商随即团结起来，推出了Super7体系结构，以最大限度地挖掘此体系架构的潜力。美国IDT公司（Integrated Device Technology）作为新加入此领域的CPU生产厂商，一上来就把着眼点放在了低端市场上。1997年IDT推出的第一个微处理器产品是WinChip（即C6），由于问世较晚且生产规模也不大，因此在整个CPU市场上所占的份额很小，还不足1％。1998年5月，IDE宣布了它的第二代产品WinChip 2 。WinChip2有两种版本，一种带有3DNow！指令集，命名为WinChip 2－3D；另一种不带3DNow！指令集,其命名为WinChip 2，没有后缀3D。WinChip 2在原有WinChip的基础上作了一些改进，增加了一个双指令的MMX单元，增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10％，基本达到Intel处理器的性能。WinChip 2目前的最高频率CPU为WinChip 300MHz。

99年的第一季度里面，IDT发布了新处理器WinChip 2+NB，CPU内集成了主板北桥芯片，将会加快芯片到内存的存取速度。但此种做法有几个缺点：一是必须购买新主板；二是提高了芯片的面积，只够集成64K全速缓存到CPU中(性能与存取速度为3-1-1-1的256K二级缓存相当)，毕竟，更大的一级缓存肯定比小量L1 cache+大量L2 cache要好。WinChip 2+NB使用0.25微米工艺制造，世片面积约58平方毫米。

至于即将发表的WinChip2的增强形芯片--WinChip3使用新的内核和超级流水线技术，将比WinChip2快两倍，最低频率266MHz，使用0.25微米工艺制造，世片面积约75平方毫米。

还在发展计划之中的WinChip4是真正的第二代Winchip处理器，使用0.25微米工艺制造，世片面积约95平方毫米(如果用0.18微米工艺制造，世片面积只有60平方毫米)，它比153平方毫米的赛扬A(0.25微米工艺)要小得多。拥有128KB一级缓存，芯片频率为400~700MHz，芯片电压为16W(2.5V)或9W(1.8V)。以下是Winchip4的芯片和缓存规格：

1，11进程管道(目前的CPU只有6进程)

2，管道缓冲(读取时间为1个时钟周期)

3，相关的单控制逻辑和数据路径

4，使用动态逻辑芯片

5，6层金属制造

7，指令优化功能，适合高频率芯片而且不会浪费处理器的计算时间

6，2*64KB，2/4路一级缓存

7，2*128，8路一级TLB。

8，缓存可做智能预测、写入分配、合并和动态锁定等工作

IDT为WinChip4提供了发展工具包(PLA发生器，逻辑优化等)，软件商们使用这些程序可以让自己的软件在新处理器上更好地工作。WinChip4使用新式的预测算法，增加分支预测时的成功率。99年底，IDT将把WinChip4推出市场。从技术上来看，WinChip4的竞争对手是英特尔赛扬A，AMD K6-3和Cyrix MII jedi，它们的产品各有特点，很可能会斗得难分难解。

Rise

Rise公司是一家成立于1993年11月的美国公司，主要生产x86兼容的CPU，但在1998年以前很少有人知道它。一年前，该公司如此彻底地改变了它的运作方式，使人不能不注意到它。它开始在媒体上大做广告并发布了许多令人意想不到的内容。坦率地说，Rise公司的行动看起来象是把广告宣传而不是生产硬件当成主业了。在这其间，Rise公司宣称将为笔记本及1000美元以下市场开发基于Socket 7的x86兼容CPU-著名的mP6 CPU。根据Rise公司的说法，不管该CPU的价格怎样，它将与同主频的Intel Pentium II CPU一样快。这是通过使用超流水线的超标量结构技术来实现的，它可以让3条整数指令或3个MMX指令或者2个浮点操作同时进行。这是理论上超过Pentium II最好的方法，因为Pentium II只有两条整数流水线，一个单FPU单元和2个MMX单元。因此，我们认为只有还未面世的AMD公司的K7 CPU才是它唯一有威胁的对手。的确，这一切看起来是很有可能的，特别是当你看到Rise公司熟练的工程师队伍的时候。虽然他们没有生产能力，但他们有80名拥有在如AMD、HP、IBM、LSI、Logic、MIPS、NEC、Sun这样的处理器公司工作经验的工程师。

不过有实力是一回事，所推出的产品如何又是另外一回事了，现在的MP6已经可以在市场上看到，我们可以发现它的确是名不虚传：

mP6不仅价格便宜，而且性能优秀，有着很好的多媒体性能和强大的浮点运算，在98微处理器论坛上他们演示了mP6，它可以很出色地工作在WINDOWS下，并且mP6-266的DVD软解压为28帧/秒，这个数字就连PII300也很难达到，并且它还支持软件调制解调器，利用软件和一些必要的连线就可以上网，些时的CPU占用率只有10%，不仅如此，它还演示了其它多媒体能力和视频会议系统，总之mP6在每个方面都有优秀的表现。MP6每个时钟周期可以同时执行3条X86整数指令，目前只有Intel的Pentium II处理器在执行指令时才能做到。同时mP6每个时钟周期可以同时执行3条MMX指令，目前Pentium II处理器才只能2条。并且MP6通过一个管道浮点单元还能做到同时处理多个浮点运算，这样就大大提升了它的3D处理能力。很可惜mP6为了降低成本所以只有16KB的一级缓存，但还将推出的第二代MP6处理器会有16KB一级缓存和256KB二级缓存。mP6的目标就是笔记本电脑，所以它的耗能很低，其中mP6-233的最大功率是8.2W，要知道K6-2 233MHz是9W，K6-2 266是9.8W，PII 266更高，为19.5W。另外mP6使用了特殊的电路来作芯片的能源管理工作，无须用户干涉，十分适合用作笔记本电脑的CPU。mP6使用Socket 7/Super 7兼容插座，现在正在和ALI合作生产主板芯片组，它可以提供100MHz总线、AGPX2支持、DVD软解压、软件调制解调器、高级电源管理系统，看来RISE的加入，又替风云变换的CPU市场增加了一道风景线。

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:11

举报帖子
删除单贴
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具

    等级：管理员
    文章：234
    积分：2491
    注册：2005-09-07

	第 6 楼

风云济会，大浪淘沙——CPU市场动向　

大家都明白到，作为计算机的核心部件，CPU具有不可替代的地位和作用，同时它也是PC中利润率最高的部件之一。早在1981年，当“蓝色巨人”IBM选择Intel公司的8088作为首台个人计算机的CPU时，Intel仅是一个名不见经传的“小人物”，但上帝给了这个“小人物”成为“巨人”的最佳机遇。多年来，Intel通过不断更新其产品线，使PC工业从286、386、486进入到了今天的PentiumⅡ时代，获得了丰厚的利润。不过，时至今日，Intel在CPU市场中的绝对优势地位已被动摇，AMD、Cyrix等兼容厂商正在抢夺本属于Intel的CPU的市场份额。

据PCData的统计资料表明，1997年7月～1998年6月，Intel与其对手AMD处理器的市场占有率形势逆转。在1997年时，Intel在一般PC处理器市场占有率为91%，但到了1998年，Intel的占有率已跌至60%；而其竞争对手AMD，1997年在一般处理器市场的占有率低于10%，但在1998年，却上升到34%。而在低价PC处理器市场，Intel与AMD的交替现象更为明显。在1997年中，Intel的市场占有率高达72.3%，但在99年，其占有率减为34.6%，降低了约33%，而AMD的占有率则从1997年的3.6%上升到1998年的51.2%，上升近50%。业界人士指出，目前主机板发货量中，采用AMDCPU主机板大幅超过IntelCPU的主机板，预计在低价PC芯片市场上，非Intel阵营将继续扩大市场占有率。

另据IDC预测，未来5年内，高于1000美元的PC市场增长在10%，而更低价位的PC，市场增长将高达55%。但Intel一贯是高利润经营模式，高端芯片的利润是80%，而低端产品只有50%左右。经营低端产品不仅是利润下降，更主要的是没有市场优势。Intel在1000美元PC芯片市场的份额只有45%，相比之下，Intel在1500美元PC芯片市场的份额就高达99%。尽管如此，基于以下两个因素促使全球芯片巨人Intel必须跟进低端芯片市场。其一是21世纪是泛运算时代，计算机随处可见，这意味着一大批大众化运算装置的兴起，这类装置将采用价格低廉的嵌入式芯片，另一方面，近期PC销售的热点仍是1000美元以下的低价PC。为了迎接其他芯片厂商在低价PC领域的挑战，Intel在98年4月份发布了针对低价芯片市场的Celeron处理器。

但首款Celeron芯片的推出对Intel似乎并没有起多大作用，这种匆忙推出的没有存储器的PentiumⅡ处理器，与价格相同的AMD同类产品K6相比，速度要慢20%。其结果是，今年第二季度Intel交付了100万片Celeron，它的对手AMD和Cyrix共有400万片低端芯片入市。针对于此，Intel又推出了CeleronA、Celeron300和Celeron333。与第一代Celeron处理器相比最大的不同是，它们具有128KB二级缓存，有了它，Celeron300与Celeron333处理数据的速度将加快许多，甚至能与PentiumⅡ300及PentiumⅡ333处理器相媲美。但有的分析家认为，Intel推出的300ACeleron与333ACeleron处理器，要抢回AMD拥有的低价PC处理器市场并不容易，因为CeleronA系列产品的特性与AMD的K6?系列产品相比，市场区别性不高。此外，AMD今年第三季度K6芯片生产量可提高到330万片，市场份额还会增加，而到98年圣诞节Intel新版Celeron满负荷生产之后，Intel进军低端芯片市场的份额增长也只有每年1%的速度，并会一直延续到2002年。

需要说明的是，Intel推出的Celeron是一种低价位的Slot1型处理器，它证实了Intel完成从Socket7型处理器转移到Slot1型处理器的意图。对于Intel来说，Slot结构实际上是按市场需求进行处理器产品线细分的产物。正如采用Slot2的Xeon处理器专用于中、高档服务器一样，采用Slot1的PentiumⅡ、Celeron用于普通台式机。采用Slot1体系结构的CPU使用了不少新技术，它可以有效地解决电磁辐射问题，轻易地将工作外频从66MHz提升至100MHz，在多重处理器的设计上，比平面的Socket7拥有更短的布线距离，可大大降低主板设计难度和工作能耗。不管Intel承认与否，Slot1技术作为一种专利，是阻止AMD等厂商竞争的杀手锏，同时，为了更充分地发挥Slot1的作用，Intel已宣布不再支持Socket7。从目前计算机市场发展的情况看，Slot1是略占上风，这证明，尽管竞争激烈，但Intel在X86处理器市场老大的地位还是站得很稳。

说到Intel的最有力的竞争对手，恐怕非AMD莫属。AMD从386起开发自己的产品，但仍使用Intel的微代码，到了486才是完全由自己设计的CPU。1995年底，收购NexGen之后，以NexGen设计的K6为核心，配合AMD原先的Pentium接口电路，加上Intel授权的MMX功能，尺寸只有162mm2。1997年4月正式发表了166、200、233MHz三种版本的K6与Intel抗衡，并在1997年5月Intel推出PentiumⅡ以前，至少维持了一个月的CPU性能的领先。

为了保持与Intel的竞争，AMD在整个1997年始终保持其K6芯片的价格比同等PentiumMMX芯片价格低25%。而从1998年第一季度开始，AMD以0.25mm工艺正式量产266MHz和300MHz的K6与PentiumⅡ对抗，特别是采用3DNOW！技术350MHzAMD-K6-2处理器的发布，使得AMD可以挑战Intel的高端PentiumⅡ。3DNOW！技术是一组指令集，有21条指令，这一创新的扩展指令集突破了传统个人电脑三维图形计算数据传输的瓶颈，能够发挥更高的三维图形及音频性能。除此之外，为了迎接Intel新型Celeron处理器的推出，AMD将在今年第四季度发布含256KB二级高速缓存，主频为350MHz～400MHz的AMD-K6-3处理器。

AMD等公司的努力得到了市场的承认，据ZDMarket对20多万家美国企业所作的一份调查报告称，到98年6月，AMD和Cyrix两公司在一起出售的微处理器已占有低价PC市场的60%。另外，为了在与Intel的竞争中取得价格优势和为其380MHz及400MHz芯片的上市作铺垫，AMD在98年10月底开始全面下调其K6-23-D处理器的价格。除上述之外，面对IntelSlot1体系结构的挑战，AMD、VIA等厂商联合推出了Socket7的升级产品──Super7体系结构。该体系的最大优势在于在保证与原有Socket7兼容的情况下实现了某些Slot1的功能，如支持100MHz工作外频，同时支持AGP和USB界面。另外，由于技术简洁，此类芯片在价位上比PentiumⅡ要略有优势。目前，AMD已经推出了基于Super7体系结构的K6-2-400处理器。

另外，AMD的K7芯片99年开始上市之后，预计它将成为目前市场上Intel最高档芯片的替代品。同时，按照AMD的一贯策略，K7的定价将比其同档的Intel芯片便宜25%。K7芯片将采用一种称为“SlotA”的新处理器接口。SlotA在机械上与Intel的Celeron和PentiumⅡ使用的Slot1接口一致，但采用不同的系统总线结构，这意味着两家公司的芯片不能用于同样的主板。K7芯片将采用从DEC购得的EV?总线技术，而Intel仍采用其专有的P6总线结构。

在CPU市场，提起Intel的竞争对手，除了AMD，就应该算是Cyrix了。他们在CPU市场呈三权分立的格局并各有特点。Cyrix于1996年推出6X86，1997年6月推出6X86MX（原称为M2）。Cyrix自从为Compaq生产世界上首台1000美元以下PC提供MediaGX微处理器后，一直在业界强调大力推进低价位、高性能电脑芯片的市场成长率。97年11月，国家半导体（NationalSemiconductor简称NS）与Cyrix合并，98年8月底，NS在美国缅因州的SouthPortland厂房已采用先进的0.25mm工艺技术生产CyrixMⅡ及MediaGX处理器，并在98年9月开始供货。预计该厂房的处理器产量可在今年第四季度提升至NS半导体总产量的75%，工艺技术明年可达0.18mm。CyrixMⅡ强调的是Cashes，不但比Pentium多了一倍，而且是64KBunified加上256bytesinstr-cashe。在IBM发布的Benchmark中，除了PR233与IntelPentiumⅡ数据相同外，其他都比MMXPentium及AMD-K6出色；Cyrix的Benchmark则是PR200，PR166比同级MMXPentium出色，PR233与PentiumⅡ相比只是略逊一筹。此外，CyrixMⅡ的价格也比同级Intel的MMXPentium低25%～50%，也比AMD-K6来得低。

从某种意义上说，Intel与AMD、Cyrix共存绝非坏事，不仅可免除反托拉斯起诉，也可免除系统单一货源的顾虑，还可将标准一起建立起来。由此看来，CPU市场既需要竞争又需要合作，而对用户来说，质高却物美价廉永远是他们的选择。

CPU——展望未来

产品的未来

传统的微处理器体系结构注定了它们好像总是显得“心有余而力不足”。人们除了加快指令的执行速度以外，只能通过在一个时钟周期内执行更多的指令（即通常所指的指令并行）来提高微处理器的性能。但是，目前通过编译优化增强并行性从而提高整个系统的性能受到许多限制。为了克服这些局限，我们需要采用一种新的体系结构。Intel和HP已经合作开发出了一种被称为EPIC(Explicitly Parallel Instruction Computing)即显式并行指令计算体系结构。在这种体系结构中，编译器可以从源代码中尽可能地发掘其并行性，并且将这种并行性“显式”地告知硬件设备。在EPIC技术的基础上，他们还定义了一种新的64位指令系统体系结构（ISA），并且已经将其应用到了Intel 64位的微处理器IA－64(代号Merced)当中。同时，IA－64还采用了崭新的指令预测和数据预装技术，从而大大降低了控制指令以及存储延迟所带来的浪费。新一代IA-64的一个主要目标在于：根据不同的性能和成本需要来提供一系列的微处理器。IA－64的体系结构及其指令格式兼容一系列的微处理器，这使得通过IA－64系列产品、附属功能部件以及其他微处理器资源来扩展机器的“宽度”成为了可能。并且，由于增强了指令执行的并行度而进一步改善了性能。IA－64体系结构从一开始设计就注意到了这种“内在的可伸缩性”，同时由于它采用了更为先进的技术，从而使系统的性能有了革命性的提高。

将于2000年推出的Merced将瞄准高端工作站市场。由于其出色的浮点和图形处理能力，Sun、HP和SGI都将采用Merced作为各自工作站和服务器产品的处理器。HP还透露它将推出能够升级到Merced的PA－RISC和IA－32的服务器。为了提高处理能力，Merced拥有三级缓存：一个与执行单元紧密结合的L0缓存、芯片内一级缓存和多达几兆的二级缓存。Merced的下一代产品是McKinley，而Madison则是McKinley的下一代产品。Madison将于2002年投入生产。同一年，Intel还将发布一种用于低价位服务器和工作站的芯片Deerfield。HP新的处理器是64位的PA－8500。根据PA－RISC的长远计划，HP将开发PA－8000芯片的系列产品。到2000年将发布560MHz的PA－8600芯片。 2001年计划推出PA－8700，接下来是PA－8800和PA－8900。PA－RISC将提供1.5MB的一级缓存。其中1MB作为数据缓存，0.5MB作为指令缓存。HP说，1.5MB是目前最大的一级缓存。由于测试方面的原因，Compaq的下一代64位Alpha处理器21264将推迟到1999年6月推出。Compaq认为Alpha技术将会领先于Intel的Merced，于是全力投入基于Alpha芯片的系统的开发。但是Intel已合法地获得了Digital在Hudson一个研究机构的研究成果，这就迫使Compaq加快了芯片的开发速度。否则凭着Intel的超强实力，超过竞争对手不是件困难的事。

到2000年，Compaq将推出1000MHz的21364 Alpha处理器。它的二级缓存将达1.5MB。在32位高端处理器领域，Intel公布了未来Katmai芯片技术。它将提供先进的3D图形处理和影像处理技术。Katmai技术也被称为MMX2，它通过改进内存管理来提升图形和影像处理性能，并提供新的媒体应用，如语音识别等。最近，Intel公布了其Willamette和Foster的芯片计划。Foster芯片展现出Intel新一代32位芯片的全新结构。这两种芯片将在2001年替代PentiumⅡ和Xeon。AMD的官员在论坛上详细介绍了下一代K7处理器，该处理器将于1999年第2季度推出，定位于工作站/服务器市场。K7将支持多处理器架构，这对AMD来说是第一次。AMD的K7将使用Compaq授权的EV6系统总线。据AMD的技术主管DirkMeyer透露，该总线最高能运行在400MHz之上。这样一来，K7与外设通讯的速度将会大幅提升。K7具有128KB一级缓存并支持高达8MB的二级缓存；K7改进的浮点处理单元可为3D图形处理和复杂的数学运算提供强劲的支持。

AMD的K7芯片的主管Dirk Meyer认为K7的浮点峰值速度能到Pentium II的4倍。K7初级产品将运行在500MHz并包括AMD的3DNow!浮点多媒体指令集，这将大大加快图形和多媒体的处理速度。到2000年，AMD将使K7运行于1000MHz时钟频率之上。 AMD面临的最大挑战是工业界是否会支持它的芯片。因为K7不使用Intel的系统主板，AMD不得不说服主板厂商和芯片组制造商生产基于K7的产品。但是，很多公司生产了支持K6的产品，因此可以预计，K7同样会受到欢迎。

在32位处理器市场中另一个不可忽视的产品是Motorola开发的用于Macintosh的PowerPC G4。G4运行在400MHz时钟频率上，拥有2MB的二级缓存，使用100MHz的系统总线。成熟产品预计将于1999年第2季度发布。G4扩展了它的指令集。新增加的128条AltiVec指令用来提升处理器的多媒体处理能力，如视频图像处理等。通过使用SPEC的浮点规范，G4比G3在浮点运算方面提高了50％。

Motorola的项目部经理PaulReed说，在AltiVec指令和PowerPC普通指令之间切换时，不会出现像MMX那样的延迟，G4在对通讯中的数据加密的处理速度是G3的15倍。多个G4还能组成多媒体处理系统，数据能在处理器间传输而不通过存储器，这样能节省50％的处理时间。 G4的400MHz时钟频率、0.25微米工艺生产的样品已经投入使用。随着G4芯片的推出，Apple的操作系统也将改进，以充分发挥G4的性能。

运行于400MHz～500MHz的WinChip 4芯片使用Super 7主板,将于1999年下半年推出。使用0.18微米技术的第2代产品将在2000年上半年推出，时钟频率将达500MHz～700MHz。IDT公司的WinChip C6注重于优秀的性能价格比和低功耗。它拥有580万个晶体管，使用5层金属工艺和0.25微米CMOS工艺，比同级的奔腾处理器小30％～60％。WinChip很适合于笔记本电脑。Rise Technology宣布除了将在今年推出含有16KB一级缓存的MP6处理器外，还将推出的第二代MP6处理器会有16KB一级缓存和256KB二级缓存。如果Rise Technology能推出后一种芯片，那么它将拥有比Intel目前的第二代赛扬处理器多一倍的二级缓存。Rise的处理器之所以能推出第6代，很大原因在于它的并行技术。该技术使得处理器能在一个时钟周期内同时执行3条指令。目前只有Intel的Pentium II处理器在执行MMX指令时才能做到。MP6的特殊性能还包括拥有DVD和Modem功能。MP6通过一个管道浮点单元还能做到同时处理多个浮点运算。这样就大大提升了它的3D处理能力。

未来的技术

硬件业界特别是芯片制造界有一条众所周知的摩尔法则，那就是说：放置再相同空间的电晶片（闸门）数量(会制造出更高的处理速度和能力），每18到24个月应该会加倍。这条理论可以说十分准确，因为从早期的 286、一直到今天的PIII都是这样发展的。不过似乎现在的芯片发展比摩尔定律更加快了，可以说已经达到了“超速芯片”的地步。

最明显的例子莫过于Intel最新推出的500-MHz PentiumIII，还有苹果电脑新推出的新的PowerPC G3处理器，其速度高达400 MHz。而且Intel和AMD也都宣布在2000年制造造1-GHz(相等於1,0000 MHz)芯片的计划。甚至在2005年之前，我们就能够看到5-GHz处理器的出现。看到这些，我们不禁要问：我们真的需要这么高速嘛？印在盒子上的那些吓人的百万频率的数字真的是我买电脑最注重的东西吗？而这些可怕的芯片还会继续“超速”下去吗？

在个人角度看来，处理器当然是越快越好了，这方面应该不是阻挠芯片发展的原因。最重要的是技术方面。很多东西会影响晶片的速度，最重要的是电晶体的尺寸棗简称为闸道。处理器的工作方式就是以复杂的模式开关芯片表面的数千甚至上百万个闸道，所以闸道越小，速度越快。所以不少技术人员就在缩小闸道面积上下功夫，譬如说用极紫外线将晶片表面的影象聚焦到矽的表面上，是蚀刻出来的闸道更加小一些。近年来的芯片里面都是用铝线来做导体，但是随着芯片和芯片内电缆的缩小，铝线的使用已经到达了极限，所以芯片制造商就用比铝线更加好的铜来做芯片，也就是所谓的铜芯片。近日的技术已经能够克服铜和矽的不相容性，Pwoerpc G3 处理器就是使用铜技术制造的，据说K7也将使用这种技术，处理器的速度能够大大提升。但是克服了铝的障碍之后又碰上了一个难题：矽本身的极限。随着闸道越做越小，迟早会达到原子的度量尺度，到时我们的闸道是50个原子宽，还是25个甚至是5个呢？没有人知道，不过连原子也需要再分开的这一天终于要到来，到时的处理器或者要寻觅另外一条出路了，不过这一天距离现在还需要10年到20年。

所以可以这样说，以后的15年左右，是处理器特别是这些“超速芯片”的黄金时期，二十一世纪的处理器，速度之快将是我们难以预料的。

我的个人藏品：

http://www.cpu-cn.com/CN/Collectors1.asp?userid=Henry

2006-02-10 22:11