小孔 发表于 2007-5-2 17:49 只看TA 1楼 |
---|
|
[交流] 主板 cpu知识大全图文版 cpu 知识大全***适用类型 “CPU适用类型”是指该处理器所适用的应用类型,针对不同用户的不同需求、不同应用范围,CPU被设计成各不相同的类型,即分为嵌入式和通用式、微控制式。嵌入式CPU主要用于运行面向特定领域的专用程序,配备轻量级操作系统,其应用极其广泛,像移动电话、DVD、机顶盒等都是使用嵌入式CPU。微控制式CPU主要用于汽车空调、自动机械等自控设备领域。而通用式CPU追求高性能,主要用于高性能个人计算机系统(即PC台式机)、服务器(工作站)以及笔记本三种。 台式机的CPU,就是平常大部分场合所提到的应用于PC的CPU,平常所说Intel的奔腾4、赛扬、AMD的AthlonXP等等都属于此类CPU。 应用于服务器和工作站上的CPU,因其针对的应用范围,所以此类CPU在稳定性、处理速度、同时处理任务的数量等方面的要求都要高于单机CPU。其中服务器(工作站)CPU的高可靠性是普通CPU所无法比拟的,因为大多数的服务器都要满足每天24小时、每周7天的满负荷工作要求。由于服务器(工作站)数据处理量很大,需要采用多CPU并行处理结构,即一台服务器中安装2、4、8等多个CPU,需要注意的是,并行结构需要的CPU必须为偶数个。对于服务器而言,多处理器可用于数据库处理等高负荷高速度应用;而对于工作站,多处理器系统则可以用于三维图形制作和动画文件编码等单处理器无法实现的高处理速度应用。另外许多CPU的新技术都是率先开发应用于服务器(工作站)CPU中。 在最早期的CPU设计中并没有单独的笔记本CPU,均采用与台式机的CPU,后来随着笔记本电脑的散热和体积成为发展的瓶颈时,才逐渐生产出笔记本专用CPU。受笔记本内部空间、散热和电池容量的限制,笔记本CPU在外观尺寸、功耗(耗电量)方面都有很高的要求。笔记本电池性能是十分重要的性能,CPU的功耗大小对电池使用时间有着最直接的影响,所以为了降低功耗笔记本处理器中都包含有一些节能技术。在无线网络将要获得更多应用的现在,笔记本CPU还增加了一些定制的针对无线通信的功能。 服务器CPU和笔记本CPU都包含有各自独特的专有技术,都是为了更好的在各自的工作条件下发挥出更好的性能。比如服务器的多CPU并行处理,以及多核多线程技术;笔记本CPU的SpeedStep(可自动调整工作频率及电压)节能技术。 封装方式三者也有不同之处,笔记本CPU是三者中最小最薄的一种,因为笔记本处理器的体积需要更小,耐高温的性能要更佳,因此在制造工艺上要求也就更高。 三者在稳定性中以服务器CPU最强,因为其设计时就要求有极低的错误率,部分产品甚至要求全年满负荷工作,故障时间不能超过5分钟。 台式机CPU工作电压和功耗都高于笔记本CPU,通常台式机CPU的测试温度上限为75摄氏度,超过75摄氏度,工作就会不稳定,甚至出现问题;;而笔记本CPU的测试温度上限为100摄氏度;服务器CPU需要长时间的稳定工作,在散热方面的要求就更高了。 在选购整机尤其是有特定功能的计算机(如笔记本、服务器等)时,需要注意CPU的适用类型,选用不适合的CPU类型,一方面会影响整机的系统性能,另一方面会加大计算机的维护成本。单独选购CPU时候也要注意CPU的适用类型,建议按照具体应用的需求来购买CPU。 ***系列型号 CPU厂商会给属于同一系列的CPU产品定一个系列型号,而系列型号则是用于区分CPU性能的重要标示。英特尔公司的主要CPU系列型号有Pentium、Pentium Pro、Pentium II、Pentium III、Pentium 4、Pentium 4EE、Pentium-m、Celeron、Celeron II、Celeron III、Celeron IV、Celeron D、Xeon等等。而AMD公司则有K5、K6、K6-2、Duron、Athlon XP、Sempron、Athlon 64、Opteron等等。 ***接口类型 我们知道,CPU需要通过某个接口与主板连接的才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等。而目前CPU的接口都是针脚式接口,对应到主板上就有相应的插槽类型。CPU接口类型不同,在插孔数、体积、形状都有变化,所以不能互相接插。 Socket 775 Socket 775又称为Socket T,是目前应用于Intel LGA775封装的CPU所对应的接口,目前采用此种接口的有LGA775封装的Pentium 4、Pentium 4 EE、Celeron D等CPU。与以前的Socket 478接口CPU不同,Socket 775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的Socket 775插槽内的775根触针接触来传输信号。Socket 775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。随着Socket 478的逐渐淡出,Socket 775已经成为Intel桌面CPU的标准接口。 Socket 754 Socket 754是2003年9月AMD64位桌面平台最初发布时的CPU接口,目前采用此接口的有低端的Athlon 64和高端的Sempron,具有754根CPU针脚。随着Socket 939的普及,Socket 754最终也会逐渐淡出。 Socket 939 Socket 939是AMD公司2004年6月才推出的64位桌面平台接口标准,目前采用此接口的有高端的Athlon 64以及Athlon 64 FX,具有939根CPU针脚。Socket 939处理器和与过去的Socket 940插槽是不能混插的,但是,Socket 939仍然使用了相同的CPU风扇系统模式,因此以前用于Socket 940和Socket 754的风扇同样可以使用在Socket 939处理器。 Socket 940 Socket 940是最早发布的AMD64位接口标准,具有940根CPU针脚,目前采用此接口的有服务器/工作站所使用的Opteron以及最初的Athlon 64 FX。随着新出的Athlon 64 FX改用Socket 939接口,所以Socket 940将会成为Opteron的专用接口。 Socket 603 Socket 603的用途比较专业,应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是Xeon MP和早期的Xeon,具有603根CPU针脚。Socket 603接口的CPU可以兼容于Socket 604插槽。 Socket 604 与Socket 603相仿,Socket 604仍然是应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是533MHz和800MHz FSB的Xeon。Socket 604接口的CPU不能兼容于Socket 603插槽。 Socket 478 Socket 478接口是早期Pentium 4系列处理器所采用的接口类型,针脚数为478针。Socket 478的Pentium 4处理器面积很小,其针脚排列极为紧密。英特尔公司的Pentium 4系列和P4 赛扬系列都采用此接口。 Socket A Socket A接口,也叫Socket 462,是目前AMD公司Athlon XP和Duron处理器的插座接口。Socket A接口具有462插空,可以支持133MHz外频。 Socket 423 Socket 423插槽是最初Pentium 4处理器的标准接口,Socket 423的外形和前几种Socket类的插槽类似,对应的CPU针脚数为423。Socket 423插槽多是基于Intel 850芯片组主板,支持1.3GHz~1.8GHz的Pentium 4处理器。不过随着DDR内存的流行,英特尔又开发了支持SDRAM及DDR内存的i845芯片组,CPU插槽也改成了Socket 478,Socket 423接口也就销声匿迹了。 Socket 370 Socket 370架构是英特尔开发出来代替SLOT架构,外观上与Socket 7非常像,也采用零插拔力插槽,对应的CPU是370针脚。英特尔公司著名的“铜矿”和”图拉丁”系列CPU就是采用此接口。 SLOT 1 SLOT 1是英特尔公司为取代Socket 7而开发的CPU接口,并申请的专利。这样其它厂商就无法生产SLOT 1接口的产品。SLOT1接口的CPU不再是大家熟悉的方方正正的样子,而是变成了扁平的长方体,而且接口也变成了金手指,不再是插针形式。 SLOT 1是英特尔公司为Pentium Ⅱ系列CPU设计的插槽,其将Pentium Ⅱ CPU及其相关控制电路、二级缓存都做在一块子卡上,多数Slot 1主板使用100MHz外频。SLOT 1的技术结构比较先进,能提供更大的内部传输带宽和CPU性能。此种接口已经被淘汰,市面上已无此类接口的产品。 SLOT 2 SLOT 2用途比较专业,都采用于高端服务器及图形工作站的系统。所用的CPU也是很昂贵的Xeon(至强)系列。Slot 2与Slot 1相比,有许多不同。首先,Slot 2插槽更长,CPU本身也都要大一些。其次,Slot 2能够胜任更高要求的多用途计算处理,这是进入高端企业计算市场的关键所在。在当时标准服务器设计中,一般厂商只能同时在系统中采用两个 Pentium Ⅱ处理器,而有了Slot 2设计后,可以在一台服务器中同时采用 8个处理器。而且采用Slot 2接口的Pentium Ⅱ CPU都采用了当时最先进的0.25微米制造工艺。支持SLOT 2接口的主板芯片组有440GX和450NX。 SLOT A SLOT A接口类似于英特尔公司的SLOT 1接口,供AMD公司的K7 Athlon使用的。在技术和性能上,SLOT A主板可完全兼容原有的各种外设扩展卡设备。它使用的并不是Intel的P6 GTL+ 总线协议,而是Digital公司的Alpha总线协议EV6。EV6架构是种较先进的架构,它采用多线程处理的点到点拓扑结构,支持200MHz的总线频率。 ***针脚数 目前CPU都采用针脚式接口与主板相连,而不同的接口的CPU在针脚数上各不相同。CPU接口类型的命名,习惯用针脚数来表示,比如目前Pentium 4系列处理器所采用的Socket 478接口,其针脚数就为478针;而Athlon XP系列处理器所采用的Socket 462接口,其针脚数就为462针。 ![]() ***主频 在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间隔连续发出的脉冲信号。脉冲信号之间的时间间隔称为周期;而将在单位时间(如1秒)内所产生的脉冲个数称为频率。频率是描述周期性循环信号(包括脉冲信号)在单位时间内所出现的脉冲数量多少的计量名称;频率的标准计量单位是Hz(赫)。电脑中的系统时钟就是一个典型的频率相当精确和稳定的脉冲信号发生器。频率在数学表达式中用“f”表示,其相应的单位有:Hz(赫)、kHz(千赫)、MHz(兆赫)、GHz(吉赫)。其中1GHz=1000MHz,1MHz=1000kHz,1kHz=1000Hz。计算脉冲信号周期的时间单位及相应的换算关系是:s(秒)、ms(毫秒)、μs(微秒)、ns(纳秒),其中:1s=1000ms,1 ms=1000μs,1μs=1000ns。 CPU的主频,即CPU内核工作的时钟频率(CPU Clock Speed)。通常所说的某某CPU是多少兆赫的,而这个多少兆赫就是“CPU的主频”。很多人认为CPU的主频就是其运行速度,其实不然。CPU的主频表示在CPU内数字脉冲信号震荡的速度,与CPU实际的运算能力并没有直接关系。主频和实际的运算速度存在一定的关系,但目前还没有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度还要看CPU的流水线的各方面的性能指标(缓存、指令集,CPU的位数等等)。由于主频并不直接代表运算速度,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度较低的现象。比如AMD公司的AthlonXP系列CPU大多都能以较低的主频,达到英特尔公司的Pentium 4系列CPU较高主频的CPU性能,所以AthlonXP系列CPU才以PR值的方式来命名。因此主频仅是CPU性能表现的一个方面,而不代表CPU的整体性能。 CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速度却是至关重要的。举个例子来说,假设某个CPU在一个时钟周期内执行一条运算指令,那么当CPU运行在100MHz主频时,将比它运行在50MHz主频时速度快一倍。因为100MHz的时钟周期比50MHz的时钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行一条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短了一半,自然运算速度也就快了一倍。只不过电脑的整体运行速度不仅取决于CPU运算速度,还与其它各分系统的运行情况有关,只有在提高主频的同时,各分系统运行速度和各分系统之间的数据传输速度都能得到提高后,电脑整体的运行速度才能真正得到提高。 提高CPU工作主频主要受到生产工艺的限制。由于CPU是在半导体硅片上制造的,在硅片上的元件之间需要导线进行联接,由于在高频状态下要求导线越细越短越好,这样才能减小导线分布电容等杂散干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的最大障碍之一。 ***核心类型 核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。 为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。 不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket 370,Socket A,Socket 478,Socket T,Slot 1、Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。 一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 1.8A GHz就要比Willamette核心的Pentium 4 1.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的Northwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。 CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。 在CPU漫长的历史中伴随着纷繁复杂的CPU核心类型,以下分别就Intel CPU和AMD CPU的主流核心类型作一个简介。主流核心类型介绍(仅限于台式机CPU,不包括笔记本CPU和服务器/工作站CPU,而且不包括比较老的核心类型)。 Intel CPU核心 Tualatin 这也就是大名鼎鼎的“图拉丁”核心,是Intel在Socket 370架构上的最后一种CPU核心,采用0.13um制造工艺,封装方式采用FC-PGA2和PPGA,核心电压也降低到了1.5V左右,主频范围从1GHz到1.4GHz,外频分别为100MHz(赛扬)和133MHz(Pentium III),二级缓存分别为512KB(Pentium III-S)和256KB(Pentium III和赛扬),这是最强的Socket 370核心,其性能甚至超过了早期低频的Pentium 4系列CPU。 Willamette 这是早期的Pentium 4和P4赛扬采用的核心,最初采用Socket 423接口,后来改用Socket 478接口(赛扬只有1.7GHz和1.8GHz两种,都是Socket 478接口),采用0.18um制造工艺,前端总线频率为400MHz, 主频范围从1.3GHz到2.0GHz(Socket 423)和1.6GHz到2.0GHz(Socket 478),二级缓存分别为256KB(Pentium 4)和128KB(赛扬),注意,另外还有些型号的Socket 423接口的Pentium 4居然没有二级缓存!核心电压1.75V左右,封装方式采用Socket 423的PPGA INT2,PPGA INT3,OOI 423-pin,PPGA FC-PGA2和Socket 478的PPGA FC-PGA2以及赛扬采用的PPGA等等。Willamette核心制造工艺落后,发热量大,性能低下,已经被淘汰掉,而被Northwood核心所取代。 Northwood 这是目前主流的Pentium 4和赛扬所采用的核心,其与Willamette核心最大的改进是采用了0.13um制造工艺,并都采用Socket 478接口,核心电压1.5V左右,二级缓存分别为128KB(赛扬)和512KB(Pentium 4),前端总线频率分别为400/533/800MHz(赛扬都只有400MHz),主频范围分别为2.0GHz到2.8GHz(赛扬),1.6GHz到2.6GHz(400MHz FSB Pentium 4),2.26GHz到3.06GHz(533MHz FSB Pentium 4)和2.4GHz到3.4GHz(800MHz FSB Pentium 4),并且3.06GHz Pentium 4和所有的800MHz Pentium 4都支持超线程技术(Hyper-Threading Technology),封装方式采用PPGA FC-PGA2和PPGA。按照Intel的规划,Northwood核心会很快被Prescott核心所取代。 Prescott 这是Intel新的CPU核心,最早使用在Pentium 4上,现在低端的赛扬D也大量使用此核心,其与Northwood最大的区别是采用了0.09um制造工艺和更多的流水线结构,初期采用Socket 478接口,以后会全部转到LGA 775接口,核心电压1.25-1.525V,前端总线频率为533MHz(不支持超线程技术)和800MHz(支持超线程技术),主频分别为533MHz FSB的2.4GHz和2.8GHz以及800MHz FSB的2.8GHz、3.0GHz、3.2GHz和3.4GHz,其与Northwood相比,其L1 数据缓存从8KB增加到16KB,而L2缓存则从512KB增加到1MB,封装方式采用PPGA。按照Intel的规划,Prescott核心会很快取代Northwood核心并且很快就会推出Prescott核心533MHz FSB的赛扬。 Prescott 2M Prescott 2M是Intel在台式机上使用的核心,与Prescott不同,Prescott 2M支持EM64T技术,也就说可以使用超过4G内存,属于64位CPU,这是Intel第一款使用64位技术的台式机CPU。Prescott 2M核心使用90nm制造工艺,集成2M二级缓存,800或者1066MHz前端总线。目前来说P4的6系列和P4EE CPU使用Prescott 2M核心。Prescott 2M本身的性能并不是特别出众,不过由于集成了大容量二级缓存和使用较高的频率,性能仍然有提升。此外Prescott 2M核心支持增强型IntelSpeedStep技术 (EIST),这技术完全与英特尔的移动处理器中节能机制一样,它可以让Pentium 46系列处理器在低负载的时候降低工作频率,这样可以明显降低它们在运行时的工作热量及功耗。 AMD CPU核心 Athlon XP的核心类型 Athlon XP有4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。 Palomino 这是最早的Athlon XP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。 Thoroughbred 这是第一种采用0.13um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。 Thorton 采用0.13um制造工艺,核心电压1.65V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为333MHz。可以看作是屏蔽了一半二级缓存的Barton。 Barton 采用0.13um制造工艺,核心电压1.65V左右,二级缓存为512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。 新Duron的核心类型 AppleBred 采用0.13um制造工艺,核心电压1.5V左右,二级缓存为64KB,封装方式采用OPGA,前端总线频率为266MHz。没有采用PR标称值标注而以实际频率标注,有1.4GHz、1.6GHz和1.8GHz三种。 Athlon 64系列CPU的核心类型 Sledgehammer Sledgehammer是AMD服务器CPU的核心,是64位CPU,一般为940接口,0.13微米工艺。Sledgehammer功能强大,集成三条HyperTransprot总线,核心使用12级流水线,128K一级缓存、集成1M二级缓存,可以用于单路到8路CPU服务器。Sledgehammer集成内存控制器,比起传统上位于北桥的内存控制器有更小的延时,支持双通道DDR内存,由于是服务器CPU,当然支持ECC校验。 Clawhammer 采用0.13um制造工艺,核心电压1.5V左右,二级缓存为1MB,封装方式采用mPGA,采用Hyper Transport总线,内置1个128bit的内存控制器。采用Socket 754、Socket 940和Socket 939接口。 Newcastle 其与Clawhammer的最主要区别就是二级缓存降为512KB(这也是AMD为了市场需要和加快推广64位CPU而采取的相对低价政策的结果),其它性能基本相同。 Wincheste Wincheste是比较新的AMD Athlon 64CPU核心,是64位CPU,一般为939接口,0.09微米制造工艺。这种核心使用200MHz外频,支持1GHyperTransprot总线,512K二级缓存,性价比较好。Wincheste集成双通道内存控制器,支持双通道DDR内存,由于使用新的工艺,Wincheste的发热量比旧的Athlon小,性能也有所提升。 Troy Troy是AMD第一个使用90nm制造工艺的Opteron核心。Troy核心是在Sledgehammer基础上增添了多项新技术而来的,通常为940针脚,拥有128K一级缓存和1MB (1,024 KB)二级缓存。同样使用200MHz外频,支持1GHyperTransprot总线,集成了内存控制器,支持双通道DDR400内存,并且可以支持ECC 内存。此外,Troy核心还提供了对SSE-3的支持,和Intel的Xeon相同,总的来说,Troy是一款不错的CPU核心。 Venice Venice核心是在Wincheste核心的基础上演变而来,其技术参数和Wincheste基本相同:一样基于X86-64架构、整合双通道内存控制器、512KB L2缓存、90nm制造工艺、200MHz外频,支持1GHyperTransprot总线。Venice的变化主要有三方面:一是使用了Dual Stress Liner (简称DSL)技术,可以将半导体晶体管的响应速度提高24%,这样是CPU有更大的频率空间,更容易超频;二是提供了对SSE-3的支持,和Intel的CPU相同;三是进一步改良了内存控制器,一定程度上增加处理器的性能,更主要的是增加内存控制器对不同DIMM模块和不同配置的兼容性。此外Venice核心还使用了动态电压,不同的CPU可能会有不同的电压。 SanDiego SanDiego核心与Venice一样是在Wincheste核心的基础上演变而来,其技术参数和Venice非常接近,Venice拥有的新技术、新功能,SanDiego核心一样拥有。不过AMD公司将SanDiego核心定位到顶级Athlon 64处理器之上,甚至用于服务器CPU。可以将SanDiego看作是Venice核心的高级版本,只不过缓存容量由512KB提升到了1MB。当然由于L2缓存增加,SanDiego核心的内核尺寸也有所增加,从Venice核心的84平方毫米增加到115平方毫米,当然价格也更高昂。 闪龙系列CPU的核心类型 Paris Paris核心是Barton核心的继任者,主要用于AMD的闪龙,早期的754接口闪龙部分使用Paris核心。Paris采用90nm制造工艺,支持iSSE2指令集,一般为256K二级缓存,200MHz外频。Paris核心是32位CPU,来源于K8核心,因此也具备了内存控制单元。CPU内建内存控制器的主要优点在于内存控制器可以以CPU频率运行,比起传统上位于北桥的内存控制器有更小的延时。使用Paris核心的闪龙与Socket A接口闪龙CPU相比,性能得到明显提升。 Palermo Palermo核心目前主要用于AMD的闪龙CPU,使用Socket 754接口、90nm制造工艺,1.4V左右电压,200MHz外频,128K或者256K二级缓存。Palermo核心源于K8的Wincheste核心,新的E6步进版本已经支持64位。除了拥有与AMD高端处理器相同的内部架构,还具备了EVP、Cool‘n’Quiet;和HyperTransport等AMD独有的技术,为广大用户带来更“冷静”、更高计算能力的优秀处理器。由于脱胎与ATHLON64处理器,所以Palermo同样具备了内存控制单元。CPU内建内存控制器的主要优点在于内存控制器可以以CPU频率运行,比起传统上位于北桥的内存控制器有更小的延时。 ***双核心类型 在2005年以前,主频一直是两大处理器巨头Intel和AMD争相追逐的焦点。而且处理器主频也在Intel和AMD的推动下达到了一个又一个的高峰就在处理器主频提升速度的同时,也发现在目前的情况下,单纯主频的提升已经无法为系统整体性能的提升带来明显的好处,并且高主频带来了处理器巨大的发热量,更为不利是Intel和AMD两家在处理器主频提升上已经有些力不从心了。在这种情况下,Intel和AMD都不约而同地将投向了多核心的发展方向在不用进行大规模开发的情况下将现有产品发展成为理论性能更为强大的多核心处理器系统,无疑是相当明智的选择。 双核处理器就基于单个半导体的一个处理器上拥有两个一样功能的处理器核心,即是将两个物理处理器核心整合入一个内核中。事实上,双核架构并不是什么新技术,不过此前双核心处理器一直是服务器的专利,现在已经开始普及之中。 Intel双核心处理器 目前Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。 桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。 ![]() 揭开外壳后的双核心Pentium D处理器 ![]() 双核心构架内部示意图 Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。 ![]() MCH协调两颗核心之间的相互调用 为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。 由于采用Prescott内核,因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是,Pentium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消对Hyper-Threading技术的支持。 同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。Pentium D不能支持超线程技术,而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下,双核心Pentium Extreme Edition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。 AMD双核心处理器 AMD推出的双核心处理器分别是双核心的Opteron系列和全新的Athlon 64 X2系列处理器。其中Athlon 64 X2是用以抗衡Pentium D和Pentium Extreme Edition的桌面双核心处理器系列。 AMD推出的Athlon 64 X2是由两个Athlon 64处理器上采用的Venice核心组合而成,每个核心拥有独立的512KB(1MB) L2缓存及执行单元。除了多出一个核芯之外,从架构上相对于目前Athlon 64在架构上并没有任何重大的改变。 ![]() Athlon 64 X2(左侧)与普通Athlon 64的对比 双核心Athlon 64 X2的大部分规格、功能与我们熟悉的Athlon 64架构没有任何区别,也就是说新推出的Athlon 64 X2双核心处理器仍然支持1GHz规格的HyperTransport总线,并且内建了支持双通道设置的DDR内存控制器。 与Intel双核心处理器不同的是,Athlon 64 X2的两个内核并不需要经过MCH进行相互之间的协调。AMD在Athlon 64 X2双核心处理器的内部提供了一个称为System Request Queue(系统请求队列)的技术,在工作的时候每一个核心都将其请求放在SRQ中,当获得资源之后请求将会被送往相应的执行核心,也就是说所有的处理过程都在CPU核心范围之内完成,并不需要借助外部设备。 ![]() AMD Athlon 64 X2内部示意图 对于双核心架构,AMD的做法是将两个核心整合在同一片硅晶内核之中,而Intel的双核心处理方式则更像是简单的将两个核心做到一起而已。与Intel的双核心架构相比,AMD双核心处理器系统不会在两个核心之间存在传输瓶颈的问题。因此从这个方面来说,Athlon 64 X2的架构要明显优于Pentium D架构。 虽然与Intel相比,AMD并不用担心Prescott核心这样的功耗和发热大户,但是同样需要为双核心处理器考虑降低功耗的方式。为此AMD并没有采用降低主频的办法,而是在其使用90nm工艺生产的Athlon 64 X2处理器中采用了所谓的Dual Stress Liner应变硅技术,与SOI技术配合使用,能够生产出性能更高、耗电更低的晶体管。 AMD推出的Athlon 64 X2处理器给用户带来最实惠的好处就是,不需要更换平台就能使用新推出的双核心处理器,只要对老主板升级一下BIOS就可以了,这与Intel双核心处理器必须更换新平台才能支持的做法相比,升级双核心系统会节省不少费用。 ***64位技术 这里的64位技术是相对于32位而言的,这个位数指的是CPU GPRs(General-Purpose Registers,通用寄存器)的数据宽度为64位,64位指令集就是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。64bit处理器并非现在才有的,在高端的RISC(Reduced Instruction Set Computing,精简指令集计算机)很早就有64bit处理器了,比如SUN公司的UltraSparc Ⅲ、IBM公司的POWER5、HP公司的Alpha等。 64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可迷信64bit。 目前主流CPU使用的64位技术主要有AMD公司的AMD64位技术、Intel公司的EM64T技术、和Intel公司的IA-64技术。其中IA-64是Intel独立开发,不兼容现在的传统的32位计算机,仅用于Itanium(安腾)以及后续产品Itanium 2,一般用户不会涉及到,因此这里仅对AMD64位技术和Intel的EM64T技术做一下简单介绍。 AMD64位技术 AMD64的位技术是在原始32位X86指令集的基础上加入了X86-64扩展64位X86指令集,使这款芯片在硬件上兼容原来的32位X86软件,并同时支持X86-64的扩展64位计算,使得这款芯片成为真正的64位X86芯片。这是一个真正的64位的标准,X86-64具有64位的寻址能力。 X86-64新增的几组CPU寄存器将提供更快的执行效率。寄存器是CPU内部用来创建和储存CPU运算结果和其它运算结果的地方。标准的32-bit x86架构包括8个通用寄存器(GPR),AMD在X86-64中又增加了8组(R8-R9),将寄存器的数目提高到了16组。X86-64寄存器默认位64-bit。还增加了8组128-bit XMM寄存器(也叫SSE寄存器,XMM8-XMM15),将能给单指令多数据流技术(SIMD)运算提供更多的空间,这些128位的寄存器将提供在矢量和标量计算模式下进行128位双精度处理,为3D建模、矢量分析和虚拟现实的实现提供了硬件基础。通过提供了更多的寄存器,按照X86-64标准生产的CPU可以更有效的处理数据,可以在一个时钟周期中传输更多的信息。 EM64T技术 Intel官方是给EM64T这样定义的:EM64T全称Extended Memory 64 Technology,即扩展64bit内存技术。EM64T是Intel IA-32架构的扩展,即IA-32e(Intel Architectur-32 extension)。IA-32处理器通过附加EM64T技术,便可在兼容IA-32软件的情况下,允许软件利用更多的内存地址空间,并且允许软件进行32 bit线性地址写入。EM64T特别强调的是对32 bit和64 bit的兼容性。Intel为新核心增加了8个64 bit GPRs(R8-R15),并且把原有GRPs全部扩展为64 bit,如前文所述这样可以提高整数运算能力。增加8个128bit SSE寄存器(XMM8-XMM15),是为了增强多媒体性能,包括对SSE、SSE2和SSE3的支持。 Intel为支持EM64T技术的处理器设计了两大模式:传统IA-32模式(legacy IA-32 mode)和IA-32e扩展模式(IA-32e mode)。在支持EM64T技术的处理器内有一个称之为扩展功能激活寄存器(extended feature enable register,IA32_EFER)的部件,其中的Bit10控制着EM64T是否激活。Bit10被称作IA-32e模式有效(IA-32e mode active)或长模式有效(long mode active,LMA)。当LMA=0时,处理器便作为一颗标准的32 bit(IA32)处理器运行在传统IA-32模式;当LMA=1时,EM64T便被激活,处理器会运行在IA-32e扩展模式下。 目前AMD方面支持64位技术的CPU有Athlon 64系列、Athlon FX系列和Opteron系列。Intel方面支持64位技术的CPU有使用Nocona核心的Xeon系列、使用Prescott 2M核心的Pentium 4 6系列和使用Prescott 2M核心的P4 EE系列。 ***前端总线 总线是将信息以一个或多个源部件传送到一个或多个目的部件的一组传输线。通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信息。人们常常以MHz表示的速度来描述总线频率。总线的种类很多,前端总线的英文名字是Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭配问题,一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主板不支持CPU所需要的前端总线,系统就无法工作。也就是说,需要主板和CPU都支持某个前端总线,系统才能工作,只不过一个CPU默认的前端总线是唯一的,因此看一个系统的前端总线主要看CPU就可以。 北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。显然同等条件下,前端总线越快,系统性能越好。 外频与前端总线频率的区别:前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了PCI及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以前的很长一段时间里(主要是在Pentium 4出现之前和刚出现Pentium 4时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(Quad Date Rate)技术,或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人们重视起来。此外,在前端总线中比较特殊的是AMD64的HyperTransport。 目前各种CPU的前端总线频率(FSB): Intel平台 Willamette核心CPU: 所有Willamette核心CPU的FSB都是400MHz FSB。 Northwood核心CPU: 相对于Willamette核心CPU,Northwood核心CPU的前端总线频率则非常复杂,400MHz、533MHz和800MHz都有。其中,Celeron全部都是400MHz FSB;Pentium 4方面,1.6GHz-2.8GHz都有400MHz FSB的产品,例如1.8A、2.0A等等,Pentium 4型号后面带有"B"字样的则是533MHz FSB,带有"C"字样的则是800MHz FSB。 Prescott核心CPU: Prescott核心的Celeron D,无论是Socket 478接口还是Socket 775接口,全部都是533MHz FSB。 Socket 478接口的Pentium 4方面,2.4A和2.8A是533MHz FSB,其余的Socket 478 Pentium 4都是800MHz FSB,在产品型号后面带有"E"字样。 Socket 775接口的Pentium 4 5XX系列方面,编号尾数为"5"的是533MHz FSB,例如Pentium 4 505/515;编号尾数为"0"的是800MHz FSB,例如Pentium 4 520/530/540等等。即将推出的Pentium 4 6XX系列CPU则都是800MHz FSB。Pentium 4至尊版(即Pentium 4 EE,又称Pentium 4 XE): 所有Socket 478接口的Pentium 4 EE都是800MHz FSB。而Socket 775接口的Pentium 4 EE,3.4GHz是800MHz FSB,而3.46GHz则是1066MHz FSB,这是目前PC上最高的前端总线频率,而且今后推出的所有Pentium 4 EE都会采用1066MHz FSB。 Xeon和Xeon MP: 所有Xeon MP都是400MHz FSB;Socket 603接口的Xeon也是400MHz FSB;Socket 604接口的Xeon中,支持Intel 64位计算技术EM64T的Xeon是800MHz FSB,而不支持EM64T的Xeon则是533MHz FSB。 AMD平台 Socket A平台: Socket A接口的Sempron是333MHz FSB,Socket 754接口的Sempron部分是333MHz FSB,使用0.09微米工艺的Sempron是800MHz FSB;Athlon XP方面,Palomino核心为266MHz FSB,Thoroughbred核心为266MHz和333MHz FSB,Barton核心为333MHz和400MHz FSB,而Thorton核心则为333MHz FSB。 AMD64平台: Socket 754接口CPU的HyperTransport频率是800MHz;Socket 939接口CPU的HyperTransport频率是1000MHz;而Socket 940接口CPU的HyperTransport频率也是800MHz。 ***外频 外频是CPU乃至整个计算机系统的基准频率,单位是MHz(兆赫兹)。在早期的电脑中,内存与主板之间的同步运行的速度等于外频,在这种方式下,可以理解为CPU外频直接与内存相连通,实现两者间的同步运行状态。对于目前的计算机系统来说,两者完全可以不相同,但是外频的意义仍然存在,计算机系统中大多数的频率都是在外频的基础上,乘以一定的倍数来实现,这个倍数可以是大于1的,也可以是小于1的。 说到处理器外频,就要提到与之密切相关的两个概念:倍频与主频,主频就是CPU的时钟频率;倍频即主频与外频之比的倍数。主频、外频、倍频,其关系式:主频=外频×倍频。 在486之前,CPU的主频还处于一个较低的阶段,CPU的主频一般都等于外频。而在486出现以后,由于CPU工作频率不断提高,而PC机的一些其他设备(如插卡、硬盘等)却受到工艺的限制,不能承受更高的频率,因此限制了CPU频率的进一步提高。因此出现了倍频技术,该技术能够使CPU内部工作频率变为外部频率的倍数,从而通过提升倍频而达到提升主频的目的。倍频技术就是使外部设备可以工作在一个较低外频上,而CPU主频是外频的倍数。 在Pentium时代,CPU的外频一般是60/66MHz,从Pentium Ⅱ 350开始,CPU外频提高到100MHz,目前CPU外频已经达到了200MHz。由于正常情况下外频和内存总线频率相同,所以当CPU外频提高后,与内存之间的交换速度也相应得到了提高,对提高电脑整体运行速度影响较大。 外频与前端总线(FSB)频率很容易被混为一谈。前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了PCI及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以前的很长一段时间里(主要是在Pentium 4出现之前和刚出现Pentium 4时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(Quad Date Rate)技术,或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人们重视起来。 一个CPU默认的外频只有一个,主板必须能支持这个外频。因此在选购主板和CPU时必须注意这点,如果两者不匹配,系统就无法工作。此外,现在CPU的倍频很多已经被锁定,所以超频时经常需要超外频。外频改变后系统很多其他频率也会改变,除了CPU主频外,前端总线频率、PCI等各种接口频率,包括硬盘接口的频率都会改变,都可能造成系统无法正常运行。当然有些主板可以提供锁定各种接口频率的功能,对成功超频有很大帮助。超频有风险,甚至会损坏计算机硬件。 ***倍频 CPU的倍频,全称是倍频系数。CPU的核心工作频率与外频之间存在着一个比值关系,这个比值就是倍频系数,简称倍频。理论上倍频是从1.5一直到无限的,但需要注意的是,倍频是以0.5为一个间隔单位。外频与倍频相乘就是主频,所以其中任何一项提高都可以使CPU的主频上升。 原先并没有倍频概念,CPU的主频和系统总线的速度是一样的,但CPU的速度越来越快,倍频技术也就应允而生。它可使系统总线工作在相对较低的频率上,而CPU速度可以通过倍频来无限提升。那么CPU主频的计算方式变为:主频 = 外频 x 倍频。也就是倍频是指CPU和系统总线之间相差的倍数,当外频不变时,提高倍频,CPU主频也就越高。 一个CPU默认的倍频只有一个,主板必须能支持这个倍频。因此在选购主板和CPU时必须注意这点,如果两者不匹配,系统就无法工作。此外,现在CPU的倍频很多已经被锁定,无法修改。 ***一级缓存 CPU缓存(Cache Memory)是位于CPU与内存之间的临时存储器,它的容量比内存小的多但是交换速度却比内存要快得多。缓存的出现主要是为了解决CPU运算速度与内存读写速度不匹配的矛盾,因为CPU运算速度要比内存读写速度快很多,这样会使CPU花费很长时间等待数据到来或把数据写入内存。在缓存中的数据是内存中的一小部分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据时,就可避开内存直接从缓存中调用,从而加快读取速度。由此可见,在CPU中加入缓存是一种高效的解决方案,这样整个内存储器(缓存+内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统了。缓存对CPU的性能影响很大,主要是因为CPU的数据交换顺序和CPU与缓存间的带宽引起的。 缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。 正是这样的读取机制使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先缓存后内存。 目前缓存基本上都是采用SRAM存储器,SRAM是英文Static RAM的缩写,它是一种具有静志存取功能的存储器,不需要刷新电路即能保存它内部存储的数据。不像DRAM内存那样需要刷新电路,每隔一段时间,固定要对DRAM刷新充电一次,否则内部的数据即会消失,因此SRAM具有较高的性能,但是SRAM也有它的缺点,即它的集成度较低,相同容量的DRAM内存可以设计为较小的体积,但是SRAM却需要很大的体积,这也是目前不能将缓存容量做得太大的重要原因。它的特点归纳如下:优点是节能、速度快、不必配合内存刷新电路、可提高整体的工作效率,缺点是集成度低、相同的容量体积较大、而且价格较高,只能少量用于关键性系统以提高效率。 按照数据读取顺序和与CPU结合的紧密程度,CPU缓存可以分为一级缓存,二级缓存,部分高端CPU还具有三级缓存,每一级缓存中所储存的全部数据都是下一级缓存的一部分,这三种缓存的技术难度和制造成本是相对递减的,所以其容量也是相对递增的。当CPU要读取一个数据时,首先从一级缓存中查找,如果没有找到再从二级缓存中查找,如果还是没有就从三级缓存或内存中查找。一般来说,每级缓存的命中率大概都在80%左右,也就是说全部数据量的80%都可以在一级缓存中找到,只剩下20%的总数据量才需要从二级缓存、三级缓存或内存中读取,由此可见一级缓存是整个CPU缓存架构中最为重要的部分。 一级缓存(Level 1 Cache)简称L1 Cache,位于CPU内核的旁边,是与CPU结合最为紧密的CPU缓存,也是历史上最早出现的CPU缓存。由于一级缓存的技术难度和制造成本最高,提高容量所带来的技术难度增加和成本增加非常大,所带来的性能提升却不明显,性价比很低,而且现有的一级缓存的命中率已经很高,所以一级缓存是所有缓存中容量最小的,比二级缓存要小得多。 一般来说,一级缓存可以分为一级数据缓存(Data Cache,D-Cache)和一级指令缓存(Instruction Cache,I-Cache)。二者分别用来存放数据以及对执行这些数据的指令进行即时解码,而且两者可以同时被CPU访问,减少了争用Cache所造成的冲突,提高了处理器效能。目前大多数CPU的一级数据缓存和一级指令缓存具有相同的容量,例如AMD的Athlon XP就具有64KB的一级数据缓存和64KB的一级指令缓存,其一级缓存就以64KB+64KB来表示,其余的CPU的一级缓存表示方法以此类推。 Intel的采用NetBurst架构的CPU(最典型的就是Pentium 4)的一级缓存有点特殊,使用了新增加的一种一级追踪缓存(Execution Trace Cache,T-Cache或ETC)来替代一级指令缓存,容量为12KμOps,表示能存储12K条即12000条解码后的微指令。一级追踪缓存与一级指令缓存的运行机制是不相同的,一级指令缓存只是对指令作即时的解码而并不会储存这些指令,而一级追踪缓存同样会将一些指令作解码,这些指令称为微指令(micro-ops),而这些微指令能储存在一级追踪缓存之内,无需每一次都作出解码的程序,因此一级追踪缓存能有效地增加在高工作频率下对指令的解码能力,而μOps就是micro-ops,也就是微型操作的意思。它以很高的速度将μops提供给处理器核心。Intel NetBurst微型架构使用执行跟踪缓存,将解码器从执行循环中分离出来。这个跟踪缓存以很高的带宽将uops提供给核心,从本质上适于充分利用软件中的指令级并行机制。Intel并没有公布一级追踪缓存的实际容量,只知道一级追踪缓存能储存12000条微指令(micro-ops)。所以,我们不能简单地用微指令的数目来比较指令缓存的大小。实际上,单核心的NetBurst架构CPU使用8Kμops的缓存已经基本上够用了,多出的4kμops可以大大提高缓存命中率。而如果要使用超线程技术的话,12KμOps就会有些不够用,这就是为什么有时候Intel处理器在使用超线程技术时会导致性能下降的重要原因。 例如Northwood核心的一级缓存为8KB+12KμOps,就表示其一级数据缓存为8KB,一级追踪缓存为12KμOps;而Prescott核心的一级缓存为16KB+12KμOps,就表示其一级数据缓存为16KB,一级追踪缓存为12KμOps。在这里12KμOps绝对不等于12KB,单位都不同,一个是μOps,一个是Byte(字节),而且二者的运行机制完全不同。所以那些把Intel的CPU一级缓存简单相加,例如把Northwood核心说成是20KB一级缓存,把Prescott核心说成是28KB一级缓存,并且据此认为Intel处理器的一级缓存容量远远低于AMD处理器128KB的一级缓存容量的看法是完全错误的,二者不具有可比性。在架构有一定区别的CPU对比中,很多缓存已经难以找到对应的东西,即使类似名称的缓存在设计思路和功能定义上也有区别了,此时不能用简单的算术加法来进行对比;而在架构极为近似的CPU对比中,分别对比各种功能缓存大小才有一定的意义。 ***二级缓存容量 CPU缓存(Cache Memory)位于CPU与内存之间的临时存储器,它的容量比内存小但交换速度快。在缓存中的数据是内存中的一小部分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据时,就可避开内存直接从缓存中调用,从而加快读取速度。由此可见,在CPU中加入缓存是一种高效的解决方案,这样整个内存储器(缓存+内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统了。缓存对CPU的性能影响很大,主要是因为CPU的数据交换顺序和CPU与缓存间的带宽引起的。 缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。 正是这样的读取机制使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先缓存后内存。 最早先的CPU缓存是个整体的,而且容量很低,英特尔公司从Pentium时代开始把缓存进行了分类。当时集成在CPU内核中的缓存已不足以满足CPU的需求,而制造工艺上的限制又不能大幅度提高缓存的容量。因此出现了集成在与CPU同一块电路板上或主板上的缓存,此时就把 CPU内核集成的缓存称为一级缓存,而外部的称为二级缓存。一级缓存中还分数据缓存(Data Cache,D-Cache)和指令缓存(Instruction Cache,I-Cache)。二者分别用来存放数据和执行这些数据的指令,而且两者可以同时被CPU访问,减少了争用Cache所造成的冲突,提高了处理器效能。英特尔公司在推出Pentium 4处理器时,用新增的一种一级追踪缓存替代指令缓存,容量为12KμOps,表示能存储12K条微指令。 随着CPU制造工艺的发展,二级缓存也能轻易的集成在CPU内核中,容量也在逐年提升。现在再用集成在CPU内部与否来定义一、二级缓存,已不确切。而且随着二级缓存被集成入CPU内核中,以往二级缓存与CPU大差距分频的情况也被改变,此时其以相同于主频的速度工作,可以为CPU提供更高的传输速度。 二级缓存是CPU性能表现的关键之一,在CPU核心不变化的情况下,增加二级缓存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二级缓存上有差异,由此可见二级缓存对于CPU的重要性。 CPU在缓存中找到有用的数据被称为命中,当缓存中没有CPU所需的数据时(这时称为未命中),CPU才访问内存。从理论上讲,在一颗拥有二级缓存的CPU中,读取一级缓存的命中率为80%。也就是说CPU一级缓存中找到的有用数据占数据总量的80%,剩下的20%从二级缓存中读取。由于不能准确预测将要执行的数据,读取二级缓存的命中率也在80%左右(从二级缓存读到有用的数据占总数据的16%)。那么还有的数据就不得不从内存调用,但这已经是一个相当小的比例了。目前的较高端的CPU中,还会带有三级缓存,它是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。 为了保证CPU访问时有较高的命中率,缓存中的内容应该按一定的算法替换。一种较常用的算法是“最近最少使用算法”(LRU算法),它是将最近一段时间内最少被访问过的行淘汰出局。因此需要为每行设置一个计数器,LRU算法是把命中行的计数器清零,其他各行计数器加1。当需要替换时淘汰行计数器计数值最大的数据行出局。这是一种高效、科学的算法,其计数器清零过程可以把一些频繁调用后再不需要的数据淘汰出缓存,提高缓存的利用率。 CPU产品中,一级缓存的容量基本在4KB到64KB之间,二级缓存的容量则分为128KB、256KB、512KB、1MB、2MB等。一级缓存容量各产品之间相差不大,而二级缓存容量则是提高CPU性能的关键。二级缓存容量的提升是由CPU制造工艺所决定的,容量增大必然导致CPU内部晶体管数的增加,要在有限的CPU面积上集成更大的缓存,对制造工艺的要求也就越高。 ***内存控制器 内存控制器(Memory Controller)是计算机系统内部控制内存并且通过内存控制器使内存与CPU之间交换数据的重要组成部分。内存控制器决定了计算机系统所能使用的最大内存容量、内存BANK数、内存类型和速度、内存颗粒数据深度和数据宽度等等重要参数,也就是说决定了计算机系统的内存性能,从而也对计算机系统的整体性能产生较大影响。 传统的计算机系统其内存控制器位于主板芯片组的北桥芯片内部,CPU要和内存进行数据交换,需要经过“CPU--北桥--内存--北桥--CPU”五个步骤,在此模式下数据经由多级传输,数据延迟显然比较大从而影响计算机系统的整体性能;而AMD的K8系列CPU(包括Socket 754/939/940等接口的各种处理器)内部则整合了内存控制器,CPU与内存之间的数据交换过程就简化为“CPU--内存--CPU”三个步骤,省略了两个步骤,与传统的内存控制器方案相比显然具有更低的数据延迟,这有助于提高计算机系统的整体性能。 CPU内部整合内存控制器的优点,就是可以有效控制内存控制器工作在与CPU核心同样的频率上,而且由于内存与CPU之间的数据交换无需经过北桥,可以有效降低传输延迟。打个比方,这就如同将货物仓库直接搬到了加工车间旁边,大大减少了原材料和制成品在货物仓库和加工车间之间往返运输所需要的时间,极大地提高了生产效率。这样一来系统的整体性能也得到了提升。 CPU内部整合内存控制器的最大缺点,就是对内存的适应性比较差,灵活性比较差,只能使用特定类型的内存,而且对内存的容量和速度也有限制,要支持新类型的内存就必须更新CPU内部整合的内存控制器,也就是说必须更换新的CPU;例如AMD的K8系列CPU目前就只能支持DDR,而不能支持更高速的DDR2。而传统方案的内存控制器由于位于主板芯片组的北桥芯片内部,就没有这方面的问题,只需要更换主板,甚至不更换主板也能使用不同类型的内存,例如Intel Pentium 4系列CPU,如果原来配的是不支持DDR2的主板,那么只要更换一块支持DDR2的主板就能使用DDR2,如果配的是同时支持DDR和DDR2的主板,则不必更换主板就能直接使用DDR2。 将内存控制器整合到CPU内部显然是今后的发展方向,而且其技术也会越来越完善。以后Intel也将会推出整合内存控制器的CPU。 ***核心电压 CPU的工作电压(Supply Voltage),即CPU正常工作所需的电压。任何电器在工作的时候都需要电,自然也有对应额定电压,CPU也不例外。目前CPU的工作电压有一个非常明显的下降趋势,较低的工作电压主要三个优点: 采用低电压的CPU的芯片总功耗降低了。功耗降低,系统的运行成本就相应降低,这对于便携式和移动系统来说非常重要,使其现有的电池可以工作更长时间,从而使电池的使用寿命大大延长; 功耗降低,致使发热量减少,运行温度不过高的CPU可以与系统更好的配合; 降低电压是CPU主频提高的重要因素之一。 CPU的工作电压分为两个方面,CPU的核心电压与I/O电压。核心电压即驱动CPU核心芯片的电压,I/O电压则指驱动I/O电路的电压。通常CPU的核心电压小于等于I/O电压。 早期CPU(286~486时代)的核心电压与I/O一致,通常为5V,由于当时的制造工艺相对落后,以致CPU的发热量过大,导致其寿命缩短。不过那时的CPU集成度很低,而目前的CPU集成度相当高,因此显得现在的CPU发热量更大。随着CPU的制造工艺提高,近年来各种CPU的工作电压有逐步下降的趋势,目前台式机用CPU核电压通常为2V以内,笔记本专用CPU的工作电压相对更低,从而达到大幅减少功耗的目的,以延长电池的使用寿命,并降低了CPU发热量。而且现在的CPU会通过特殊的电压ID(VID)引脚来指示主板中嵌入的电压调节器自动设置正确的电压级别。 许多面向新款CPU的主板都会提供特殊的跳线或者软件设置,通过这些跳线或软件,可以根据具体需要手动调节CPU的工作电压。很多实验表明在超频的时候适度提高核心电压,可以加强CPU内部信号,对CPU性能的提升会有很大帮助——但这样也会提高CPU的功耗,影响其寿命及发热量,建议一般用户不要进行此方面的操作。 ***超线程技术 CPU生产商为了提高CPU的性能,通常做法是提高CPU的时钟频率和增加缓存容量。不过目前CPU的频率越来越快,如果再通过提升CPU频率和增加缓存的方法来提高性能,往往会受到制造工艺上的限制以及成本过高的制约。 尽管提高CPU的时钟频率和增加缓存容量后的确可以改善性能,但这样的CPU性能提高在技术上存在较大的难度。实际上在应用中基于很多原因,CPU的执行单元都没有被充分使用。如果CPU不能正常读取数据(总线/内存的瓶颈),其执行单元利用率会明显下降。另外就是目前大多数执行线程缺乏ILP(Instruction-Level Parallelism,多种指令同时执行)支持。这些都造成了目前CPU的性能没有得到全部的发挥。因此,Intel则采用另一个思路去提高CPU的性能,让CPU可以同时执行多重线程,就能够让CPU发挥更大效率,即所谓“超线程(Hyper-Threading,简称“HT”)”技术。超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。 采用超线程及时可在同一时间里,应用程序可以使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一时刻只能够对一条指令进行操作。而超线程技术可以使芯片同时进行多线程处理,使芯片性能得到提升。 超线程技术是在一颗CPU同时执行多个程序而共同分享一颗CPU内的资源,理论上要像两颗CPU一样在同一时间执行两个线程,P4处理器需要多加入一个Logical CPU Pointer(逻辑处理单元)。因此新一代的P4 HT的die的面积比以往的P4增大了5%。而其余部分如ALU(整数运算单元)、FPU(浮点运算单元)、L2 Cache(二级缓存)则保持不变,这些部分是被分享的。 虽然采用超线程技术能同时执行两个线程,但它并不象两个真正的CPU那样,每各CPU都具有独立的资源。当两个线程都同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续。因此超线程的性能并不等于两颗CPU的性能。 英特尔P4 超线程有两个运行模式,Single Task Mode(单任务模式)及Multi Task Mode(多任务模式),当程序不支持Multi-Processing(多处理器作业)时,系统会停止其中一个逻辑CPU的运行,把资源集中于单个逻辑CPU中,让单线程程序不会因其中一个逻辑CPU闲置而减低性能,但由于被停止运行的逻辑CPU还是会等待工作,占用一定的资源,因此Hyper-Threading CPU运行Single Task Mode程序模式时,有可能达不到不带超线程功能的CPU性能,但性能差距不会太大。也就是说,当运行单线程运用软件时,超线程技术甚至会降低系统性能,尤其在多线程操作系统运行单线程软件时容易出现此问题。 需要注意的是,含有超线程技术的CPU需要芯片组、软件支持,才能比较理想的发挥该项技术的优势。目前支持超线程技术的芯片组包括如:英特尔i845GE、PE及矽统iSR658 RDRAM、SiS645DX、SiS651可直接支持超线程;英特尔i845E、i850E通过升级BIOS后可支持;威盛P4X400、P4X400A可支持,但未获得正式授权。操作系统如:Microsoft Windows XP、Microsoft Windows 2003,Linux kernel 2.4.x以后的版本也支持超线程技术。 ***防病毒技术 CPU内嵌的防病毒技术是一种硬件防病毒技术,与操作系统相配合,可以防范大部分针对缓冲区溢出(buffer overrun)漏洞的攻击(大部分是病毒)。Intel的防病毒技术是EDB(Excute Disable Bit),AMD的防病毒技术是EVP(Ehanced Virus Protection),但不管叫什么,它们的原理都是大同小异的。严格来说,目前各个CPU厂商在CPU内部集成的防病毒技术不能称之为“硬件防毒”。首先,无论是Intel的EDB还是AMD的EVP,它们都是采用硬软结合的方式工作的,都必须搭配相关的操作系统和软件才能实现;其次,EDB和EVP都是为了防止因为内存缓冲区溢出而导致系统或应用软件崩溃的,而这内存缓冲区溢出有可能是恶意代码(病毒)所为,也有可能是应用程序设计的缺陷所致(无意识的),因此我们将其称之为“防缓冲区溢出攻击”更为恰当些。 在计算机内部,等待处理的数据一般都被放在内存的某个临时空间里,这个临时存放空间被称为缓冲区(Buffer),缓冲区的长度事先已经被程序或者操作系统定义好了。缓冲区溢出(buffer overrun)是指当计算机程序向缓冲区内填充的数据位数超过了缓冲区本身的容量。溢出的数据覆盖在合法数据上。理想情况是,程序检查数据长度并且不允许输入超过缓冲区长度的字符串。但是绝大多数程序都会假设数据长度总是与所分配的存储空间相匹配,这就为缓冲区溢出埋下隐患。操作系统所使用的缓冲区又被称为堆栈,在各个操作进程之间,指令被临时存储在堆栈当中,堆栈也会出现缓冲区溢出。当一个超长的数据进入到缓冲区时,超出部分就会被写入其他缓冲区,其他缓冲区存放的可能是数据、下一条指令的指针,或者是其他程序的输出内容,这些内容都被覆盖或者破坏掉。可见一小部分数据或者一套指令的溢出就可能导致一个程序或者操作系统崩溃。而更坏的结果是,如果相关数据里包含了恶意代码,那么溢出的恶意代码就会改写应用程序返回的指令,使其指向包含恶意代码的地址,使其被CPU编译而执行,而这可能发生“内存缓冲区溢出攻击”,名噪一时的“冲击波”、“震荡波”等蠕虫病毒就是采用这种手段来攻击电脑的。 缓冲区溢出是由编程错误引起的。如果缓冲区被写满,而程序没有去检查缓冲区边界,也没有停止接收数据,这时缓冲区溢出就会发生。缓冲区边界检查被认为是不会有收益的管理支出,计算机资源不够或者内存不足是编程者不编写缓冲区边界检查语句的理由,然而技术的飞速发展已经使这一理由失去了存在的基础,但是多数用户日常主要应用的程序中大多数其实仍然是十年甚至二十年前的程序代码,并没有检查缓冲区边界的功能。 缓冲区溢出是病毒编写者和特洛伊木马编写者偏爱使用的一种攻击方法。攻击者或者病毒善于在系统当中发现容易产生缓冲区溢出之处,运行特别程序,获得优先级,指示计算机破坏文件,改变数据,泄露敏感信息,产生后门访问点,感染或者攻击其他计算机。 对于缓冲区溢出攻击,防毒杀毒软件虽然也可以处理,但也只能是亡羊补牢,而操作系统和应用软件的漏洞又是难以预测的,随时可能被利用,引来缓冲区溢出攻击。在这种情况下,预防缓冲区溢出攻击应该从硬件层次着手,开始成为许多IT厂商的共识,于是大家俗称的CPU硬件防病毒功能应运而生了。 缓冲区溢出攻击最基本的实现途径是向正常情况下不包含可执行代码的内存区域插入可执行的代码,并欺骗CPU执行这些代码。而如果我们在这些内存页面的数据区域设置某些标志(No eXecute或eXcute Disable),当CPU读取数据时检测到该内存页面有这些标志时就拒绝执行该区域的可执行指令,从而可防止恶意代码被执行,这就是CPU的防缓冲区溢出攻击实现的原理。 而对于开启了EDB或EVP功能的计算机来说,一般也就可实现数据和代码的分离,而在内存某个页面将被设置为只做数据页,而任何企图在其中执行代码的行为都将被CPU所拒绝。当然,开启EDB、EVP功能的CPU是无法独立完成标注不可执行代码内存页面以及进行相关检测防治工作的,它还需要相关操作系统和应用程序的配合。 目前,Windows XP SP2、Windows Server 2003 SP1及64bit的Windows操作系统都提供了对EDB、EVP技术的支持。如果你使用的操作系统是Windows XP SP2,那么启用其中的DEP(Data Execution Protection,数据执行保护)功能即可为你的电脑提供比较全面的防缓冲区溢出攻击功能。DEP是可以独立运行的,并也可帮助防御某些类型的恶意代码攻击,但要充分利用DEP可以提供的保护功能,就需要CPU的配合了。DEP可单独或和兼容的CPU一起将内存的某些页面位置标注为不可执行,如果某个程序尝试从被保护的位置运行代码,将会被CPU拒绝同时DEP会关闭程序并通知用户,从而在一定程度上保障用户电脑的安全。 CPU内嵌的防病毒技术以及操作系统的防病毒技术因此在目前来说可能还存在着一些兼容性的问题,例如因应用程序设计的缺陷或驱动程序而导致的误报(特别是一些比较老的驱动程序);另外,对于有些程序来说,是采用实时生成代码方式来执行动态代码的,而生成的代码就有可能位于标记为不可执行的内存区域,这就有可能导致DEP将其检测为非法应用程序而将其关闭。而这些都还有赖于硬件和软件厂商的相互配合解决,当然,这些都是需要的时间。因此,DEP、EDB、EVP等技术都还在向前发展。 ***多媒体指令集 CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。 1、精简指令集的运用 在最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指令严重的影响了计算机的工作效率。后来经过研究发现,在计算机中,80%程序只用到了20%的指令集,基于这一发现,RISC精简指令集被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构的基本思路是:抓住CISC指令系统指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,从而大幅度地提高处理器的性能。 RISC指令集有许多特征,其中最重要的有: 指令种类少,指令格式规范:RISC指令集通常只使用一种或少数几种格式。指令长度单一(一般4个字节),并且在字边界上对齐。字段位置、特别是操作码的位置是固定的。 寻址方式简化:几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过5个。其他更为复杂的寻址方式,如间接寻址等则由软件利用简单的寻址方式来合成。 大量利用寄存器间操作:RISC指令集中大多数操作都是寄存器到寄存器操作,只以简单的Load和Store操作访问内存。因此,每条指令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作混在一起。 简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不必像CISC处理器那样使用微程序来实现指令操作。因此RISC处理器不必像CISC处理器那样设置微程序控制存储器,就能够快速地直接执行指令。 便于使用VLSI技术:随着LSI和VLSI技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC体系结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设计和实现。基于VLSI技术,制造RISC处理器要比CISC处理器工作量小得多,成本也低得多。 加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作技术基本上是基于RISC体系结构发展和走向成熟的。 正由于RISC体系所具有的优势,它在高端系统得到了广泛的应用,而CISC体系则在桌面系统中占据统治地位。而在如今,在桌面领域,RISC也不断渗透,预计未来,RISC将要一统江湖。 2、CPU的扩展指令集 对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。 MMX 指令集 MMX(Multi Media eXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令,通过这些指令可以一次处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作系统不必为此而做出任何修改便可以轻松地执行MMX程序。但是,问题也比较明显,那就是MMX指令集与x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成整个系统运行质量的下降。 SSE指令集 SSE(Streaming SIMD Extensions,单指令多数据流扩展)指令集是Intel在Pentium III处理器中率先推出的。其实,早在PIII正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(Katmai New Instruction)指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2指令集。究其背景,原来"KNI"指令集是Intel公司最早为其下一代芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒体凭感觉和印象对"KNI"的评价,Intel公司从未正式发布过关于MMX2的消息。 而最终推出的SSE指令集也就是所谓胜出的"互联网SSE"指令集。SSE指令集包括了70条指令,其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整数运算增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。SSE指令与3DNow!指令彼此互不兼容,但SSE包含了3DNow!技术的绝大部分功能,只是实现的方法不同。SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处理多个浮点数据来有效地提高浮点运算速度。 在后来Intel为了应对AMD的3Dnow!+指令集,又在SSE的基础上开发了SSE2,增加了一些指令,使得其P4处理器性能有大幅度提高。到P4设计结束为止,Intel增加了一套包括144条新建指令的SSE2指令集。像最早的SIMD扩展指令集,SSE2涉及了多重的数据目标上立刻执行一单个的指令(即SIMD,一个计算低工控最好的方法是让每指令执行更多的工作)。最重要的是SSE2能处理128位和两倍精密浮点数学运算。处理更精确浮点数的能力使SSE2成为加速多媒体程序、3D处理工程以及工作站类型任务的基础配置。但重要的是软件是否能适当的优化利用它。 3D Now !指令集 由AMD公司提出的3DNow!指令集应该说出现在SSE指令集之前,并被AMD广泛应用于其K6-2、K6-3以及Athlon(K7)处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。 与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!指令集主要针对三维建模、坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。后来在Athlon上开发了Enhanced 3DNow!。这些AMD标准的SIMD指令和Intel的SSE具有相同效能。因为受到Intel在商业上以及Pentium III成功的影响,软件在支持SSE上比起3DNow!更为普遍。Enhanced 3DNow!AMD公司继续增加至52个指令,包含了一些SSE码,因而在针对SSE做最佳化的软件中能获得更好的效能。 |
0 |
作者的其他主题 |
---|
【320K/MP3】【宝丽金《爱的金曲》】 |
XP下文件夹加密方法 |
信产部官员为电信业重组请教道高僧指点 |
中电信总工称2010年宽带速率升级二三十倍 |
背熟这篇文章,就能脱离鼠标 |
硬盘分区魔术师8.0 分区详细过程[图解] |
小孔 发表于 2007-5-2 18:11 只看TA 2楼 |
---|
主板知识大全 ***适用类型主板适用类型,是指该主板所适用的应用类型。针对不同用户的不同需求、不同应用范围,主板被设计成各不相同的类型,即分为台式机主板和服务器/工作站主板。 台式机主板 ![]() 台式机主板 台式机主板,就是平常大部分场合所提到的应用于PC的主板,板型是ATX或Micro ATX结构,使用普通的机箱电源,采用的是台式机芯片组,只支持单CPU,内存最大只能支持到4GB,而且一般都不支持ECC内存。存储设备接口也是采用IDE或SATA接口,某些高档产品会支持RAID。显卡接口多半都是采用AGP 4X或AGP 8X,某些高档产品也会采用AGP Pro接口以支持某些高能耗的高档显卡。扩展接口也比较丰富,有多个USB2.0/1.1,IEEE1394,COM,LPT,IrDA等接口以满足用户的不同需求。扩展插槽的类型和数量也比较多,有多个PCI,CNR,AMR等插槽适应用户的需求。部分带有整合的网卡芯片,有低档的10/100Mbps自适应网卡,也有高档的千兆网卡。在价格方面,既有几百元的入门级或主流产品,也有一二千元的高档产品以满足不同用户的需求,。台式机主板的生产厂商和品牌也非常多,市场上常见的就有几十种之多。 服务器/工作站主板 服务器/工作站主板,则是专用于服务器/工作站的主板产品,板型为较大的ATX,EATX或WATX,使用专用的服务器机箱电源。其中,某些低端的入门级产品会采用高端的台式机芯片组,例如英特尔的I875P芯片组就被广泛用在低端入门级产品上;而中高端产品则都会采用专用的服务器/工作站芯片组,例如英特尔 E7501,Sever Works GC-SL等芯片组。对服务器/工作站主板而言,最重要的是高可靠性和稳定性,其次才是高性能。因为大多数的服务器都要满足每天24小时、每周7天的满负荷工作要求。由于服务器/工作站数据处理量很大,需要采用多CPU并行处理结构,即一台服务器/工作站中安装2、4、8等多个CPU;对于服务器而言,多处理器可用于数据库处理等高负荷高速度应用;而对于工作站,多处理器系统则可以用于三维图形制作和动画文件编码等单处理器无法实现的高处理速度应用。为适应长时间,大流量的高速数据处理任务,在内存方面,服务器/工作站主板能支持高达十几GB甚至几十GB的内存容量,而且大多支持ECC内存以提高可靠性。 服务器主板 ![]() 服务器主板 服务器主板在存储设备接口方面,中高端产品也多采用SCSI接口而非IDE接口,并且支持RAID方式以提高数据处理能力和数据安全性。在显示设备方面,服务器与工作站有很大不同,服务器对显示设备要求不高,一般多采用整合显卡的芯片组,例如在许多服务器芯片组中都整合有ATI的RAGE XL显示芯片,要求稍高点的采用普通的AGP显卡,甚至是PCI显卡;而图形工作站对显卡的要求非常高,主板上的显卡接口也多采用AGP Pro 150,而且多采用高端的3DLabs、ATI等显卡公司的专业显卡,如3DLabs的“野猫”系列显卡,中低端则采用NVIDIA的Quandro系列以及ATI的Fire GL系列显卡等等。在扩展插槽方面,服务器/工作站主板与台式机主板也有所不同,例如PCI插槽,台式机主板采用的是标准的33MHz的32位PCI插槽,而服务器/工作站主板则多采用64位的PCI X-66甚至PCI X-133,其工作频率分别为66MHz和133MHz,数据传输带宽得到了极大的提高,并且支持热插拔,其电气规范以及外型尺寸都与普通的PCI插槽不同。在网络接口方面,服务器/工作站主板也与台式机主板不同,服务器主板大多配备双网卡,甚至是双千兆网卡以满足局域网与Internet的不同需求。服务器主板技术要求非常高,所以与台式机主板相比,生产厂商也就少得多了,比较出名的也就是英特尔、超微、华硕、技嘉、泰安、艾崴等品牌,在价格方面,从一千多元的入门级产品到几万元甚至十几万元的高档产品都有 ***芯片组 芯片组(Chipset)是主板的核心组成部分,如果说中央处理器(CPU)是整个电脑系统的心脏,那么芯片组将是整个身体的躯干。在电脑界称设计芯片组的厂家为Core Logic,Core的中文意义是核心或中心,光从字面的意义就足以看出其重要性。对于主板而言,芯片组几乎决定了这块主板的功能,进而影响到整个电脑系统性能的发挥,芯片组是主板的灵魂。芯片组性能的优劣,决定了主板性能的好坏与级别的高低。这是因为目前CPU的型号与种类繁多、功能特点不一,如果芯片组不能与CPU良好地协同工作,将严重地影响计算机的整体性能甚至不能正常工作。 主板芯片组几乎决定着主板的全部功能,其中CPU的类型、主板的系统总线频率,内存类型、容量和性能,显卡插槽规格是由芯片组中的北桥芯片决定的;而扩展槽的种类与数量、扩展接口的类型和数量(如USB2.0/1.1,IEEE1394,串口,并口,笔记本的VGA输出接口)等,是由芯片组的南桥决定的。还有些芯片组由于纳入了3D加速显示(集成显示芯)、AC'97声音解码等功能,还决定着计算机系统的显示性能和音频播放性能等。 现在的芯片组,是由过去286时代的所谓超大规模集成电路:门阵列控制芯片演变而来的。芯片组的分类,按用途可分为服务器/工作站,台式机、笔记本等类型,按芯片数量可分为单芯片芯片组,标准的南、北桥芯片组和多芯片芯片组(主要用于高档服务器/工作站),按整合程度的高低,还可分为整合型芯片组和非整合型芯片组等等。 台式机芯片组要求有强大的性能,良好的兼容性,互换性和扩展性,对性价比要求也最高,并适度考虑用户在一定时间内的可升级性,扩展能力在三者中最高。在最早期的笔记本设计中并没有单独的笔记本芯片组,均采用与台式机相同的芯片组,随着技术的发展,笔记本专用CPU的出现,就有了与之配套的笔记本专用芯片组。笔记本芯片组要求较低的能耗,良好的稳定性,但综合性能和扩展能力在三者中却也是最低的。服务器/工作站芯片组的综合性能和稳定性在三者中最高,部分产品甚至要求全年满负荷工作,在支持的内存容量方面也是三者中最高,能支持高达十几GB甚至几十GB的内存容量,而且其对数据传输速度和数据安全性要求最高,所以其存储设备也多采用SCSI接口而非IDE接口,而且多采用RAID方式提高性能和保证数据的安全性。 到目前为止,能够生产芯片组的厂家有英特尔(美国)、VIA(中国台湾)、SiS(中国台湾)、ALi(中国台湾)、AMD(美国)、NVIDIA(美国)、ATI(加拿大)、Server Works(美国)等几家,其中以英特尔和VIA的芯片组最为常见。在台式机的英特尔平台上,英特尔自家的芯片组占有最大的市场份额,而且产品线齐全,高、中、低端以及整合型产品都有,VIA、SIS、ALI和最新加入的ATI几家加起来都只能占有比较小的市场份额,而且主要是在中低端和整合领域。在AMD平台上,AMD自身通常是扮演一个开路先锋的角色,产品少,市场份额也很小,而VIA却占有AMD平台芯片组最大的市场份额,但现在却收到受到后起之秀NVIDIA的强劲挑战,后者凭借其nForce2芯片组的强大性能,成为AMD平台最优秀的芯片组产品,进而从VIA手里夺得了许多市场份额,。而SIS与ALi依旧是扮演配角,主要也是在中、低端和整合领域。笔记本方面,英特尔平台具有绝对的优势,所以英特尔的笔记本芯片组也占据了最大的市场分额,其它厂家都只能扮演配角以及为市场份额极小的AMD平台设计产品。服务器/工作站方面,英特尔平台更是绝对的优势地位,英特尔自家的服务器芯片组产品占据着绝大多数中、低端市场,而Server Works由于获得了英特尔的授权,在中高端领域占有最大的市场份额,甚至英特尔原厂服务器主板也有采用Server Works芯片组的产品,在服务器/工作站芯片组领域,Server Works芯片组就意味着高性能产品;而AMD服务器/工作站平台由于市场份额较小,主要都是采用AMD自家的芯片组产品。 芯片组的技术这几年来也是突飞猛进,从ISA、PCI到AGP,从ATA到SATA,Ultra DMA技术,双通道内存技术,高速前端总线等等 ,每一次新技术的进步都带来电脑性能的提高。2004年,芯片组技术又会面临重大变革,最引人注目的就是PCI Express总线技术,它将取代PCI和AGP,极大的提高设备带宽,从而带来一场电脑技术的革命。另一方面,芯片组技术也在向着高整合性方向发展,例如AMD Athlon 64 CPU内部已经整合了内存控制器,这大大降低了芯片组厂家设计产品的难度,而且现在的芯片组产品已经整合了音频,网络,SATA,RAID等功能,大大降低了用户的成本 Intel芯片组命名规则 Intel芯片组往往分系列,例如845、865、915、945、975等,同系列各个型号用字母来区分,命名有一定规则,掌握这些规则,可以在一定程度上快速了解芯片组的定位和特点: 一、从845系列到915系列以前 PE是主流版本,无集成显卡,支持当时主流的FSB和内存,支持AGP插槽。 E并非简化版本,而应该是进化版本,比较特殊的是,带E后缀的只有845E这一款,其相对于845D是增加了533MHz FSB支持,而相对于845G之类则是增加了对ECC内存的支持,所以845E常用于入门级服务器。 G是主流的集成显卡的芯片组,而且支持AGP插槽,其余参数与PE类似。 GV和GL则是集成显卡的简化版芯片组,并不支持AGP插槽,其余参数GV则与G相同,GL则有所缩水。 GE相对于G则是集成显卡的进化版芯片组,同样支持AGP插槽。 P有两种情况,一种是增强版,例如875P;另一种则是简化版,例如865P 二、915系列及之后 P是主流版本,无集成显卡,支持当时主流的FSB和内存,支持PCI-E X16插槽。 PL相对于P则是简化版本,在支持的FSB和内存上有所缩水,无集成显卡,但同样支持PCI-E X16。 G是主流的集成显卡芯片组,而且支持PCI-E X16插槽,其余参数与P类似。 GV和GL则是集成显卡的简化版芯片组,并不支持PCI-E X16插槽,其余参数GV则与G相同,GL则有所缩水。 X和XE相对于P则是增强版本,无集成显卡,支持PCI-E X16插槽。 总的说来,Intel芯片组的命名方式没有什么严格的规则,但大致上就是上述情况。另外,Intel芯片组的命名方式可能发生变化,取消后缀,而采用前缀方式,例如P965和Q965等等。 ***支持CPU类型 是指能在该主板上所采用的CPU类型。CPU的发展速度相当快,不同时期CPU的类型是不同的,而主板支持此类型就代表着属于此类的CPU大多能在该主板上运行(在主板所能支持的CPU频率限制范围内)。CPU类型从早期的386、486、Pentium、K5、K6、K6-2、Pentium II、Pentium III等,到今天的Pentium 4、Duron、AthlonXP、至强(XEON)、Athlon 64经历了很多代的改进。每种类型的CPU在针脚、主频、工作电压、接口类型、封装等方面都有差异,尤其在速度性能上差异很大。只有购买与主板支持CPU类型相同的CPU,二者才能配套工作。 ***CPU插槽类型 我们知道,CPU需要通过某个接口与主板连接的才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等。而目前CPU的接口都是针脚式接口,对应到主板上就有相应的插槽类型。不同类型的CPU具有不同的CPU插槽,因此选择CPU,就必须选择带有与之对应插槽类型的主板。主板CPU插槽类型不同,在插孔数、体积、形状都有变化,所以不能互相接插。 1. Socket 775 2. Socket 754 3. Socket 939 4. Socket 940 5. Socket 603 6. Socket 604 7. Socket 478 8. Socket A 9. Socket 423 10. Socket 370 11. SLOT 1 12. SLOT 2 13. SLOT A 14. Socket 7 Socket 775 ![]() Socket 775又称为Socket T,是目前应用于Intel LGA775封装的CPU所对应的处理器插槽,能支持LGA775封装的Pentium 4、Pentium 4 EE、Celeron D等CPU。Socket 775插槽与目前广泛采用的Socket 478插槽明显不同,非常复杂,没有Socket 478插槽那样的CPU针脚插孔,取而代之的是775根有弹性的触须状针脚(其实是非常纤细的弯曲的弹性金属丝),通过与CPU底部对应的触点相接触而获得信号。因为触点有775个,比以前的Socket 478的478pin增加不少,封装的尺寸也有所增大,为37.5mm×37.5mm。另外,与以前的Socket 478/423/370等插槽采用工程塑料制造不同,Socket 775插槽为全金属制造,原因在于这种新的CPU的固定方式对插槽的强度有较高的要求,并且新的prescott核心的CPU的功率增加很多,CPU的表面温度也提高不少,金属材质的插槽比较耐得住高温。在插槽的盖子上还卡着一块保护盖。 Socket 775插槽由于其内部的触针非常柔软和纤薄,如果在安装的时候用力不当就非常容易造成触针的损坏;其针脚实在是太容易变形了,相邻的针脚很容易搭在一起,而短路有时候会引起烧毁设备的可怕后果;此外,过多地拆卸CPU也将导致触针失去弹性进而造成硬件方面的彻底损坏,这是其目前的最大缺点。 目前,采用Socket 775插槽的主板数量并不太多,主要是Intel 915/925系列芯片组主板,也有采用比较成熟的老芯片组例如Intel 865/875/848系列以及VIA PT800/PT880等芯片组的主板。不过随着Intel加大LGA775平台的推广力度,Socket 775插槽最终将会取代Socket 478插槽,成为Intel平台的主流CPU插槽。 Socket 939 ![]() Socket 939是AMD公司2004年6月才发布的64位桌面平台标准,是目前高端的Athlon 64以及Athlon 64 FX所对应的插槽标准,具有939个CPU针脚插孔,支持200MHz外频和1000MHz的HyperTransport总线频率,并且支持双通道内存技术。 Socket 939目前的配套主板也逐渐增多,将是AMD64位桌面平台以后的主流平台。 Socket 754 ![]() Socket 754是2003年9月AMD64位桌面平台最初发布时的标准插槽,是目前低端的Athlon 64和高端的Sempron所对应的插槽标准,具有754个CPU针脚插孔,支持200MHz外频和800MHz的HyperTransport总线频率,但不支持双通道内存技术。 Socket 754是目前广泛采用的AMD64位平台标准,与之配套的主板非常多。关于Socket 754的前途目前众说纷纭,有说随着Socket 939的普及,Socket 754最终会被完全淘汰;也有说Socket 754接口的Athlon 64将会完全停产而只保留Socket 754接口的Sempron的......不管究竟是怎么样,由于AMD64平台的插槽标准过多,而且互不兼容,Socket 754应该会逐渐被Socket 939所取代。 Socket 940 ![]() Socket 940是最早发布的AMD64位平台标准,是服务器/工作站所使用的Opteron以及最初的Athlon 64 FX所对应的插槽标准,具有940个CPU针脚插孔,支持200MHz外频和800MHz的HyperTransport总线频率,并且支持双通道内存技术。 由于Socket 940接口的CPU价格高昂,而且必须搭配昂贵的ECC内存才能使用,所以其总体采购成本是比较昂贵的。现在新出的Athlon 64 FX已经改用Socket 939接口,所以Socket 940将会成为Opteron的专用接口。 Socket 478插槽 ![]() Socket 478插槽是目前Pentium 4系列处理器所采用的接口类型,针脚数为478针。Socket 478的Pentium 4处理器面积很小,其针脚排列极为紧密。采用Socket 478插槽的主板产品数量众多,是目前应用最为广泛的插槽类型。 Socket 604 ![]() 与Socket 603相仿,Socket 604仍然是应用于Intel平台高端的服务器/工作站主板,但与Socket 603的最大区别是增加了对133MHz外频以及533MHz前端总线频率的支持,2004年随着Intel64位的支持EM64T技术的Xeon的发布,又增加了对200MHz外频以及800MHz前端总线频率的支持。Socket 604插槽可以兼容Socket 603接口的Xeon和Xeon MP。 Socket 603 ![]() Socket 603的用途比较专业,应用于Intel平台高端的服务器/工作站主板,其对应的CPU是Xeon MP和早期的Xeon。Socket 603具有603个CPU针脚插孔,只能支持100MHz外频以及400MHz前端总线频率。Socket 603插槽并不能兼容Socket 604接口的Xeon。 Socket A插槽 ![]() Socket A接口,也叫Socket 462,是目前AMD公司Athlon XP和Duron处理器的插座标准。Socket A接口具有462插空,可以支持133MHz外频。如同Socket 370一样,降低了制造成本,简化了结构设计。 Socket 423 Socket 423插槽是最初Pentium 4处理器的标准接口,Socket 423的外形和前几种Socket类的插槽类似,对应的CPU针脚数为423。Socket 423插槽多是基于Intel 850芯片组主板,支持1.3GHz~1.8GHz的Pentium 4处理器。不过随着DDR内存的流行,英特尔又开发了支持SDRAM及DDR内存的i845芯片组,CPU插槽也改成了Socket 478,Socket 423插槽也就销声匿迹了。 Socket 370 ![]() Socket 370架构是英特尔开发出来代替SLOT架构,外观上与Socket 7非常像,也采用零插拔力插槽,对应的CPU是370针脚。 Socket 370主板多为采用Intel ZX、BX、i810芯片组的产品,其他厂商有VIA Apollo Pro系列、SIS 530系列等。最初认为,Socket 370的CPU升级能力可能不会太好,所以Socket 370的销量总是不如SLOT 1接口的主板。但在英特尔推出的“铜矿”和”图拉丁”系列CPU, Socket 370接口的主板一改低端形象,逐渐取代了SLOT 1接口。目前市场中还有极少部分的主板采用此种插槽。 ***超线程技术 CPU生产商为了提高CPU的性能,通常做法是提高CPU的时钟频率和增加缓存容量。不过目前CPU的频率越来越快,如果再通过提升CPU频率和增加缓存的方法来提高性能,往往会受到制造工艺上的限制以及成本过高的制约。 尽管提高CPU的时钟频率和增加缓存容量后的确可以改善性能,但这样的CPU性能提高在技术上存在较大的难度。实际上在应用中基于很多原因,CPU的执行单元都没有被充分使用。如果CPU不能正常读取数据(总线/内存的瓶颈),其执行单元利用率会明显下降。另外就是目前大多数执行线程缺乏ILP(Instruction-Level Parallelism,多种指令同时执行)支持。这些都造成了目前CPU的性能没有得到全部的发挥。因此,Intel则采用另一个思路去提高CPU的性能,让CPU可以同时执行多重线程,就能够让CPU发挥更大效率,即所谓“超线程(Hyper-Threading,简称“HT”)”技术。超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。 采用超线程及时可在同一时间里,应用程序可以使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一时刻只能够对一条指令进行操作。而超线程技术可以使芯片同时进行多线程处理,使芯片性能得到提升。 超线程技术是在一颗CPU同时执行多个程序而共同分享一颗CPU内的资源,理论上要像两颗CPU一样在同一时间执行两个线程,P4处理器需要多加入一个Logical CPU Pointer(逻辑处理单元)。因此新一代的P4 HT的die的面积比以往的P4增大了5%。而其余部分如ALU(整数运算单元)、FPU(浮点运算单元)、L2 Cache(二级缓存)则保持不变,这些部分是被分享的。 虽然采用超线程技术能同时执行两个线程,但它并不象两个真正的CPU那样,每个CPU都具有独立的资源。当两个线程都同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续。因此超线程的性能并不等于两颗CPU的性能。 英特尔P4 超线程有两个运行模式,Single Task Mode(单任务模式)及Multi Task Mode(多任务模式),当程序不支持Multi-Processing(多处理器作业)时,系统会停止其中一个逻辑CPU的运行,把资源集中于单个逻辑CPU中,让单线程程序不会因其中一个逻辑CPU闲置而减低性能,但由于被停止运行的逻辑CPU还是会等待工作,占用一定的资源,因此Hyper-Threading CPU运行Single Task Mode程序模式时,有可能达不到不带超线程功能的CPU性能,但性能差距不会太大。也就是说,当运行单线程运用软件时,超线程技术甚至会降低系统性能,尤其在多线程操作系统运行单线程软件时容易出现此问题。 需要注意的是,含有超线程技术的CPU需要芯片组、软件支持,才能比较理想的发挥该项技术的优势。操作系统如:Microsoft Windows XP、Microsoft Windows 2003,Linux kernel 2.4.x以后的版本也支持超线程技术。目前支持超线程技术的芯片组包括如: Intel芯片组: 845、845D和845GL是不支持支持超线程技术的;845E芯片组自身是支持超线程技术的,但许多主板都需要升级BIOS才能支持;在845E之后推出的所有芯片组都支持支持超线程技术,例如845PE/GE/GV以及所有的865/875系列以及915/925系列芯片组都支持超线程技术。 VIA芯片组: P4X266、P4X266A、P4M266、P4X266E和P4X333是不支持支持超线程技术的,在P4X400之后推出的所有芯片组都支持支持超线程技术,例如P4X400、P4X533、PT800、PT880、PM800和PM880都支持超线程技术。 SIS芯片组: SIS645、SIS645DX、SIS650、SIS651和早期SIS648是不支持支持超线程技术的;后期的SIS648、SIS655、SIS648FX、SIS661FX、SIS655FX、SIS655TX、SIS649和SIS656则都支持超线程技术。 ULI芯片组: M1683和M1685都支持超线程技术。 ATI芯片组: ATI在Intel平台所推出的所有芯片组都支持超线程技术,包括Radeon 9100 IGP、Radeon 9100 Pro IGP和RX330。 nVidia芯片组: 即将推出的nForce5系列芯片组都支持超线程技术。 ***前端总线频率 总线是将信息以一个或多个源部件传送到一个或多个目的部件的一组传输线。通俗的说,就是多个部件间的公共连线,用于在各个部件之间传输信息。人们常常以MHz表示的速度来描述总线频率。总线的种类很多,前端总线的英文名字是Front Side Bus,通常用FSB表示,是将CPU连接到北桥芯片的总线。计算机的前端总线频率是由CPU和北桥芯片共同决定的。 北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据。前端总线是CPU和外界交换数据的最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。 外频与前端总线频率的区别:前端总线的速度指的是CPU和北桥芯片间总线的速度,更实质性的表示了CPU和外界数据传输的速度。而外频的概念是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了PIC及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因是在以前的很长一段时间里(主要是在Pentium 4出现之前和刚出现Pentium 4时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了QDR(Quad Date Rate)技术,或者其他类似的技术实现这个目的。这些技术的原理类似于AGP的2X或者4X,它们使得前端总线的频率成为外频的2倍、4倍甚至更高,从此之后前端总线和外频的区别才开始被人们重视起来。此外,在前端总线中比较特殊的是AMD64的HyperTransport。 目前各种芯片组所支持的前端总线频率(FSB): Intel平台系列 Intel芯片组: 845、845D、845GL所支持的前端总线频率是400MHz,845E、845G、845GE、845PE、845GV以及865P、910GL所支持的前端总线频率是533MHz,而865PE、865G、865GV、848P、875P、915P、915G、915GV、925X所支持的前端总线频率是800MHz,925XE所支持的前端总线频率是1066MHz,这是目前PC机最高的前端总线频率。 VIA芯片组: P4X266、P4X266A、P4M266所支持的前端总线频率是400MHz,P4X266E、P4X333、P4X400、P4X533所支持的前端总线频率是533MHz,PT800、PT880、PM800、PM880所支持的前端总线频率是800MHz。 SIS芯片组: SIS645、SIS645DX、SIS650所支持的前端总线频率是400MHz,SIS651、SIS655、SIS648所支持的前端总线频率是533MHz,SIS648FX、SIS661FX、SIS655FX、SIS655TX、SIS649、SIS656所支持的前端总线频率是800MHz。 ATI芯片组: Radeon 9100 IGP、Radeon 9100 Pro IGP、RX330所支持的前端总线频率是800MHz。 ULI芯片组: M1683和M1685所支持的前端总线频率是800MHz。 AMD平台系列 VIA芯片组: KT266、KT266A、KM266所支持的前端总线频率是266MHz,KT333、KT400、KT400A、KM400、KN400所支持的前端总线频率是333MHz,KT600和KT880所支持的前端总线频率是400MHz。 SIS芯片组: SIS735、SIS745、SIS746、SIS740所支持的前端总线频率是266MHz,SIS741GX和SIS746FX所支持的前端总线频率是333MHz,SIS741和SIS748所支持的前端总线频率是400MHz。 Uli芯片组: M1647所支持的前端总线频率是266MHz。 nVidia芯片组: nForce2 IGP、nForce2 400和nForce2 Ultra 400所支持的前端总线频率是400MHz。 此外,由于AMD64系列CPU内部整合了内存控制器,其HyperTransport频率只与CPU接口类型有关,而与主板芯片组无关,所以其HyperTransport频率的区分是相当简单的:Socket 754平台的HyperTransport频率是800MHz,Socket 939平台的HyperTransport频率是1000MHz,而Socket 940平台的HyperTransport频率也是800MHz ***主板结构 由于主板是电脑中各种设备的连接载体,而这些设备的各不相同的,而且主板本身也有芯片组,各种I/O控制芯片,扩展插槽,扩展接口,电源插座等元器件,因此制定一个标准以协调各种设备的关系是必须的。所谓主板结构就是根据主板上各元器件的布局排列方式,尺寸大小,形状,所使用的电源规格等制定出的通用标准,所有主板厂商都必须遵循。 主板结构分为AT、Baby-AT、ATX、Micro ATX、LPX、NLX、Flex ATX、EATX、WATX以及BTX等结构。其中,AT和Baby-AT是多年前的老主板结构,现在已经淘汰;而LPX、NLX、Flex ATX则是ATX的变种,多见于国外的品牌机,国内尚不多见;EATX和WATX则多用于服务器/工作站主板;ATX是目前市场上最常见的主板结构,扩展插槽较多,PCI插槽数量在4-6个,大多数主板都采用此结构;Micro ATX又称Mini ATX,是ATX结构的简化版,就是常说的“小板”,扩展插槽较少,PCI插槽数量在3个或3个以下,多用于品牌机并配备小型机箱;而BTX则是英特尔制定的最新一代主板结构。 1. AT 2. Baby AT 3. ATX 4. Micro ATX 5. BTX AT结构 在PC推出后的第三年即1984年,IBM公布了PCAT。AT主板的尺寸为13"×12",板上集成有控制芯片和8个I/0扩充插槽。由于AT主板尺寸较大,因此系统单元(机箱)水平方向增加了2英寸,高度增加了1英寸,这一改变也是为了支持新的较大尺寸的AT格式适配卡。将8位数据、20位地址的XT扩展槽改变到16位数据、24位地址的AT扩展槽。为了保持向下兼容,它保留62脚的XT扩展槽,然后在同列增加36脚的扩展槽。XT扩展卡仍使用62脚扩展槽(每侧31脚),AT扩展卡使用共98脚的的两个同列扩展槽。这种PC AT总线结构演变策略使得它仍能在当今的任何一个PC Pentium/PCI系统上正常运行。 PC AT的初始设计是让扩展总线以微处理器相同的时钟速率来运行,即6MHz 的286,总线也是6MHz;8MHz的微处理器,则总线就是8MHz。随着微处理器速度的增加,增加扩展总线的速度也很简单。后来一些PC AT系统的扩展总线速度达到了10和12MHz。不幸的是,某些适配器不能以这样的速度工作或者能很好得工作。因此,绝大多数的PC AT仍以8或8.33MHz为扩展总线的速率,在此速度下绝大多数适配器都不能稳定工作。 Baby AT AT主板尺寸较大,板上能放置较多的元件和扩充插槽。但随着电子元件集成化程度的提高,相同功能的主板不再需要全AT的尺寸。因此在1990年推出了Baby/Mini AT主板规范,简称为Baby AT主板。 Baby AT主板是从最早的XT主板继承来的,它的大小为15"×8.5",比AT主板是略长,而宽度大大窄于AT主板。Baby AT主板沿袭了AT主板的I/0扩展插槽、键盘插座等外设接口及元件的摆放位置,而对内存槽等内部元件结构进行了紧缩,再加上大规模集成电路使内部元件减少,使得Baby AT主板比AT主板布局紧凑而功能不减。 但随着计算机硬件技术的进一步发展,计算机主板上集成功能越来越多,Baby AT主板有点不负重荷,而AT主板又过于庞大,于是很多主板商又采取另一种折衷的方案,即一方面取消主板上使用较少的零部件以压缩空间(如将I/0扩展槽减为7个甚至6个,另一方面将Baby AT主板适当加宽,增加使用面积,这就形成了众多的规格不一的Baby AT主板。当然这些主板对基本I/0插槽、外围设备接口及主板固定孔的位置不加改动,使得即使是最小的Baby AT主板也能在标准机箱上使用。最常见的Baby AT主板尺寸是3/4Baby AT主板(26.5cm×22cm即10.7"×8.7"),采用7个I/0扩展槽 ATX结构 由于Baby AT主板市场的不规范和AT主板结构过于陈旧,英特尔在95年1月公布了扩展AT主板结构,即ATX(AT extended)主板标准。这一标准得到世界主要主板厂商支持,目前已经成为最广泛的工业标准。97年2月推出了ATX2.01版。 ATX结构主板 Baby AT结构标准的首先表现在主板横向宽度太窄(一般为22cm),使得直接从主板引出接口的空间太小。大大限制了对外接口的数量,这对于功能越来越强、对外接口越来越多的微机来说,是无法克服的缺点。其次,Baby AT主板上CPU和I/0插槽的位置安排不合理。早期的CPU由于性能低、功耗小,散热的要求不高。而今天的CPU性能高、功耗大,为了使其工作稳定,必须要有良好的散热装置,加装散热片或风扇,因而大大增加了CPU的高度。在AT结构标准里CPU位于扩展槽的下方,使得很多全长的扩展卡插不上去或插上去后阻碍CPU风扇运转。内存的位置也不尽合理。早期的计算机内存大小是固定的,对安装位置无特殊要求。Baby AT主板在结构上按习惯把内存插槽安放在机箱电源的下方,安装、更换内存条往往要拆下电源或主板,很不方便。内存条散热条件也不好。此外,由于软硬盘控制器及软硬盘支架没有特定的位置,这造成了软硬盘线缆过长,增加了电脑内部连线的混乱,降低了电脑的中靠性。甚至由于硬盘线缆过长,使很多高速硬盘的转速受到影响。ATX主板针对AT和Baby AT主板的缺点做了以下改进: ? 主板外形在Baby AT的基础上旋转了90度,其几何尺寸改为30.5cm×24.4cm。 ? 采用7个I/O插槽,CPU与I/O插槽、内存插槽位置更加合理。 ? 优化了软硬盘驱动器接口位置。 ? 提高了主板的兼容性与可扩充性。 ? 采用了增强的电源管理,真正实现电脑的软件开/关机和绿色节能功能。 Micro ATX Micro ATX保持了ATX标准主板背板上的外设接口位置,与ATX兼容。 MATX结构主板 Micro ATX主板把扩展插槽减少为3-4只,DIMM插槽为2-3个,从横向减小了主板宽度,其总面积减小约0.92平方英寸,比ATX标准主板结构更为紧凑。按照Micro ATX标准,板上还应该集成图形和音频处理功能。目前很多品牌机主板使用了Micro ATX标准,在DIY市场上也常能见到Micro ATX主板。 BTX BTX是英特尔提出的新型主板架构Balanced Technology Extended的简称,是ATX结构的替代者,这类似于前几年ATX取代AT和Baby AT一样。革命性的改变是新的BTX规格能够在不牺牲性能的前提下做到最小的体积。新架构对接口、总线、设备将有新的要求。重要的是目前所有的杂乱无章,接线凌乱,充满噪音的PC机将很快过时。当然,新架构仍然提供某种程度的向后兼容,以便实现技术革命的顺利过渡。 BTX具有如下特点: ? 支持Low-profile,也即窄板设计,系统结构将更加紧凑; ? 针对散热和气流的运动,对主板的线路布局进行了优化设计; ? 主板的安装将更加简便,机械性能也将经过最优化设计。 而且,BTX提供了很好的兼容性。目前已经有数种BTX的派生版本推出,根据板型宽度的不同分为标准BTX (325.12mm), microBTX (264.16mm)及Low-profile的picoBTX (203.20mm),以及未来针对服务器的Extended BTX。而且,目前流行的新总线和接口,如PCI Express和串行ATA等,也将在BTX架构主板中得到很好的支持。 值得一提的是,新型BTX主板将通过预装的SRM(支持及保持模块)优化散热系统,特别是对CPU而言。另外,散热系统在BTX的术语中也被称为热模块。一般来说,该模块包括散热器和气流通道。目前已经开发的热模块有两种类型,即full-size及low-profile。 得益于新技术的不断应用,将来的BTX主板还将完全取消传统的串口、并口、PS/2等接口。 ***北桥芯片 北桥芯片(North Bridge)是主板芯片组中起主导作用的最重要的组成部分,也称为主桥(Host Bridge)。一般来说,芯片组的名称就是以北桥芯片的名称来命名的,例如英特尔 845E芯片组的北桥芯片是82845E,875P芯片组的北桥芯片是82875P等等。北桥芯片负责与CPU的联系并控制内存、AGP、PCI数据在北桥内部传输,提供对CPU的类型和主频、系统的前端总线频率、内存的类型(SDRAM,DDR SDRAM以及RDRAM等等)和最大容量、ISA/PCI/AGP插槽、ECC纠错等支持,整合型芯片组的北桥芯片还集成了显示核心。北桥芯片就是主板上离CPU最近的芯片,这主要是考虑到北桥芯片与处理器之间的通信最密切,为了提高通信性能而缩短传输距离。因为北桥芯片的数据处理量非常大,发热量也越来越大,所以现在的北桥芯片都覆盖着散热片用来加强北桥芯片的散热,有些主板的北桥芯片还会配合风扇进行散热。因为北桥芯片的主要功能是控制内存,而内存标准与处理器一样变化比较频繁,所以不同芯片组中北桥芯片是肯定不同的,当然这并不是说所采用的内存技术就完全不一样,而是不同的芯片组北桥芯片间肯定在一些地方有差别。 由于已经发布的AMD K8核心的CPU将内存控制器集成在了CPU内部,于是支持K8芯片组的北桥芯片变得简化多了,甚至还能采用单芯片芯片组结构。这也许将是一种大趋势,北桥芯片的功能会逐渐单一化,为了简化主板结构、提高主板的集成度,也许以后主流的芯片组很有可能变成南北桥合一的单芯片形式(事实上SIS老早就发布了不少单芯片芯片组)。 由于每一款芯片组产品就对应一款相应的北桥芯片,所以北桥芯片的数量非常多。针对不同的平台,目前主流的北桥芯片有以下产品(不包括较老的产品而且只对用户最多的英特尔芯片组作较详细的说明) Intel平台 Intel: 845系列芯片组的82845E/82845GL/82845G/82845GV/82845GE/82845PE,除82845GL以外都支持533MHz FSB(82845GL只支持400MHz FSB),支持内存方面,所有845系列北桥都支持最大2GB内存。82845GL/82845E支持DDR 266,其余都支持DDR 333。除82845GL/82845GV之外都支持AGP 4X规范。865系列芯片组的82865P/82865G/82865PE/82865GV/82848P,除82865P之外都支持800MHz FSB,DDR 400(82865P只支持533MHz FSB,DDR 333,除82848P之外都支持双通道内存以及最大4GB内存容量(82848P只支持单通道最大2GB内存),除82865GV之外都支持AGP 8X规范;还有目前最高端的875系列的82875P北桥,支持800MHz FSB,4GB双通道DDR 400以及PAT功能。英特尔的芯片组或北桥芯片名称中带有“G”字样的还整合了图形核心。 比较新的有915/925系列的82910GL、82915P、82915G、82915GV、82925X和82925XE六款北桥芯片。在支持的前端总线频率方面,82910GL只支持533MHz FSB,而82925XE则支持1066MHz FSB,其余的82915P、82915G、82915GV和82925X都支持800MHz FSB;在内存支持方面,82910GL只支持DDR内存(DDR 400),82925X和82925XE则只支持DDR2内存(DDR2 533),其余的82915P、82915G和82915GV都能支持DDR内存(DDR 400)和DDR2内存(DDR2 533),所有这六款北桥芯片都能支持双通道内存技术,最大支持4GB内存容;82910GL、82915G和82915GV集成了支持DirectX 9.0的Intel GMA900显示芯片(Intel Graphics Media Accelerator 900);在外接显卡接口方面,82915P、82915G、82925X和82925XE都提供一条PCI Express X16显卡插槽,而82910GL和82915GV则不支持独立的显卡插槽。82925X由于自身尴尬定位的原因,性能比915系列强不了多少,而却比82925XE差得多,面临着停产或限产的命运。 SIS: 主要有支持DDR SDRAM内存的SIS648FX、SIS655FX、SIS655TX、SIS656、SIS649以及集成了SiS Mirage显示芯片的SIS 661FX。其中,SIS655FX、SIS655TX和SIS656支持双通道内存技术;SIS648FX、SIS655FX、SIS655TX和SIS 661FX支持AGP 8X规范,而SIS656和SIS649则支持PCI Express X16规范;所有这六款北桥芯片都支持DDR 400内存,而SIS 649则能支持DDR2 533内存,SIS 656更能支持DDR2 667内存。 ATI: 主要就是Radeon 9100系列北桥芯片。Radeon 9100 IGP、Radeon 9100 Pro IGP和RX330这三款北桥芯片都能支持800MHz FSB、双通道DDR 400内存和AGP 8X规范,Radeon 9100 IGP和Radeon 9100 Pro IGP还集成了支持DirectX 8.1的Radeon 9200显示芯片。 VIA: 主要有比较新的PT800/PT880/PM800/PM880以及较早期的P4X400/P4X333/P4X266/P4X266A/P4X266E/P4M266等等,其中,VIA芯片组名称或北桥名称中带有“M”字样的还整合了图形核心(英特尔平台和AMD平台都如此)。PT800、PT880、PM800和PM880这四款北桥芯片都能支持800MHz FSB和DDR 400内存,并且都支持AGP 8X规范。其中PT880和PM880支持双通道内存技术,PM800和PM880还集成了S3 UniChrome Pro显示芯片。 ULI: 离开芯片组市场多年,目前产品不多,主要是M1683和M1685,这两款北桥芯片都能支持800MHz FSB,其中,M1683支持AGP 8X规范和DDR 500内存,而M1685则支持PCI Express X16规范和DDR2 667内存 AMD平台 VIA: 除了支持K7系列CPU(Athlon/Duron/Athlon XP)的KT880/KT600/KT400A以及较早期的KT400/KM400/KT333/KT266A/KT266/KT133/KT133A外,还有有K8M800、K8T800、K8T800 Pro、K8T890和K8T890 Pro。其中,支持K7系列的KT600和KT880支持400MHz FSB、DDR 400内存和AGP 8X规范,KT880还支持双通道内存技术。支持K8系列的K8M800和K8T800支持800MHz HyperTransport频率,K8T800 Pro、K8T890和K8T890 Pro支持1000MHz HyperTransport频率,K8M800、K8T800和K8T800 Pro支持AGP 8X规范,而K8T890和K8T890 Pro则支持PCI Express X16规范,并且与nVidia的nForce4 SLI相同,K8T890 Pro同样也能支持两块nVidia的Geforce 6系列显卡之间的SLI连接以提升系统的图形性能;K8M800还集成了S3 UniChrome Pro显示芯片。。 SIS: 主要有支持K7系列CPU的SIS748/SIS746/SIS746FX/SIS745/SIS741/SIS741GX/SIS740/SIS735,以及支持k8系列CPU的SIS755、SIS755FX、SIS760和SIS756。其中,SIS755和SIS760支持800MHz HyperTransport频率,SIS755FX和SIS756则支持1000MHz HyperTransport频率;SIS755、SIS755FX和SIS760支持AGP 8X规范,而SIS756则支持PCI Express X16规范;SIS760还集成了支持DirectX 8.1的SIS Mirage 2显示芯片。。 NVIDIA: 除了早期的支持K7系列CPU的nForce2 IGP/SPP,nForce2 Ultra 400,nForce2 400等,比较新的是支持K8系列CPU的nForce3系列的nForce3 250、nForce3 250Gb、nForce3 Ultra、nForce3 Pro以及nForce4系列的nForce4、nForce4 Ultra和nForce4 SLI,这些全都是单芯片芯片组,其中nForce3系列支持AGP 8X规范,而nForce4系列则支持PCI Express X16规范,nForce4 SLI更能支持两块nVidia的Geforce 6系列显卡(支持SLI技术的GeForce 6800Ultra 、GeForce 6800GT、GeForce 6600GT)之间的SLI连接,极大地提升系统的图形性能。 ULI: 离开芯片组市场多年,目前产品不多,主要就是单芯片的支持K8系列CPU的M1689,比较特别的是,M1689能支持所有的K8系列CPU,包括桌面平台(Athlon 64和Athlon 64 FX)、移动平台(Mobile Athlon 64)和服务器/工作站平台(Opteron)。支持800MHz HyperTransport频率和AGP 8X规范。 ATI: ATI刚进入AMD平台芯片组市场,目前只有支持K8系列CPU的Radeon Xpress 200(北桥芯片是RS480)和Radeon Xpress 200P(北桥芯片是RX480),这二者都支持PCI Express X16规范,其中,Radeon Xpress 200还集成了支持DirectX 9.0的Radeon X300显示芯片。Radeon Xpress 200有两项技术比较有特色,一是“HyperMemory”技术,简单的说就是在主板的北桥芯片旁边板载整合图形核芯专用的本地显存,ATI也为HyperMemory技术做了很灵活的设计,可以单独使用板载显存,也可以和系统共用内存,更可以同时使用板载显存和系统内存;二是“SurroundView”功能,即再添加一块独立显卡配合整合的图形核心,可以实现三屏显示输出功能。 ***南桥芯片 南桥芯片(South Bridge)是主板芯片组的重要组成部分,一般位于主板上离CPU插槽较远的下方,PCI插槽的附近,这种布局是考虑到它所连接的I/O总线较多,离处理器远一点有利于布线。相对于北桥芯片来说,其数据处理量并不算大,所以南桥芯片一般都没有覆盖散热片。南桥芯片不与处理器直接相连,而是通过一定的方式(不同厂商各种芯片组有所不同,例如英特尔的英特尔Hub Architecture以及SIS的Multi-Threaded“妙渠”)与北桥芯片相连。 南桥芯片负责I/O总线之间的通信,如PCI总线、USB、LAN、ATA、SATA、音频控制器、键盘控制器、实时时钟控制器、高级电源管理等,这些技术一般相对来说比较稳定,所以不同芯片组中可能南桥芯片是一样的,不同的只是北桥芯片。所以现在主板芯片组中北桥芯片的数量要远远多于南桥芯片。例如早期英特尔不同架构的芯片组Socket 7的430TX和Slot 1的440LX其南桥芯片都采用82317AB,而近两年的芯片组845E/845G/845GE/845PE等配置都采用ICH4南桥芯片,但也能搭配ICH2南桥芯片。更有甚者,有些主板厂家生产的少数产品采用的南北桥是不同芯片组公司的产品,例如以前升技的KG7-RAID主板,北桥采用了AMD 760,南桥则是VIA 686B。 南桥芯片的发展方向主要是集成更多的功能,例如网卡、RAID、IEEE 1394、甚至WI-FI无线网络等等。 ***显示芯片 显示芯片是指主板所板载的显示芯片,有显示芯片的主板不需要独立显卡就能实现普通的显示功能,以满足一般的家庭娱乐和商业应用,节省用户购买显卡的开支。板载显示芯片可以分为两种类型:整合到北桥芯片内部的显示芯片以及板载的独立显示芯片,市场中大多数板载显示芯片的主板都是前者,如常见的865G/845GE主板等;而后者则比较少见,例如精英的“游戏悍将”系列主板,板载SIS的Xabre 200独立显示芯片,并有64MB的独立显存。 主板板载显示芯片的历史已经非常悠久了,从较早期VIA的MVP4芯片组到后来英特尔的810系列,815系列,845GL/845G/845GV/845GE,865G/865GV以及即将推出的910GL/915G/915GL/915GV等芯片组都整合了显示芯片。而英特尔也正是依靠了整合的显示芯片,才占据了图形芯片市场的较大份额。 目前各大主板芯片组厂商都有整合显示芯片的主板产品,而所有的主板厂商也都有对应的整合型主板。英特尔平台方面整合芯片组的厂商有英特尔,VIA,SIS,ATI等,AMD平台方面整合芯片组的厂商有VIA,SIS,NVIDIA等等。从性能上来说,英特尔平台方面显示芯片性能最高的是ATI的Radeon 9100 IGP芯片组,而AMD平台方面显示芯片性能最高的是NVIDIA的nForce2 IGP芯片组。 ***板载音效 板载音效是指主板所整合的声卡芯片型号或类型。 声卡是一台多媒体电脑的主要设备之一,现在的声卡一般有板载声卡和独立声卡之分。在早期的电脑上并没有板载声卡,电脑要发声必须通过独立声卡来实现。随着主板整合程度的提高以及CPU性能的日益强大,同时主板厂商降低用户采购成本的考虑,板载声卡出现在越来越多的主板中,目前板载声卡几乎成为主板的标准配置了,没有板载声卡的主板反而比较少了。 ![]() 板载ALC650声卡芯片 板载声卡一般有软声卡和硬声卡之分。这里的软硬之分,指的是板载声卡是否具有声卡主处理芯片之分,一般软声卡没有主处理芯片,只有一个解码芯片,通过CPU的运算来代替声卡主处理芯片的作用。而板载硬声卡带有主处理芯片,很多音效处理工作就不再需要CPU参与了。 AC'97 AC'97的全称是Audio CODEC'97,这是一个由英特尔、雅玛哈等多家厂商联合研发并制定的一个音频电路系统标准。它并不是一个实实在在的声卡种类,只是一个标准。目前最新的版本已经达到了2.3。现在市场上能看到的声卡大部分的CODEC都是符合AC'97标准。厂商也习惯用符合CODEC的标准来衡量声卡,因此很多的主板产品,不管采用的何种声卡芯片或声卡类型,都称为AC'97声卡。 HD Audio HD Audio是High Definition Audio(高保真音频)的缩写,原称Azalia,是Intel与杜比(Dolby)公司合力推出的新一代音频规范。目前主要是Intel 915/925系列芯片组的ICH6系列南桥芯片所采用。 HD Audio的制定是为了取代目前流行的AC’97音频规范,与AC’97有许多共通之处,某种程度上可以说是AC’97的增强版,但并不能向下兼容AC’97标准。它在AC’97的基础上提供了全新的连接总线,支持更高品质的音频以及更多的功能。与AC’97音频解决方案相类似,HD Audio同样是一种软硬混合的音频规范,集成在ICH6芯片中(除去Codec部分)。与现行的AC’97相比,HD Audio具有数据传输带宽大、音频回放精度高、支持多声道阵列麦克风音频输入、CPU的占用率更低和底层驱动程序可以通用等特点。 特别有意思的是HD Audio有一个非常人性化的设计,HD Audio支持设备感知和接口定义功能,即所有输入输出接口可以自动感应设备接入并给出提示,而且每个接口的功能可以随意设定。该功能不仅能自行判断哪个端口有设备插入,还能为接口定义功能。例如用户将MIC插入音频输出接口,HD Audio便能探测到该接口有设备连接,并且能自动侦测设备类型,将该接口定义为MIC输入接口,改变原接口属性。由此看来,用户连接音箱、耳机和MIC就像连接USB设备一样简单,在控制面板上点几下鼠标即可完成接口的切换,即便是复杂的多声道音箱,菜鸟级用户也能做到“即插即用”。 板载声卡优缺点 因为板载软声卡没有声卡主处理芯片,在处理音频数据的时候会占用部分CPU资源,在CPU主频不太高的情况下会略微影响到系统性能。目前CPU主频早已用GHz来进行计算,而音频数据处理量却增加的并不多,相对于以前的CPU而言,CPU资源占用旅已经大大降低,对系统性能的影响也微乎其微了,几乎可以忽略。 “音质”问题也是板载软声卡的一大弊病,比较突出的就是信噪比较低,其实这个问题并不是因为板载软声卡对音频处理有缺陷造成的,主要是因为主板制造厂商设计板载声卡时的布线不合理,以及用料做工等方面,过于节约成本造成的。 而对于板载的硬声卡,则基本不存在以上两个问题,其性能基本能接近并达到一般独立声卡,完全可以满足普通家庭用户的需要。 集成声卡最大的优势就是性价比,而且随着声卡驱动程序的不断完善,主板厂商的设计能力的提高,以及板载声卡芯片性能的提高和价格的下降,板载声卡越来越得到用户的认可。 板载声卡的劣势却正是独立声卡的优势,而独立声卡的劣势又正是板载声卡的优势。独立声卡从几十元到几千元有着各种不同的档次,从性能上讲集成声卡完全不输给中低端的独立声卡,在性价比上集成声卡又占尽优势。在中低端市场,在追求性价的用户中,集成声卡是不错的选择 ***网卡芯片 主板网卡芯片是指整合了网络功能的主板所集成的网卡芯片,与之相对应,在主板的背板上也有相应的网卡接口(RJ-45),该接口一般位于音频接口或USB接口附近。 ![]() 板载RTL8100B网卡芯片 以前由于宽带上网很少,大多都是拨号上网,网卡并非电脑的必备配件,板载网卡芯片的主板很少,如果要使用网卡就只能采取扩展卡的方式;而现在随着宽带上网的流行,网卡逐渐成为电脑的基本配件之一,板载网卡芯片的主板也越来越多了。 在使用相同网卡芯片的情况下,板载网卡与独立网卡在性能上没有什么差异,而且相对与独立网卡,板载网卡也具有独特的优势。首先是降低了用户的采购成本,例如现在板载千兆网卡的主板越来越多,而购买一块独立的千兆网卡却需要好几百元;其次,可以节约系统扩展资源,不占用独立网卡需要占用的PCI插槽或USB接口等;再次,能够实现良好的兼容性和稳定性,不容易出现独立网卡与主板兼容不好或与其它设备资源冲突的问题。 板载网卡芯片以速度来分可分为10/100Mbps自适应网卡和千兆网卡,以网络连接方式来分可分为普通网卡和无线网卡,以芯片类型来分可分为芯片组内置的网卡芯片(某些芯片组的南桥芯片,如SIS963)和主板所附加的独立网卡芯片(如Realtek 8139系列)。部分高档家用主板、服务器主板还提供了双板载网卡。 板载网卡芯片主要生产商是英特尔,3Com,Realtek,VIA和SIS等等。 ***板载RAID RAID是英文Redundant Array of Inexpensive Disks的缩写,中文简称为廉价磁盘冗余阵列。RAID就是一种由多块硬盘构成的冗余阵列。虽然RAID包含多块硬盘,但是在操作系统下是作为一个独立的大型存储设备出现。利用RAID技术于存储系统的好处主要有以下三种: 1. 通过把多个磁盘组织在一起作为一个逻辑卷提供磁盘跨越功能 2. 通过把数据分成多个数据块(Block)并行写入/读出多个磁盘以提高访问磁盘的速度 3. 通过镜像或校验操作提供容错能力 最初开发RAID的主要目的是节省成本,当时几块小容量硬盘的价格总和要低于大容量的硬盘。目前来看RAID在节省成本方面的作用并不明显,但是RAID可以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。除了性能上的提高之外,RAID还可以提供良好的容错能力,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。 RAID技术分为几种不同的等级,分别可以提供不同的速度,安全性和性价比。根据实际情况选择适当的RAID级别可以满足用户对存储系统可用性、性能和容量的要求。常用的RAID级别有以下几种:NRAID,JBOD,RAID0,RAID1,RAID0+1,RAID3,RAID5等。目前经常使用的是RAID5和RAID(0+1)。NRAID NRAID即Non-RAID,所有磁盘的容量组合成一个逻辑盘,没有数据块分条(no block stripping)。NRAID不提供数据冗余。要求至少一个磁盘。 JBOD JBOD代表Just a Bunch of Drives,磁盘控制器把每个物理磁盘看作独立的磁盘,因此每个磁盘都是独立的逻辑盘。JBOD也不提供数据冗余。要求至少一个磁盘。 RAID 0 RAID 0即Data Stripping(数据分条技术)。整个逻辑盘的数据是被分条(stripped)分布在多个物理磁盘上,可以并行读/写,提供最快的速度,但没有冗余能力。要求至少两个磁盘。我们通过RAID 0可以获得更大的单个逻辑盘的容量,且通过对多个磁盘的同时读取获得更高的存取速度。RAID 0首先考虑的是磁盘的速度和容量,忽略了安全,只要其中一个磁盘出了问题,那么整个阵列的数据都会不保了。 RAID 1 RAID 1,又称镜像方式,也就是数据的冗余。在整个镜像过程中,只有一半的磁盘容量是有效的(另一半磁盘容量用来存放同样的数据)。同RAID 0相比,RAID 1首先考虑的是安全性,容量减半、速度不变。 RAID 0+1 为了达到既高速又安全,出现了RAID 10(或者叫RAID 0+1),可以把RAID 10简单地理解成由多个磁盘组成的RAID 0阵列再进行镜像。 RAID 3和RAID 5 RAID 3和RAID 5都是校验方式。RAID 3的工作方式是用一块磁盘存放校验数据。由于任何数据的改变都要修改相应的数据校验信息,存放数据的磁盘有好几个且并行工作,而存放校验数据的磁盘只有一个,这就带来了校验数据存放时的瓶颈。RAID 5的工作方式是将各个磁盘生成的数据校验切成块,分别存放到组成阵列的各个磁盘中去,这样就缓解了校验数据存放时所产生的瓶颈问题,但是分割数据及控制存放都要付出速度上的代价。 按照硬盘接口的不同,RAID分为SCSI RAID,IDE RAID和SATA RAID。其中,SCSI RAID主要用于要求高性能和高可靠性的服务器/工作站,而台式机中主要采用IDE RAID和SATA RAID。 以前RAID功能主要依靠在主板上插接RAID控制卡实现,而现在越来越多的主板都添加了板载RAID芯片直接实现RAID功能,目前主流的RAID芯片有HighPoint的HTP372和Promise的PDC20265R,而英特尔更进一步,直接在主板芯片组中支持RAID,其ICH5R南桥芯片中就内置了SATA RAID功能,这也代表着未来板载RAID的发展方向---芯片组集成RAID。 Matrix RAID: Matrix RAID即所谓的“矩阵RAID”,是ICH6R南桥所支持的一种廉价的磁盘冗余技术,是一种经济性高的新颖RAID解决方案。Matrix RAID技术的原理相当简单,只需要两块硬盘就能实现了RAID 0和RAID 1磁盘阵列,并且不需要添加额外的RAID控制器,这正是我们普通用户所期望的。Matrix RAID需要硬件层和软件层同时支持才能实现,硬件方面目前就是ICH6R南桥以及更高阶的ICH6RW南桥,而Intel Application Acclerator软件和Windows操作系统均对软件层提供了支持。 Matrix RAID的原理就是将每个硬盘容量各分成两部分(即:将一个硬盘虚拟成两个子硬盘,这时子硬盘总数为4个),其中用两个虚拟子硬盘来创建RAID0模式以提高效能,而其它两个虚拟子硬盘则透过镜像备份组成RAID 1用来备份数据。在Matrix RAID模式中数据存储模式如下:两个磁盘驱动器的第一部分被用来创建RAID 0阵列,主要用来存储操作系统、应用程序和交换文件,这是因为磁盘开始的区域拥有较高的存取速度,Matrix RAID将RAID 0逻辑分割区置于硬盘前端(外圈)的主因,是可以让需要效能的模块得到最好的效能表现;而两个磁盘驱动器的第二部分用来创建RAID1模式,主要用来存储用户个人的文件和数据。 例如,使用两块120GB的硬盘,可以将两块硬盘的前60GB组成120GB的逻辑分割区,然后剩下两个60GB区块组成一个60GB的数据备份分割区。像需要高效能、却不需要安全性的应用,就可以安装在RAID 0分割区,而需要安全性备分的数据,则可安装在RAID 1分割区。换言之,使用者得到的总硬盘空间是180GB,和传统的RAID 0+1相比,容量使用的效益非常的高,而且在容量配置上有着更高的弹性。如果发生硬盘损毁,RAID 0分割区数据自然无法复原,但是RAID 1分割区的数据却会得到保全。 可以说,利用Matrix RAID技术,我们只需要2个硬盘就可以在获取高效数据存取的同时又能确保数据安全性。这意味着普通用户也可以低成本享受到RAID 0+1应用模式。 ![]() NV RAID: NV RAID是nVidia自行开发的RAID技术,随着nForce各系列芯片组的发展也不断推陈出新。相对于其它RAID技术而言,目前最新的nForce4系列芯片组的NV RAID具有自己的鲜明特点,主要是以下几点: (1)交错式RAID(Cross-Controller RAID):交错式RAID即俗称的混合式RAID,也就是将SATA接口的硬盘与IDE接口的硬盘联合起来组成一个RAID模式。交错式RAID在nForce3 250系列芯片组中便已经出现,在nForce 4系列芯片组身上该功能得到延续和增强。 (2)热冗余备份功能:在nForce 4系列芯片组中,因支持Serial ATA 2.0的热插拔功能,用户可以在使用过程中更换损坏的硬盘,并在运行状态下重新建立一个新的镜像,确保重要数据的安全性。更为可喜的是,nForce 4的nVIDIA RAID控制器还允许用户为运行中的RAID系统增加一个冗余备份特性,而不必理会系统采用哪一种RAID模式,用户可以在驱动程序提供的“管理工具”中指派任何一个多余的硬盘用作RAID系统的热备份。该热冗余硬盘可以让多个RAID系统(如一个RAID 0和一个RAID1)共享,也可以为其中一个RAID系统所独自占有,功能类似于时下的高端RAID系统。 (3)简易的RAID模式迁移:nForce 4系列芯片组的NV RAID模块新增了一个名为“Morphing”的新功能,用户只需要选择转换之后的RAID模式,而后执行“Morphing”操作,RAID删除和模式重设的工作可以自动完成,无需人为干预,易用性明显提高。 ***支持内存类型 支持内存类型是指主板所支持的具体内存类型。不同的主板所支持的内存类型是不相同的。内存类型主要有FPM,EDO,SDRAM,RDRAM已经DDR DRAM等。 1. FPM内存 2. EDO内存 3. SDRAM内存 4. RDRAM内存 5. DDR SDRAM内存 6. DDR2内存 ECC并不是内存类型,ECC(Error Correction Coding或Error Checking and Correcting)是一种具有自动纠错功能的内存,英特尔的82430HX芯片组就开始支持它,使用该芯片组的主板都可以安装使用ECC内存,但由于ECC内存成本比较高,所以主要应用在要求系统运算可靠性比较高的商业电脑中,例如服务器/工作站等等。由于实际上存储器出错的情况不会经常发生,而且普通的主板也并不支持ECC内存,所以一般的家用与办公电脑也不必采用ECC内存。 一般情况下,一块主板只支持一种内存类型,但也有例外。有些主板具有两种内存插槽,可以使用两种内存,例如以前有些主板能使用EDO和SDRAM,现在有些主板能使用SDRAM和DDR SDRAM。 ![]() 上图中的主板就支持两种内存类型(SDRAM和DDR SDRAM),采用两种类型的内存插槽(蓝色和黑色)区分。值得注意的是,在这些主板上不能同时使用两种内存,而只能使用其中的一种,这是因为其电气规范和工作电压是不同的,混用会引起内存损坏和主板损坏的问题 DDR SDRAM内存 DDR SDRAM是Double Data Rate Synchronous Dynamic Random Access Memory(双数据率同步动态随机存储器)的简称,是由VIA等公司为了与RDRAM相抗衡而提出的内存标准。DDR SDRAM是SDRAM的更新换代产品,采用2.5v工作电压,它允许在时钟脉冲的上升沿和下降沿传输数据,这样不需要提高时钟的频率就能加倍提高SDRAM的速度,并具有比SDRAM多一倍的传输速率和内存带宽,例如DDR 266与PC 133 SDRAM相比,工作频率同样是133MHz,但内存带宽达到了2.12 GB/s,比PC 133 SDRAM高一倍。目前主流的芯片组都支持DDR SDRAM,是目前最常用的内存类型 ***DDR2 DDR2的定义: DDR2(Double Data Rate 2) SDRAM是由JEDEC(电子设备工程联合委员会)进行开发的新生代内存技术标准,它与上一代DDR内存技术标准最大的不同就是,虽然同是采用了在时钟的上升/下降延同时进行数据传输的基本方式,但DDR2内存却拥有两倍于上一代DDR内存预读取能力(即:4bit数据读预取)。换句话说,DDR2内存每个时钟能够以4倍外部总线的速度读/写数据,并且能够以内部控制总线4倍的速度运行。 此外,由于DDR2标准规定所有DDR2内存均采用FBGA封装形式,而不同于目前广泛应用的TSOP/TSOP-II封装形式,FBGA封装可以提供了更为良好的电气性能与散热性,为DDR2内存的稳定工作与未来频率的发展提供了坚实的基础。回想起DDR的发展历程,从第一代应用到个人电脑的DDR200经过DDR266、DDR333到今天的双通道DDR400技术,第一代DDR的发展也走到了技术的极限,已经很难通过常规办法提高内存的工作速度;随着Intel最新处理器技术的发展,前端总线对内存带宽的要求是越来越高,拥有更高更稳定运行频率的DDR2内存将是大势所趋。 DDR2与DDR的区别: 在了解DDR2内存诸多新技术前,先让我们看一组DDR和DDR2技术对比的数据。 1、延迟问题: 从上表可以看出,在同等核心频率下,DDR2的实际工作频率是DDR的两倍。这得益于DDR2内存拥有两倍于标准DDR内存的4BIT预读取能力。换句话说,虽然DDR2和DDR一样,都采用了在时钟的上升延和下降延同时进行数据传输的基本方式,但DDR2拥有两倍于DDR的预读取系统命令数据的能力。也就是说,在同样100MHz的工作频率下,DDR的实际频率为200MHz,而DDR2则可以达到400MHz。 这样也就出现了另一个问题:在同等工作频率的DDR和DDR2内存中,后者的内存延时要慢于前者。举例来说,DDR 200和DDR2-400具有相同的延迟,而后者具有高一倍的带宽。实际上,DDR2-400和DDR 400具有相同的带宽,它们都是3.2GB/s,但是DDR400的核心工作频率是200MHz,而DDR2-400的核心工作频率是100MHz,也就是说DDR2-400的延迟要高于DDR400。 2、封装和发热量: DDR2内存技术最大的突破点其实不在于用户们所认为的两倍于DDR的传输能力,而是在采用更低发热量、更低功耗的情况下,DDR2可以获得更快的频率提升,突破标准DDR的400MHZ限制。 DDR内存通常采用TSOP芯片封装形式,这种封装形式可以很好的工作在200MHz上,当频率更高时,它过长的管脚就会产生很高的阻抗和寄生电容,这会影响它的稳定性和频率提升的难度。这也就是DDR的核心频率很难突破275MHZ的原因。而DDR2内存均采用FBGA封装形式。不同于目前广泛应用的TSOP封装形式,FBGA封装提供了更好的电气性能与散热性,为DDR2内存的稳定工作与未来频率的发展提供了良好的保障。 DDR2内存采用1.8V电压,相对于DDR标准的2.5V,降低了不少,从而提供了明显的更小的功耗与更小的发热量,这一点的变化是意义重大的。 DDR2采用的新技术: 除了以上所说的区别外,DDR2还引入了三项新的技术,它们是OCD、ODT和Post CAS。OCD(Off-Chip Driver):也就是所谓的离线驱动调整,DDR II通过OCD可以提高信号的完整性。DDR II通过调整上拉(pull-up)/下拉(pull-down)的电阻值使两者电压相等。使用OCD通过减少DQ-DQS的倾斜来提高信号的完整性;通过控制电压来提高信号品质。 ODT:ODT是内建核心的终结电阻器。我们知道使用DDR SDRAM的主板上面为了防止数据线终端反射信号需要大量的终结电阻。它大大增加了主板的制造成本。实际上,不同的内存模组对终结电路的要求是不一样的,终结电阻的大小决定了数据线的信号比和反射率,终结电阻小则数据线信号反射低但是信噪比也较低;终结电阻高,则数据线的信噪比高,但是信号反射也会增加。因此主板上的终结电阻并不能非常好的匹配内存模组,还会在一定程度上影响信号品质。DDR2可以根据自已的特点内建合适的终结电阻,这样可以保证最佳的信号波形。使用DDR2不但可以降低主板成本,还得到了最佳的信号品质,这是DDR不能比拟的。 Post CAS:它是为了提高DDR II内存的利用效率而设定的。在Post CAS操作中,CAS信号(读写/命令)能够被插到RAS信号后面的一个时钟周期,CAS命令可以在附加延迟(Additive Latency)后面保持有效。原来的tRCD(RAS到CAS和延迟)被AL(Additive Latency)所取代,AL可以在0,1,2,3,4中进行设置。由于CAS信号放在了RAS信号后面一个时钟周期,因此ACT和CAS信号永远也不会产生碰撞冲突。 总的来说,DDR2采用了诸多的新技术,改善了DDR的诸多不足,虽然它目前有成本高、延迟慢能诸多不足,但相信随着技术的不断提高和完善,这些问题终将得到解决。 ***支持内存最大容量 主板所能支持内存的最大容量是指最大能在该主板上插入多大容量的内存条,超过容量的内存条即便插在主板上,主板也无不支持。主板支持的最大内存容量理论上由芯片组所决定,北桥决定了整个芯片所能支持的最大内存容量。但在实际应用中,主板支持的最大内存容量还受到主板上内存插槽数量的限制,主板制造商出于设计、成本上的需要,可能会在主板上采用较少的内存插槽,此时即便芯片组支持很大的内存容量,但主板上并没有足够的内存插槽供适用,就没法达到理论最大值。 ![]() 比如KT600北桥最大能支持4GB的内存,但大部分的主板厂商只提供了两个或三个184pin的DDR DIMM内存插槽,其支持最大内存容量就只能达到2GB或3GB。 ***双通道内存 双通道内存技术其实是一种内存控制和管理技术,它依赖于芯片组的内存控制器发生作用,在理论上能够使两条同等规格内存所提供的带宽增长一倍。它并不是什么新技术,早就被应用于服务器和工作站系统中了,只是为了解决台式机日益窘迫的内存带宽瓶颈问题它才走到了台式机主板技术的前台。在几年前,英特尔公司曾经推出了支持双通道内存传输技术的i820芯片组,它与RDRAM内存构成了一对黄金搭档,所发挥出来的卓绝性能使其一时成为市场的最大亮点,但生产成本过高的缺陷却造成了叫好不叫座的情况,最后被市场所淘汰。由于英特尔已经放弃了对RDRAM的支持,所以目前主流芯片组的双通道内存技术均是指双通道DDR内存技术,主流双通道内存平台英特尔方面是英特尔 865、875系列,而AMD方面则是NVIDIA Nforce2系列。 双通道内存技术是解决CPU总线带宽与内存带宽的矛盾的低价、高性能的方案。现在CPU的FSB(前端总线频率)越来越高,英特尔 Pentium 4比AMD Athlon XP对内存带宽具有高得多的需求。英特尔 Pentium 4处理器与北桥芯片的数据传输采用QDR(Quad Data Rate,四次数据传输)技术,其FSB是外频的4倍。英特尔 Pentium 4的FSB分别是400、533、800MHz,总线带宽分别是3.2GB/sec,4.2GB/sec和6.4GB/sec,而DDR 266/DDR 333/DDR 400所能提供的内存带宽分别是2.1GB/sec,2.7GB/sec和3.2GB/sec。在单通道内存模式下,DDR内存无法提供CPU所需要的数据带宽从而成为系统的性能瓶颈。而在双通道内存模式下,双通道DDR 266、DDR 333、DDR 400所能提供的内存带宽分别是4.2GB/sec,5.4GB/sec和6.4GB/sec,在这里可以看到,双通道DDR 400内存刚好可以满足800MHz FSB Pentium 4处理器的带宽需求。而对AMD Athlon XP平台而言,其处理器与北桥芯片的数据传输技术采用DDR(Double Data Rate,双倍数据传输)技术,FSB是外频的2倍,其对内存带宽的需求远远低于英特尔 Pentium 4平台,其FSB分别为266、333、400MHz,总线带宽分别是2.1GB/sec,2.7GB/sec和3.2GB/sec,使用单通道的DDR 266、DDR 333、DDR 400就能满足其带宽需求,所以在AMD K7平台上使用双通道DDR内存技术,可说是收效不多,性能提高并不如英特尔平台那样明显,对性能影响最明显的还是采用集成显示芯片的整合型主板。 NVIDIA推出的nForce芯片组是第一个把DDR内存接口扩展为128-bit的芯片组,随后英特尔在它的E7500服务器主板芯片组上也使用了这种双通道DDR内存技术,SiS和VIA也纷纷响应,积极研发这项可使DDR内存带宽成倍增长的技术。但是,由于种种原因,要实现这种双通道DDR(128 bit的并行内存接口)传输对于众多芯片组厂商来说绝非易事。DDR SDRAM内存和RDRAM内存完全不同,后者有着高延时的特性并且为串行传输方式,这些特性决定了设计一款支持双通道RDRAM内存芯片组的难度和成本都不算太高。但DDR SDRAM内存却有着自身局限性,它本身是低延时特性的,采用的是并行传输模式,还有最重要的一点:当DDR SDRAM工作频率高于400MHz时,其信号波形往往会出现失真问题,这些都为设计一款支持双通道DDR内存系统的芯片组带来不小的难度,芯片组的制造成本也会相应地提高,这些因素都制约着这项内存控制技术的发展。 普通的单通道内存系统具有一个64位的内存控制器,而双通道内存系统则有2个64位的内存控制器,在双通道模式下具有128bit的内存位宽,从而在理论上把内存带宽提高一倍。虽然双64位内存体系所提供的带宽等同于一个128位内存体系所提供的带宽,但是二者所达到效果却是不同的。双通道体系包含了两个独立的、具备互补性的智能内存控制器,理论上来说,两个内存控制器都能够在彼此间零延迟的情况下同时运作。比如说两个内存控制器,一个为A、另一个为B。当控制器B准备进行下一次存取内存的时候,控制器A就在读/写主内存,反之亦然。两个内存控制器的这种互补“天性”可以让等待时间缩减50%。双通道DDR的两个内存控制器在功能上是完全一样的,并且两个控制器的时序参数都是可以单独编程设定的。这样的灵活性可以让用户使用二条不同构造、容量、速度的DIMM内存条,此时双通道DDR简单地调整到最低的内存标准来实现128bit带宽,允许不同密度/等待时间特性的DIMM内存条可以可靠地共同运作。 支持双通道DDR内存技术的台式机芯片组,英特尔平台方面有英特尔的865P、865G、865GV、865PE、875P以及之后的915、925系列;VIA的PT880,ATI的Radeon 9100 IGP系列,SIS的SIIS 655,SIS 655FX和SIS 655TX;AMD平台方面则有VIA的KT880,NVIDIA的nForce2 Ultra 400,nForce2 IGP,nForce2 SPP及其以后的芯片。 AMD的64位CPU,由于集成了内存控制器,因此是否支持内存双通道看CPU就可以。目前AMD的台式机CPU,只有939接口的才支持内存双通道,754接口的不支持内存双通道。除了AMD的64位CPU,其他计算机是否可以支持内存双通道主要取决于主板芯片组,支持双通道的芯片组上边有描述,也可以查看主板芯片组资料。此外有些芯片组在理论上支持不同容量的内存条实现双通道,不过实际还是建议尽量使用参数一致的两条内存条。 内存双通道一般要求按主板上内存插槽的颜色成对使用,此外有些主板还要在BIOS做一下设置,一般主板说明书会有说明。当系统已经实现双通道后,有些主板在开机自检时会有提示,可以仔细看看。由于自检速度比较快,所以可能看不到。因此可以用一些软件查看,很多软件都可以检查,比如cpu-z,比较小巧。在“memory”这一项中有“channels”项目,如果这里显示“Dual”这样的字,就表示已经实现了双通道。两条256M的内存构成双通道效果会比一条512M的内存效果好,因为一条内存无法构成双通道。 ***显卡插槽 接口类型是指显卡与主板连接所采用的接口种类。显卡的接口决定着显卡与系统之间数据传输的最大带宽,也就是瞬间所能传输的最大数据量。不同的接口能为显卡带来不同的性能。,而且也决定着主板是否能够使用此显卡。只有在主板上有相应接口的情况下,显卡才能使用。显卡发展至今共出现ISA、PCI、AGP等几种接口,所能提供的数据带宽依次增加。而采用下一代的PCI Express接口的显卡也将在2004年正式被推出,届时显卡的数据带宽将得到进一步的增大,以解决显卡与系统数据传输的瓶颈问题。 PCI是Peripheral Component Interconnect(外设部件互连标准)的缩写,它是目前个人电脑中使用最为广泛的接口,几乎所有的主板产品上都带有这种插槽。PCI插槽也是主板带有最多数量的插槽类型,在目前流行的台式机主板上,ATX结构的主板一般带有5~6个PCI插槽,而小一点的MATX主板也都带有2~3个PCI插槽,可见其应用的广泛性。 PCI是由Intel公司1991年推出的一种局部总线。从结构上看,PCI是在CPU和原来的系统总线之间插入的一级总线,具体由一个桥接电路实现对这一层的管理,并实现上下之间的接口以协调数据的传送。管理器提供了信号缓冲,使之能支持10种外设,并能在高时钟频率下保持高性能,它为显卡,声卡,网卡,MODEM等设备提供了连接接口,它的工作频率为33MHz/66MHz。 最早提出的PCI 总线工作在33MHz 频率之下,传输带宽达到了133MB/s(33MHz X 32bit/8),基本上满足了当时处理器的发展需要。随着对更高性能的要求,1993年又提出了64bit 的PCI 总线,后来又提出把PCI 总线的频率提升到66MHz 。目前广泛采用的是32-bit、33MHz 的PCI 总线,64bit的PCI插槽更多是应用于服务器产品。 由于PCI 总线只有133MB/s 的带宽,对声卡、网卡、视频卡等绝大多数输入/输出设备显得绰绰有余,但对性能日益强大的显卡则无法满足其需求。目前PCI接口的显卡已经不多见了,只有较老的PC上才有,厂商也很少推出此类接口的产品。 AGP(Accelerate Graphical Port),加速图形接口。随着显示芯片的发展,PCI总线日益无法满足其需求。英特尔于1996年7月正式推出了AGP接口,它是一种显示卡专用的局部总线。严格的说,AGP不能称为总线,它与PCI总线不同,因为它是点对点连接,即连接控制芯片和AGP显示卡,但在习惯上我们依然称其为AGP总线。AGP接口是基于PCI 2.1 版规范并进行扩充修改而成,工作频率为66MHz。 AGP总线直接与主板的北桥芯片相连,且通过该接口让显示芯片与系统主内存直接相连,避免了窄带宽的PCI总线形成的系统瓶颈,增加3D图形数据传输速度,同时在显存不足的情况下还可以调用系统主内存。所以它拥有很高的传输速率,这是PCI等总线无法与其相比拟的。 由于采用了数据读写的流水线操作减少了内存等待时间,数据传输速度有了很大提高;具有133MHz及更高的数据传输频率;地址信号与数据信号分离可提高随机内存访问的速度;采用并行操作允许在CPU访问系统RAM的同时AGP显示卡访问AGP内存;显示带宽也不与其它设备共享,从而进一步提高了系统性能。 AGP标准在使用32位总线时,有66MHz和133MHz两种工作频率,最高数据传输率为266Mbps和533Mbps,而PCI总线理论上的最大传输率仅为133Mbps。目前最高规格的AGP 8X模式下,数据传输速度达到了2.1GB/s。 AGP接口的发展经历了AGP1.0(AGP1X、AGP2X)、AGP2.0(AGP Pro、AGP4X)、AGP3.0(AGP8X)等阶段,其传输速度也从最早的AGP1X的266MB/S的带宽发展到了AGP8X的2.1GB/S。 AGP 1.0(AGP1X、AGP2X) 1996年7月AGP 1.0 图形标准问世,分为1X和2X两种模式,数据传输带宽分别达到了266MB/s和533MB/s。这种图形接口规范是在66MHz PCI2.1规范基础上经过扩充和加强而形成的,其工作频率为66MHz,工作电压为3.3v,在一段时间内基本满足了显示设备与系统交换数据的需要。这种规范中的AGP带宽很小,现在已经被淘汰了,只有在前几年的老主板上还见得到。 AGP2.0(AGP4X) 显示芯片的飞速发展,图形卡单位时间内所能处理的数据呈几何级数成倍增长,AGP 1.0 图形标准越来越难以满足技术的进步了,由此AGP 2.0便应运而生了。1998年5月份,AGP 2.0 规范正式发布,工作频率依然是66MHz,但工作电压降低到了1.5v,并且增加了4x模式,这样它的数据传输带宽达到了1066MB/sec,数据传输能力大大地增强了。 AGP Pro AGP Pro接口与AGP 2.0同时推出,这是一种为了满足显示设备功耗日益加大的现实而研发的图形接口标准,应用该技术的图形接口主要的特点是比AGP 4x略长一些,其加长部分可容纳更多的电源引脚,使得这种接口可以驱动功耗更大(25-110w)或者处理能力更强大的AGP显卡。这种标准其实是专为高端图形工作站而设计的,完全兼容AGP 4x规范,使得AGP 4x的显卡也可以插在这种插槽中正常使用。AGP Pro在原有AGP插槽的两侧进行延伸,提供额外的电能。它是用来增强,而不是取代现有AGP插槽的功能。根据所能提供能量的不同,可以把AGP Pro细分为AGP Pro110和AGP Pro50。在某些高档台式机主板上也能见到AGP Pro插槽,例如华硕的许多主板。 AGP 3.0(AGP8X) 2000年8月,Intel推出AGP3.0规范,工作电压降到0.8V,并增加了8x模式,这样它的数据传输带宽达到了2133MB/sec,数据传输能力相对于AGP 4X成倍增长,能较好的满足当前显示设备的带宽需求。 AGP接口的模式传输方式 不同AGP接口的模式传输方式不同。1X模式的AGP,工作频率达到了PCI总线的两倍—66MHz,传输带宽理论上可达到266MB/s。AGP 2X工作频率同样为66MHz,但是它使用了正负沿(一个时钟周期的上升沿和下降沿)触发的工作方式,在这种触发方式中在一个时钟周期的上升沿和下降沿各传送一次数据,从而使得一个工作周期先后被触发两次,使传输带宽达到了加倍的目的,而这种触发信号的工作频率为133MHz,这样AGP 2X的传输带宽就达到了266MB/s×2(触发次数)=533MB/s的高度。AGP 4X仍使用了这种信号触发方式,只是利用两个触发信号在每个时钟周期的下降沿分别引起两次触发,从而达到了在一个时钟周期中触发4次的目的,这样在理论上它就可以达到266MB/s×2(单信号触发次数)×2(信号个数)=1066MB/s的带宽了。在AGP 8X规范中,这种触发模式仍然使用,只是触发信号的工作频率变成266MHz,两个信号触发点也变成了每个时钟周期的上升沿,单信号触发次数为4次,这样它在一个时钟周期所能传输的数据就从AGP4X的4倍变成了8倍,理论传输带宽将可达到266MB/s×4(单信号触发次数)×2(信号个数)=2133MB/s的高度了。 ![]() 目前常用的AGP接口为AGP4X、AGP PRO、AGP通用及AGP8X接口。需要说明的是由于AGP3.0显卡的额定电压为0.8—1.5V,因此不能把AGP8X的显卡插接到AGP1.0规格的插槽中。这就是说AGP8X规格与旧有的AGP1X/2X模式不兼容。而对于AGP4X系统,AGP8X显卡仍旧在其上工作,但仅会以AGP4X模式工作,无法发挥AGP8X的优势。 PCI Express是新一代的总线接口,而采用此类接口的显卡产品,已经在2004年正式面世。早在2001年的春季“英特尔开发者论坛”上,英特尔公司就提出了要用新一代的技术取代PCI总线和多种芯片的内部连接,并称之为第三代I/O总线技术。随后在2001年底,包括Intel、AMD、DELL、IBM在内的20多家业界主导公司开始起草新技术的规范,并在2002年完成,对其正式命名为PCI Express。 ![]() PCI Express采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI Express的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。 PCI Express的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16(X2模式将用于内部接口而非插槽模式)。较短的PCI Express卡可以插入较长的PCI Express插槽中使用。PCI Express接口能够支持热拔插,这也是个不小的飞跃。PCI Express卡支持的三种电压分别为+3.3V、3.3Vaux以及+12V。用于取代AGP接口的PCI Express接口位宽为X16,将能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽,远远超过AGP 8X的2.1GB/s的带宽。 PCI Express规格从1条通道连接到32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。例如,PCI Express X1规格支持双向数据传输,每向数据传输带宽250MB/s,PCI Express X1已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。 因此,必须采用PCI Express X16,即16条点对点数据传输通道连接来取代传统的AGP总线。PCI Express X16也支持双向数据传输,每向数据传输带宽高达4GB/s,双向数据传输带宽有8GB/s之多,相比之下,目前广泛采用的AGP 8X数据传输只提供2.1GB/s的数据传输带宽。 尽管PCI Express技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI Express X1和PCI Express X16将成为PCI Express主流规格,同时芯片组厂商将在南桥芯片当中添加对PCI Express X1的支持,在北桥芯片当中添加对PCI Express X16的支持。除去提供极高数据传输带宽之外,PCI Express因为采用串行数据包方式传递数据,所以PCI Express接口每个针脚可以获得比传统I/O标准更多的带宽,这样就可以降低PCI Express设备生产成本和体积。另外,PCI Express也支持高阶电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。 |
0 |