技术词汇说明及软件下载
1、显卡

又被称为:视频卡、视频适配器、图形卡、图形适配器和显示适配器等等。它是主机与显示器之间连接的“桥梁”,作用是控制电脑的图形输出,负责将CPU 送来的的影象数据处理成显示器认识的格式,再送到显示器形成图象。显卡主要由显示芯片GPU(即图形处理芯片Graphic Processing Unit)、显存、数模转换器(RAMDAC)、VGA BIOS、各方面接口等几部分组成。下面会分别介绍到各部分。

2、显示芯片

图形处理芯片,也就是我们常说的GPU(Graphic Processing Unit即图形处理单元)。它是显卡的“大脑”,负责了绝大部分的计算工作,在整个显卡中,GPU负责处理由电脑发来的数据,将产生的结果显示在显示 器上。显卡所支持的各种3D特效由GPU的性能决定,GPU也就相当于CPU在电脑中的作用,一块显卡采用何种显示芯片便大致决定了该显卡的档次和基本性 能,它同时也是2D显示卡和3D显示卡区分的依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,这称为“软加速”。而3D显示芯片是将 三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。现在市场上的显卡大多采用nVIDIA和ATI两家公司的图形处理芯片,诸 如:NVIDIA FX5200、FX5700、RADEON 9800等等就是显卡图形处理芯片的名称。不过,虽然显示芯片决定了显卡的档次和基本性能,但只有配备合适的显存才能使显卡性能完全发挥出来。

3、显存
全称显示内存,与主板上的内存功能基本一样,显存分为帧缓存和材质缓存,通常它是用来存储显示芯片(组)所处理的数据信息及材质信息。当显示芯片处理 完数据后会将数据输送到显存中,然后RAMDAC从显存中读取数据,并将数字信号转换为模拟信号,然后输出到显示屏。所以显存的速度以及带宽直接影响着一 块显卡的速度,即使你的显卡图形芯片很强劲,但是如果板载显存达不到要求,无法将处理过的数据即时传送。
(1)显存品牌
目前市场上,显卡上采用得更多的是SAMSUNG(三星)和Hynix(英力士)的显存,其他还有EtronTech(钰创),Infineon(英 飞凌),Micron(美光)、EliteMT/ESMT(台湾晶豪)等品牌,这些都是比较有实力的厂商,品质方面有保证。
(2)显存类型
目前被广泛使用的显存就只有SDRAM和DDR SDRAM。而且SDRAM基本被淘汰了,主流都是采用DDR SDRAM。
DDR SDRAM:DDR是Double Data Rate是缩写,它是现有的SDRAM的一种进化。DDR在时钟周期的上升沿和下降沿都能传输数据,而SDRAM则只可在上升沿传输数据,所以DDR的带 宽是SDRAM的两倍,因此理论上DDR比SDRAM的数据传输率也快一倍。在显存速度相同的情况下,如果SDRAM的频率是166MHz,则DDR的频 率是333MHz。现在DDR已经发展到DDRII,DDRIII,甚至到DDR5。
(3)显存封装方式
显存封装形式主要有TSOP(Thin Small Out-Line Package,薄型小尺寸封装)、QFP(Quad Flat Package,小型方块平面封装)和MicroBGA(Micro Ball Grid Array,微型球闸阵列封装)三种。目前的主流显卡基本上是用TSOP和mBGA封装,其中又以TSOP封装居多.
TSOP封装方式:TSOP的全名为“Thin Small Out-Line Package”,即“薄型小尺寸封装”,它在封装芯片的周围做出引脚,这种封装,寄生参数减小,适合高频应用,操作方便,可靠性较高,是一种比较成熟的 封装技术,也是目前市面常见的。
MicroBGA封装方式:又名为144Pin FBGA、144-BALL FBGA(Fine-pitch Ball Grid Array)封装技术,与TSOP不同,它的引脚并非裸露在外的,所以看不到这种显存都看不到引脚。这个封装的内存芯片颗粒的实际占用面积比较小。这种封 装技术的优势在于:会带来更好的散热及超频性能。因此内行人一看到这种封装的显存就基本上可以估计到这款显卡有多大的超频潜力。这是因为采用这种封装方式 显存的PIN脚都在芯片下部,电连接短,电气性能好,也不易受干扰。目前多数内存、显存颗粒都是使用这种封装方式!
(4)显存速度
显存的速度以ns(纳秒)为计算单位,现在常见的显存多在6ns?2ns之间,数字越小说明显存的速度越快,其对应的理论工作频率可以通过公式:工作 频率(MHz)=1000/显存速度(如果是DDR显存,工作频率(MHz)=1000/显存速度X2)。例如5ns的显存,工作频率为1000 /5=200MHz,如果DDR规格的话,那它的频率为200X2=400MHz。现在显卡主要都是使用DDR规格的显存了。
(5)显存带宽
显存带宽指的是一次可以读入的数据量,即表示显存与显示芯片之间交换数据的速度。带宽越大,显存与显示芯片之间的"通路"就越宽,数据"跑"得就更为 顺畅,不会造成堵塞。显存带宽可以由下面这个公式计算:显存频率×显存位宽/8(除以8是因为每8个bit等于一个Byte)。这里说的显存位宽是指显存 颗粒与外部进行数据交换的接口位宽,指的是在一个时钟周期之内能传送的bit数,从上面的计算式可以知道,显存位宽是决定显存带宽的重要因素,与显卡性能 息息相关。我们经常说的某个显卡是64MB128bit的规格,其中128bit就是说该显卡的显存位宽了。
4、RAMDAC

数模转换器.它的作用是将显存中的数字信号转换为能够用于显示的模拟信号,RAMDAC的速度对在显示器上面看到的的图象有很大的影响。这主要因为图 象的刷新率依懒于显示器所接收到的模拟信息,而这些模拟信息正是由RAMDAC提供的。RAMDAC转换速率决定了刷新率的高低。不过现在大部分显卡的 RAMDAC都集成在主芯片里面了,比较少看到的RAMDAC芯片。

5、显卡BIOS

也就是VGA BIOS了,跟主板BIOS差不多,每张显卡都会有一个BIOS。显卡上面通常有一块小的存储器芯片来存放显示芯片与驱动程序之间的控制程序,另外还存放 有显卡的型号、规格、生产厂商、出厂是等信息。显卡的BIOS跟显卡超频有着直接的关系。

6、输出接口

显卡处理好的图象要显示在显示设备上面,那就离不开显卡的输出接口,现在常见的主要有:VGA接口、DVI接口、S端子、HDMI这几种输出接口。

(1)VGA(Video Graphics Array 视频图形阵列)接口,也就是D-Sub15接口,作用是将转换好的模拟信号输出到CRT或者LCD显示器中。现在几乎每款显卡都具备有标准的VGA接口, 因为目前国内的显示器,包括LCD,大都采用VGA接口作为标准输入方式。标准的VGA接口采用非对称分布的15pin连接方式,其工作原理是将显存内以 数字格式存储的图象信号在RAMDAC里经过模拟调制成模拟高频信号,然后在输出到显示器成像。它的优点有无串扰、无电路合成分离损耗等。(2)DVI(Digital Visual Interface 数字视频接口)接口,视频信号无需转换,信号无衰减或失真,显示效果提升显著,将时候VGA接口的替代者。VGA是基于模拟信号传输的工作方式,期间经历 的数/模转换过程和模拟传输过程必将带来一定程度的信号损失,而DVI接口是一种完全的数字视频接口,它可以将显卡产生的数字信号原封不动地传输给显示 器,从而避免了在传输过程中信号的损失。DVI接口可以分为两种:仅支持数字信号的DVI-D接口和同时支持数字与模拟信号的DVI-I接口。不过由于成 本问题和VGA的普及程度,目前的DVI接口还不能全面取代VGA接口。(3)S-Video(S端子,Separate Video),S端子也叫二分量视频接口,一般采用五线接头,它是用来将亮度和色度分离输出的设备,主要功能是为了克服视频节目复合输出时的亮度跟色度的 互相干扰。S端子的亮度和色度分离输出可以提高画面质量,可以将电脑屏幕上显示的内容非常清晰地输出到投影仪之类的显示设备上。(4)HDMI(清晰度多媒体接口)是业界支持的不压缩全数字的音频/ 视频接口。HDMI 通过在一条线缆中传输清晰、全数字的音频和视频内容,极大简化了布线,为消费者提供好的家庭影院体验。HDMI在单线缆中提供任何音频/ 视频源(如机顶盒、DVD播放机或 A/V 接收器)与音频和/ 或视频监视器(如数字电视DTV)之间的接口。
HDMI 支持单线缆上的标准、增强的或清晰度视频和多声道数字音频。它传输所有 ATSC HDTV 标准并支持 8 频道、192kHz、不压缩的数字音频和现有的压缩格式(例如 Dolby Digital 和 DTS),HDMI 1.3 还新增了对新型无损数字音频格式 Dolby® TrueHD 和 DTS-HD Master Audio™ 的支持,空余带宽用于未来增强和需求。
7、PCI Express

PCI Express(以下简称PCI-E)采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连 接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个频率,达到PCI所不能提供的高带宽。相对于传统PCI总线在单一时间周期内只能实 现单向传输,PCI-E的双单工连接能提供更好的传输速率和质量,它们之间的差异跟半双工和全双工类似。
PCI-E的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16,而X2模式将用于内部接口而非插槽模式。PCI-E规格从1条通道连接到 32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。此外,较短的PCI-E卡可以插入较长的PCI-E插槽中使 用,PCI-E接口还能够支持热拔插,这也是个不小的飞跃。PCI-E X1250MB/秒传输速度已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。 因此,用于取代AGP接口的PCI-E接口位宽为X16,能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽,远远 超过AGP 8X的2.1GB/s的带宽。
尽管PCI-E技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI-E X1和PCI-E X16已成为PCI-E主流规格,同时很多芯片组厂商在南桥芯片当中添加对PCI-E X1的支持,在北桥芯片当中添加对PCI-E X16的支持。除去提供数据传输带宽之外,PCI-E因为采用串行数据包方式传递数据,所以PCI-E接口每个针脚可以获得比传统I/O标准更多的带 宽,这样就可以降低PCI-E设备生产成本和体积。另外,PCI-E也支持电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。
在兼容性方面,PCI-E在软件层面上兼容目前的PCI技术和设备,支持PCI设备和内存模组的初始化,也就是说过去的驱动程序、操作系统无需推倒重来, 就可以支持PCI-E设备。目前PCI-E已经成为显卡的接口的主流,不过早期有些芯片组虽然提供了PCI-E作为显卡接口,但是其速度是4X的,而不是 16X的,例如VIA PT880 Pro和VIA PT880 Ultra。

8、渲染管线

渲染管线也称为渲染流水线,是显示芯片内部处理图形信号相互并行处理单元。在某种程度上可以把渲染管线比喻为工厂里面常见的各种生产流水线,工厂里的生产流水线是为了提升产品的生产能力和效率,而渲染管线则是提高显卡的工作能力和效率。
渲染管线的数量一般是以 像素渲染流水线的数量×每管线的纹理单元数量 来表示。例如,GeForce 6800Ultra的渲染管线是16×1,就表示其具有16条像素渲染流水线,每管线具有1个纹理单元;GeForce4 MX440的渲染管线是2×2,就表示其具有2条像素渲染流水线,每管线具有2个纹理单元等等,其余表示方式以此类推。
渲染管线的数量是决定显示芯片性能和档次的重要的参数之一,在相同的显卡核心频率下,更多的渲染管线也就意味着更大的像素填充率和纹理填充率,从显卡的 渲染管线数量上可以大致判断出显卡的性能高低档次。但显卡性能并不仅仅只是取决于渲染管线的数量,同时还取决于显示核心架构、渲染管线的的执行效率、顶点 着色单元的数量以及显卡的核心频率和显存频率等等方面。一般来说在相同的显示核心架构下,渲染管线越多也就意味着性能越高,例如16×1架构的 GeForce 6800GT其性能要强于12×1架构的GeForce 6800,就象工厂里的采用相同技术的2条生产流水线的生产能力和效率要强于1条生产流水线那样;而在不同的显示核心架构下,渲染管线的数量多就并不意味 着性能更好,例如4×2架构的GeForce2 GTS其性能就不如2×2架构的GeForce4 MX440,就象工厂里的采用了先进技术的1条流水线的生产能力和效率反而还要强于只采用了老技术的2条生产流水线那样。

9、顶点着色单元

顶点着色单元是显示芯片内部用来处理顶点(Vertex)信息并完成着色工作的并行处理单元。顶点着色单元决定了显卡的三角形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数。
顶点(Vertex)是图形学中的基本元素,在三维空间中,每个顶点都拥有自己的坐标和颜色值等参数,三个顶点可以构成成一个三角形,而显卡所生成的立体画面则是由数量繁多的三角形构成的,而三角形数量的多少就决定了画面质量的高低,画面越真实越精美,就越需要数量更多的三角形来构成。顶点着色 单元就是处理着些信息然后再送给像素渲染单元完成后的贴图工作,再输出到显示器就成为我们所看到的3D画面。而显卡的顶点处理能力不足,就会导致要 么降低画质,要么降低速度。
在相同的显示核心下,顶点着色单元的数量就决定了显卡的性能高低,数量越多也就意味着性能越高,例如具有6个顶点着色单元的GeForce 6800GT就要比只具有5个顶点着色单元的GeForce 6800性能:但在不同的显示核心架构下顶点着色单元的数量多则并不一定就意味着性能越好,这还要取决于顶点着色单元的效率以及显卡的其它参数,例如具 有4个顶点着色单元的Radeon 9800Pro其性能还不如只具有3个顶点着色单元的GeForce 6600GT。

10、像素填充率

像素填充率是指图形处理单元在每秒内所渲染的像素数量,单位是MPixel/S(每秒百万像素),或者GPixel/S(每秒十亿像素),是用来度量 当前显卡的像素处理性能的常用指标。显卡的渲染管线是显示核心的重要组成部分,是显示核心中负责给图形配上颜色的一组专门通道。渲染管线越多,每组管线 工作的频率(一般就是显卡的核心频率)越好,那么所绘出的显卡的填充率就越好,显卡的性能就越,因此可以从显卡的象素填充率上大致判断出显卡的性能。
一般情况下,显卡的像素填充率等于显示核心的渲染管线数量乘以核心频率。这里的像素填充率显然是理论较大值,实际效果还要受管线执行效率的影响。另外 显卡的性能还要受核心架构、顶点数量、显存带宽的影响。例如较高的填充率渲染像素需要消耗大量的存储带宽来支持,因此如果显卡的显存带宽跟不上,显卡的像 素填充率也会受影响。不过对大多数显卡而言,设计时总会让像素填充率、顶点生成率、显存带宽等几个显卡的重要指标大致匹配,因此从像素填充率可以大致反映 出显卡的性能。

11、API

API是Application Programming Interface的缩写,是应用程序接口的意思,而3D API则是指显卡与应用程序直接的接口。3D API能让编程人员所设计的3D软件只要调用其API内的程序,从而让API自动和硬件的驱动程序沟通,启动3D芯片内强大的3D图形处理功能,从而大幅 度地提高了3D程序的设计效率。
如果没有3D API在开发程序时,程序员必须要了解全部的显卡特性,才能编写出与显卡完全匹配的程序,发挥出全部的显卡性能。而有了3D API这个显卡与软件直接的接口,程序员只需要编写符合接口的程序代码,就可以充分发挥显卡的不必再去了解硬件的具体性能和参数,这样就大大简化了程序开 发的效率。
同样,显示芯片厂商根据标准来设计自己的硬件产品,以达到在API调用硬件资源时优化,获得更好的性能。有了3D API,便可实现不同厂家的硬件、软件大范围兼容。比如在体现3D API的游戏方面,游戏设计人员设计时,不必去考虑具体某款显卡的特性,而只是按照3D API的接口标准来开发游戏,当游戏运行时则直接通过3D API来调用显卡的硬件资源。
目前个人电脑中主要应用的3D API有DirectX和OpenGL。DirectX目前已经成为游戏的主流,市售的绝大部分主流游戏均基于DirectX开发,例如《帝国时代3》、 《孤岛惊魂》、《使命召唤2》、《Half Life2》等流行的游戏。而OpenGL目前则主要应用于专业的图形工作站,在游戏方面历史上也曾经和DirectX分庭抗礼,产生了一大批的 游戏,例如《Quake3》、《Half Life》、《荣誉勋章》的前几部、《反恐精英》等,目前在DirectX的步步进逼之下,采用OpenGL的游戏已经越来越少,但也不乏经典大作,例如 基于OpenGL的《DOOM3》以及采用DOOM3引擎的《Quake4》等等,无论过去还是现在,OpenGL在游戏方面的主要代表都是著名的id Software。

12、DirectX

DirectX并不是一个单纯的图形API,它是由微软公司开发的用途广泛的API,它包含有Direct Graphics(Direct 3D+Direct Draw)、Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects等多个组件,它提供了一整套的多媒体接口方案。只是其在3D图形方面的表现,让它的其它方面显得暗淡无光。DirectX开发之初是为 了弥补Windows 3.1系统对图形、声音处理能力的不足,而今已发展成为对整个多媒体系统的各个方面都有决定性影响的接口。
DirectX 5.0
微软公司并没有推出DirectX 4.0,而是直接推出了DirectX 5.0。此版本对Direct3D做出了很大的改动,加入了雾化效果、Alpha混合等3D特效,使3D游戏中的空间感和真实感得以增强,还加入了S3的 纹理压缩技术。同时,DirectX 5.0在其它各组件方面也有加强,在声卡、游戏控制器方面均做了改进,支持了更多的设备。因此,DirectX发展到DirectX 5.0才真正走向了成熟。此时的DirectX性能完全不逊色于其它3D API,而且大有后来居上之势。
DirectX 6.0
DirectX 6.0推出时,其竞争对手之一Glide,已逐步走向了没落,而DirectX则得到了大多数厂商的认可。DirectX 6.0中加入了双线性过滤、三线性过滤等优化3D图像质量的技术,游戏中的3D技术逐渐走入成熟阶段。
DirectX 7.0
DirectX 7.0的特色就是支持T&L,中文名称是“坐标转换和光源”。3D游戏中的任何一个物体都有一个坐标,当此物体运动时,它的坐标发生变化,这 指的就是坐标转换;3D游戏中除了场景+物体还需要灯光,没有灯光就没有3D物体的表现,无论是实时3D游戏还是3D影像渲染,加上灯光的3D渲染是消耗资源的。虽然OpenGL中已有相关技术,但此前从未在民用级硬件中出现。在T&L问世之前,位置转换和灯光都需要CPU来计算,CPU速度越 快,游戏表现越流畅。使用了T&L功能后,这两种效果的计算用显示卡的GPU来计算,这样就可以把CPU从繁忙的劳动中解脱出来。换句话说,拥有 T&L显示卡,使用DirectX 7.0,即使没有快速的CPU,同样能流畅的跑3D游戏。
DirectX 8.0
DirectX 8.0的推出引发了一场显卡革命,它引入了“像素渲染”概念,同时具备像素渲染引擎(Pixel Shader)与顶点渲染引擎(Vertex Shader),反映在特效上就是动态光影效果。同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大,它使GPU真正成为了可 编程的处理器。这意味着程序员可通过它们实现3D场景构建的难度大大降低。通过VS和PS的渲染,可以很容易的宁造出真实的水面动态波纹光影效果。此时 DirectX的权威地位终于建成。
DirectX 9.0
2002年底,微软发布DirectX9.0。DirectX 9中PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的VertexShader(顶点着色引擎)编程将比以前复杂得多, 新的VertexShader标准增加了流程控制,更多的常量,每个程序的着色指令增加到了1024条。
PS 2.0具备完全可编程的架构,能对纹理效果即时演算、动态纹理贴图,还不占用显存,理论上对材质贴图的分辨率的精度提高无限多;另外PS1.4只能支持 28个硬件指令,同时操作6个材质,而PS2.0却可以支持160个硬件指令,同时操作16个材质数量,新的高精度浮点数据规格可以使用多重纹理贴图,可 操作的指令数可以任意长,电影级别的显示效果轻而易举的实现。
VS 2.0通过增加Vertex程序的灵活性,显著的提高了老版本(DirectX8)的VS性能,新的控制指令,可以用通用的程序代替以前专用的单独着色程 序,效率提高许多倍;增加循环操作指令,减少工作时间,提高处理效率;扩展着色指令个数,从128个提升到256个。
增加对浮点数据的处理功能,以前只能对整数进行处理,这样提高渲染精度,然后处理的色彩格式达到电影级别。突破了以前限制PC图形图象质量在数学上的精 度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果,让程序员编程更容易。
DirectX 9.0c
与过去的DirectX 9.0b和Shader Model 2.0相比较,DirectX 9.0c更大的改进,便是引入了对Shader Model 3.0(包括Pixel Shader 3.0 和Vertex Shader 3.0两个着色语言规范)的全面支持。举例来说,DirectX 9.0b的Shader Model 2.0所支持的Vertex Shader指令数仅为256个,Pixel Shader指令数更是只有96个。而在Shader Model 3.0中,Vertex Shader和Pixel Shader的指令数都大幅上升至65535个,全新的动态程序流控制、 位移贴图、多渲染目标(MRT)、次表面散射 Subsurface scattering、柔和阴影 Soft shadows、环境和地面阴影 Environmental and ground shadows、全局照明 (Global illumination)等新技术特性,使得GeForce 6、GeForce7系列以及Radeon X1000系列立刻为新一代游戏以及具备无比真实感、幻想般的复杂的数字世界和逼真的角色在影视品质的环境中活动提供强大动力。
因此DirectX 9.0c和Shader Model 3.0标准的推出,可以说是DirectX发展历程中的重要转折点。在DirectX 9.0c中,Shader Model 3.0除了取消指令数限制和加入位移贴图等新特性之外,更多的特性都是在解决游戏的执行效率和品质上下功夫,Shader Model 3.0诞生之后,人们对待游戏的态度也开始从过去单纯地追求速度,转变到游戏画质和运行速度两者兼顾。因此Shader Model 3.0对游戏产业的影响可谓深远.
DirectX 10.0
DirectX 10的图形流水线体系中,较大的结构性变化就是在几何处理阶段增加了几何渲染单元(Geometry Shader)。几何渲染单元被附加在顶点渲染单元之后,但它并不像顶点渲染单元那样输出一个个顶点,而是以图元作为处理对象。图元在层次上比顶点高一 级,它由一个或多个顶点构成。由单个顶点组成的图元被称为“点”,由两个顶点组成的图元被称为“线”,由三个顶点组成的图元被称为“三角形”。几何渲染单 元支持点、线、三角形、带邻接点的线、带邻接点的三角形等多种图元类型,它一次可处理六个顶点。借助丰富的图元类型支持,几何渲染单元可以让GPU提 供更精细的模型细节。
几何渲染单元赋予GPU自行创造新几何物体、为场景添加内容的神奇能力。灵活的处理能力使GPU更加通用化,以往很多必须倚靠CPU才能完成的工作,现在 完全可交由GPU处理。如此一来,CPU就有更多时间处理人工智能、寻址等工作。更令人惊喜的是,几何渲染单元还让物理运算的加入变得更简 单,DirectX 10可创建具备物理特性的盒子、模拟刚性物体,物理运算有望在它的带领下逐渐走向普及。可以预见,借助几何渲染单元这一武器,显卡性能将产生质的飞跃,我 们也将体验到速度更流畅、画面更精美、情节更细致的游戏。
改进的API和驱动功效
我们知道,每一个游戏角色、武器和景物在3D程序中都是一个Object(对象),而每一帧游戏画面就可能出现数百个Object。在显卡工作时,每一个 Object都要从应用程序传输到API接口,然后通过显卡驱动程序到达显卡。在现有的DirectX体系中,任何一个Object进行操作或者渲染,都 会导致系统资源的额外消耗,游戏的Object越多,所耗费的传递时间就越长,造成的额外消耗也就越多。据统计,现有的DirectX 9图形芯片在工作时,只有60%的性能用于运算3D程序,其余40%的运算能力被白白浪费了!
为了改变这一现状,DirectX 10在渲染程序中采用了动态索引功能,Object被驱动程序自动加载,数据可以分类并连续输入,这样一来,单次传输的数据量就增加了,从而大大降低了额 外耗费的时间。通过引入新的API及驱动程序,DirectX 10将图形芯片的执行效能提升至80%。在不增加显卡硬件成本的前提下,显卡性能得到了大幅提升。
并行引擎支持技术
为了提升多块显卡协作的工作效率,微软在DirectX 10中提出了“Parallel Engine Support(并行引擎支持)”的概念,它可以预先把两个GPU需要的数据分别传输到两块对应的GPU当中,帧渲染将完全由驱动控制和调配,两块显卡的 工作强度可以获得很好的平衡。而在目前主从卡的运作模式中,主卡要对从卡框架、渲染数量进行判定,而引入并行引擎支持技术后,主从卡的概念将消失,两块甚 至多块显卡的协作威力将充分体现。
统一渲染架构
DirectX 10较大的革新就是统一渲染架构(Unified Shader Architecture)。目前各类图形硬件和API均采用分离渲染架构,即顶点渲染和像素渲染各自进行,前者的任务是构建出含三维坐标信息的多边 形顶点,后者则是将这些顶点从三维转换为二维,这样便可以通过视觉欺骗在屏幕上显示出“三维”的场景。与此对应,GPU中也有专门的顶点渲染单元和像素渲 染单元来分别执行这两项工作(由于工作量不同,这两种渲染单元的数量不相等,顶点渲染单元通常只有像素渲染单元的1/3~1/2)。在过去几年中,这种分 离式设计对计算机图形领域的发展做出了一定的贡献。
不过,微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,软件开发人员在编写代码时必须考虑这个比例,这就大 大限制了开发人员自由发挥的空间。另外,不同的图形游戏或软件对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。为此,微软在 DirectX 10中提出了统一渲染架构的思想:在相同物理类型的渲染单元上执行不同类型的渲染程序。换句话说,只用一种渲染单元,让它既能完成顶点渲染,也能完成像素 渲染,甚至还能实现几何渲染。这样一来,渲染单元可以得到大程度的利用,减少了资源闲置的情形。目前,Xbox 360的显示芯片Xenos就采用了统一渲染架构,该芯片一共有48个渲染单元,它们可全部用于顶点渲染或像素渲染,没有固定分配比例。此外,ATI也打 算在新一代的R600芯片中采用统一渲染架构。
当然,统一渲染架构也并非完美无瑕。相对顶点渲染来说,像素渲染将面临大规模使用纹理所带来的材质延迟,这是统一渲染架构急待解决的问题。不过有一点可以肯定,在微软的大力推动下,统一渲染架构是大势所趋。
适应Vista系统
除统一渲染架构外,DirectX 10的另一大特色就是与Windows Vista紧密结合,Vista系统将调用GPU资源来渲染Aero Glass 3D界面,这样图形API就与操作系统核心高度整合在一起。举个例子,当我们点击应用程序时,CPU将立刻收到驱动程序的指令,而软件界面渲染指令则通过 DirectX 10直接传送给GPU,这样,Vista就能与CPU和GPU同时沟通,让3D界面渲染工作变得更好。
相比之下,在DirectX 9环境中,Vista(软件)界面的渲染工作就要“迟钝”一些了:用户点击运行某个软件,Vista将相应的指令发送给CPU,要求CPU进行后续处 理;CPU接到运行指令的同时向GPU发出请求,要求GPU在屏幕上渲染出界面。GPU(支持DirectX 9)识别Vista界面渲染指令后完成相应的工作(注意:DirectX 8显卡无法完成渲染工作,必须让CPU通过软件模拟来实现,此时系统速度非常缓慢)。换句话说,在“DirectX 9显卡+Vista”的平台中,CPU还是核心,GPU必须在CPU的控制下工作,而Vista系统也必须通过CPU来调用GPU的资源。
DirectX9还有一个不足之处,那就是它只能进行单任务渲染,即无法同时完成两个场景的渲染工作(如无法在运行游戏的同时为软件渲染3D界面),应用 范围受到极大的限制。而DirectX 10则允许GPU同时渲染多个不相关的3D场景,工作效率大为提高。因此,尽管DirectX 9显卡大都能驱动Vista华丽的Aero Glass视觉模式,但很多方面受到了限制,只有DirectX 10显卡才是Vista的理想“伴侣”。
可惜,微软决定DirectX10不会“下嫁”WindowsXP,想体验DX10特效只能依赖Vista。
Shader Model 4.0
从DirectX 8开始,Shader Model(渲染单元模式)在DirectX体系中的地位就日趋重要,其版本和渲染单元的规格也成为了决定显卡性能高低的关键因素。随着DirectX 10时代的到来,Shader Model也升级到了4.0版本。与眼下如日中天的Shader Model 3.0(以下简称SM 3.0)相比,Shader Model 4.0(以下简称SM 4.0)有哪些可喜的变化?
首先,SM4.0中的指令长度被提升到大于64K(即64×1024)的水平,这是SM 3.0规格(渲染指令长度允许大于512)的128倍。显然,SM 4.0在为渲染出电影级别的游戏画面做准备。由于渲染指令长度大幅提升,SM 4.0中相应的寄存器规格也有所增强,如Constant寄存器采用16×4096阵列、tmp寄存器则有4096个、input寄存器采用16/32规 格等,上述指标都比以前的DirectX有明显的改进。其次,SM 4.0在纹理数量方面也有提升。DirectX 10允许程序员在渲染物体时使用128个纹理,而DirectX 9只提供4/16规格,更多的纹理意味着物体表面精度更接近真实,游戏开发者拥有更广泛的选择。
从上述情况不难看出,DirectX 10在性能方面的提升是巨大的,它将进一步解放CPU的资源。当然,我们也必须看到,DirectX 10对硬件(尤其是显卡)的要求也更为苛刻,GPU在设计上也将更加复杂。
DirectX 10.1
正如以前的DX版本一样,DX10.1也是DX10的超集,因此它将支持DirectX 10的所有功能,同时它将支持更多的功能,提供更好性能。
改善的shader资源存取功能
DX10.1的一个主要提高是改善的shader资源存取功能,在多样本AA时,在读取样本时有更好的控制能力。除此之外,DX10.1还将可以创建定制的下行采样滤波器。
DX10.1还将有更新的浮点混合功能,对于渲染目标更有针对性,对于渲染目标混合将有新的格式,渲染目标可以实现各自混合。阴影功能一直是游戏的重要特效,Direct3D 10.1 的阴影滤波功能也将有所提高,从而可望进一步提高画质。
支持多核系统有更好的性能。
在性能方面,DirectX 10.1将支持多核系统有更好的性能。而在渲染,反射和散射时,Direct3D 10.1将减少对API的调用次数,从而将获得不错的性能提升。
其他方面:
其他方面,DX10.1的提高也不少,包括32bit浮点滤波,可以提升渲染,改善HDR渲染的画质。完全的抗锯齿应用程序控制也将是DX10.1 的亮点,应用程序将可以控制多重采样和超级采样的使用,并选择在特定场景出现的采样模板。DX10.1将至少需要单像素四采样。
DX10.1还将引入更新的驱动模型,WDDM 2.1。与DX10的WDDM2.0相比,2.1有一些显著的提高。
首先是更多的内容转换功能,WDDM2.0支持处理一个命令或三角形后进行内容转换,而WDDM2.1则可以让内容转换即时进行。由于GPU同时要并行处 理多个线程,因此内容转换的即时性不仅可以保证转换质量,还可以提升GPU效率,减少等待时间。另外,由于WDDM 2.1支持基于过程的虚拟内存分配,处理GPU和驱动页面错误的方式也更为成熟。
DX11
在微软发布的Windows 7 Beta版本中,一些已经安装使用的用户的发现了DirectX 11已经包含其中了。DirectX 11作为3D图形接口,不仅支持未来的DX11硬件,还向下兼容当前的DirectX 10和10.1硬件。DirectX 11增加了新的计算shader技术,可以允许GPU从事更多的通用计算工作,而不仅仅是3D运算,这可以鼓励开发人员更好地将GPU作为并行处理器使 用。
DX11新特性
1,Direct3D11渲染管线:
看上去,DirectX 11比DirectX 10更酷。DirectX 11的很多提升意味着更多的特性性能,而这些特性很少能在DX10中看到。DirectX 11和DirectX 10两者不同之处在于管线,可以说DirectX 11的渲染管线标志着绘图硬件以及软件功能革命性一步。DirectX 11加入了对Tessellation(镶嵌)的支持。Tessellation 由外壳着色器(Hull Shader)、镶嵌单元(tessellator)以及域着色器(Domain Shader)组成。同时还加入了计算着色器(Compute Shader),计算着色器与DX10中引入的GS不同,它并不是渲染管线的一部分,CS也是DirectX 11的重要改进之一,可以很大程度上协助开发人员弥补现实与虚幻之间的差别。
2,Tessellation镶嵌技术:
在此之前,关于DirectX 11的报道可谓铺天盖地。事实上,自R600发布时,DirectX 11这个字眼才开始越来越多的出现在网络上。尽管R6xx和R7xx硬件都具有tessellator单元,但是由于tessellator属于专有实现 方案(proprietary implementation),所以R6xx和R7xx硬件是不能直接兼容DirectX 11,更何况DirectX 11采用了极其精密老练的设置过程。事实上,DX11 tessellator单元本身不具备可编程性,DX11向tessellator (TS)输入或者从中输出的过程是通过两个传统的管线阶段完成的:Hull Shader (HS,外壳着色器)和Domain Shader (DS,域着色器)。
tessellator可以把一些较大的图元(primitive)分成很多更小的图元,并将这些小图元组合到一起,形成一种有序的几何图形,这种几何图 形更复杂,当然也更接近现实。这个过程也被称作细分曲面(Subdivision Surfaces)。举例来说,tessellator可以让一个立方体,通过处理看起来像是个球形,这样的话无疑节省了空间。此外,图形的质量、性能以 及可控性也达到了一定的促进。
Hull Shader负责接收一种由全四边形网格(quad mash)计算得到的图元数据(称作patches),并计算控制点(control points)的各种变换以及输入的图元各个边的镶嵌配置(tessellation factors),从而进行镶嵌。其中Control points用来定义想要得到的图形(比如说一个曲面或者其他)的图形参数。如果您经常用Photoshop绘图软件的话,不妨把Control points理解为PS的钢笔工具:用平面代替线的贝塞尔曲线功能。Hull Shader采用control points来决定如何安排tessellator处理数据,利用Tessellator生成大批量的新的图元,然后将这些图元以及控制点传送给 Domain Shader,Domain Shader将这些数据计算转换成3D处理中的顶点,然后GPU生成曲线以及多边形。
3,多线程的支持:
由于DX11所新增的特性甚至可以应用到DX10硬件中,所以我们对于DX11的快速应用都非常期待和乐观。DX11特性还包括很重要一点:支持多线程 (multi-threading)。没错,无论是DX10还是DX11,所有的色彩信息都将被光栅化并显示在电脑显示屏上(无论是通过线性的方式还 是同步的),但是DX11新增了对多线程技术的支持,得益于此,应用程序可以同步创造有用资源或者管理状态,并从所有专用线程中发送提取命令,这样做无疑 效率更快。DX11的这种多线程技术可能并不能加速绘图的子系统(特别是当我们的GPU资源受限时),但是这样却可以提升线程启动游戏的效率,并且可以利 用台式CPU核心数量不断提高所带来的潜力。
搭载8颗以及16颗逻辑核心的CPU系统已经离我们越来越近,现在游戏开发商们也该赶紧行动起来了,是时候解决有些游戏在双核心系统中运行缓慢的问题了。 但是开发一款能够很大程度上促进双核以上系统普及的游戏,所能够获得的利润以及需要的付出目前来讲还很不乐观,所以这一进程进展缓慢。对于大多数游戏而 言,充分利用四核心以及超过四核心的多线程优势还非常困难。尽管如此,通过多线程技术让简单的平行运算资源产生并显示出来,确实为采用平行运算代码的游戏 提供了走红的机会,这些游戏代码也可以以单线程编码的方式存在。由于DX11系统中并不是采用一条线程处理所有DX state change以及draw call(或者说大量同步线程共同负责某一任务)的方式,所以游戏开发者可以很自然的创造出线程处理某个场景的某一类或者某一群的客体对象,并为将来所有 客体对象或者实体为各自的线程处理打下基础(如果逻辑核心达到数百颗之后,这种线程处理方式对于提取硬件性能尤为重要)。
此外,DX10硬件也能够在运行DX11游戏时支持多线程,微软的这一计划相当令人兴奋,不过值得一提的是,AMD以及NVIDIA必须为各自的DX10 硬件开发出相应的驱动软件才能达到这一效果(因为如果没有相应的驱动支持的话,DX10硬件即便可以运行DX11游戏,对于玩家而言并不会看到真正应有的 效果)。当然了,我们希望NVIDIA,特别是AMD(因为他同时也是一家可以生产多核心CPU的厂商)能够对此感兴趣。而且,如果A/N这么做到话,无 疑会为游戏开发商们开发DX11游戏提供诱因,即便是A/N的DX11硬件还在襁褓之中。
4,计算着色器Compute Shader:
很多游戏开发者都对DX11新增的Compute Shader(通常简称为CS)特性啧啧称赞。CS的这一渲染管线能够进行更多的通用目的运算。我们既能在某种可以用来被执行数据的操作中看到这种特性,又能在某种可以用来操作的数据中看到这种特性。
在DirectX11以及CS的帮助下,游戏开发者便可以使用更为复杂的数据结构,并在这些数据结构中运行更多的通用算法。与其他完整的可编程的DX10和DX11管线阶段一样,CS将会共享一套物质资源(也就是着色处理器)。
相应的硬件需要在运行CS代码时更灵活些,这些CS代码必须支持随机读写、不规则列阵(而不是简单的流体或者固定大小的2D列阵)、多重输出、可根据程序 员的需要直接调用个别或多线程的应用、32k大小的共享寄存空间和线程组管理系统、原子数据指令集、同步建构以及可执行无序IO运算的能力。
与此同时,CS也将会随之失去一些特性。因为单个线程已经不再被看成是一个像素,所以线程将会丧失几何集合功能。这就意味着,尽管CS程序依然可以利用纹 理取样功能,但是自动三线LOD过滤计算将会丧失自动功能(LOD必须被指定)。此外,一些并不重要的普通数据的深度剔除(depth culling)、反锯齿(anti-aliasing)、alpha混合(alpha blending)以及其他运算不能在一个CS程序中被执行。
除了某些特殊应用的渲染,游戏开发者可能同时也希望做一些诸如IK(inverse kinematics,反向运动学)、物理、人工智能以及其他在GPU上执行的传统的CPU任务之类的运算。用CS算法在GPU上执行这些数据意味着这些 数据将会更快的被渲染,而且一些算法可能在GPU上的执行速度更快。如果某些总是产生同样结果的算法既可以出现在CPU上又可以出现在GPU上的话,诸如 AI以及物理等运算甚至可以同时在CPU和GPU上运行(这种运算实际上也可以代替带宽)。
即便是这些运算代码在相同的硬件(CPU或者GPU)上运行,PS以及CS代码的执行也是两个截然不同的过程,这主要取决于被执行的算法。有趣的是,暴露 数据以及柱状数据经常被用作HDR渲染。用PS代码计算这些数据的话就需要几条通道和几种技巧,以便提取所有像素,从而集中或者平分这些数据。尽管共享数 据将会或多或少的减缓处理速度,但是共享数据的方式要比在多通道中计算速度更快,而且这样可以使CS成为这些算法的理想处理阶段。
5,Shader Model 5.0:
DirectX 10的Shader Model 4.0(Shader Model以下简称“SM”)带来了整数运算和位运算的功能,DirectX 10.1的SM 4.1加入了对MSAA的直接采样和控制。而DirectX 11包含的SM 5.0,采用面向对象的概念,并且完全可以支持双精度数据。随着SM 5.0的发布,微软也会将HLSL语言更新至新版本,其中包含了诸如动态着色、动态分支和更多的对象等。总之,面向专业开发人员的SM 5.0,依旧是以降低编程的难度和复杂为目的。
为了解决Shader灵活性与弹性不足的问题,微软在HLSL5.0中带来解决之道。HLSL5.0提出shader子程序的概念,即允许程序员将各种小 段、简单或为个别需要而特制的shader程序链接起来,再根据实际需要动态调用,这样既能够提高硬件兼容性,同时减少“巨型shader”对寄存器空间 的占用,有效提升性能。
6,改进的纹理压缩:
精细的纹理对视觉效果的增益是显而易见的。目前的3D游戏越来越倾向于使用更大、更为精细的纹理,但是过大的纹理严重占用显存和带宽。由于目前纹理压缩仍 然不支持HDR图像,因此DirectX 11提出了更为出色的纹理压缩算法——BC6和BC7。BC6是为HDR图像设计的压缩算法,压缩比为6∶1;而BC7是为低动态范围纹理设计的压缩模 式,压缩比为3∶1。两种压缩算法在高压缩比下画质损失更少,效果更出色。
纹理质量对画面效果起着至关重要的作用。比如我们运行3D游戏时,画面内同样一个物体,观察距离较远时,纹理锐利而清晰,但当你拉近视角,近距离细看时, 纹理就非常粗糙了。更不用说在某些游戏中还有类似放大镜、望远镜等道具,启用这些道具后,只能看到更为粗糙和不真实的纹理。出现这种问题,一方面是纹理压 缩率损失严重,细腻的纹理压缩存放后,损失大量细节;另一方面是大纹理难以保证保证游戏运行速度和软件体积,如果在游戏中大面积采用分辨率达到 4000dpi的纹理贴图,那么显卡的运算资源和显存容量很快就会告罄。因此,DirectX 11快速和直观的改变就是再次改进了纹理的压缩算法,将纹理体积和纹理质量控制在一个更好的范围之内。

13、OpenCL

OpenCL(开放式计算语言)是一种针对异构计算的全新跨厂商标准,可以在CUDA架构上运行。通过运用OpenCL,开发商将能够利用 NVIDIA(英伟达)GPU的大规模并行计算能力来打造引人入胜的计算应用程序。随着OpenCL标准的日益成熟以及不断得到其它厂商处理器的支 持,NVIDIA(英伟达)将继续提供开发商打造GPU加速应用程序所需的驱动程序、工具以及培训资源。
微软的DirectCompute是一种全新GPU计算应用程序接口,运行于NVIDIA(英伟达)现有的CUDA架构之上(Windows VISTA和Windows 7)。当前的DX10 GPU以及未来DX11 GPU都能够支持DirectCompute。它让开发人员能够利用 NVIDIA(英伟达) GPU的大规模并行计算能力,创造出引人入胜的消费级和专业级计算应用程序。

14、CUDA

形处理器)的处理能力,能够大幅提升计算性能。
随着数百万支持CUDA的GPU已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用CUDA探测到更多更广的领域中,包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。

15、OpenGL

OpenGL是个专业的3D程序接口,是一个功能强大,调用方便的底层3D图形库。OpenGL的前身是SGI公司为其图形工作站开发的IRIS GL。IRIS GL是一个工业标准的3D图形软件接口,功能虽然强大但是移植性不好,于是SGI公司便在IRIS GL的基础上开发了OpenGL。OpenGL的英文全称是“Open Graphics Library”,顾名思义,OpenGL便是“开放的图形程序接口”。虽然DirectX在家用市场全面领先,但在专业绘图领域,OpenGL是不 能被取代的主角。
OpenGL是个与.硬件无关的软件接口,可以在不同的平台如Windows 95、Windows NT、Unix、Linux、MacOS、OS/2之间进行移植。因此,支持OpenGL的软件具有很好的移植性,可以获得非常广泛的应用。由于 OpenGL是3D图形的底层图形库,没有提供几何实体图元,不能直接用以描述场景。但是,通过一些转换程序,可以很方便地将AutoCAD、3DS等 3D图形设计软件制作的DFX和3DS模型文件转换成OpenGL的顶点数组。
在OpenGL的基础上还有Open Inventor、Cosmo3D、Optimizer等多种图形库,适应不同应用。其中,Open Inventor应用较为广泛。该软件是基于OpenGL面向对象的工具包,提供创建交互式3D图形应用程序的对象和方法,提供了预定义的对象和用于交互 的事件处理模块,创建和编辑3D场景的应用程序单元,有打印对象和用其它图形格式交换数据的能力。
OpenGL的发展一直处于一种较为迟缓的态势,每次版本的提高新增的技术很少,大多只是对其中部分做出修改和完善。1992年7月,SGI公司发布 了OpenGL的1.0版本,随后又与微软公司共同开发了Windows NT版本的OpenGL,从而使一些原来必须在图形工作站上运行的大型3D图形处理软件也可以在微机上运用。1995年OpenGL的1.1版本面 市,该版本比1.0的性能有许多提高,并加入了一些新的功能。其中包括改进打印机支持,在增强元文件中包含OpenGL的调用,顶点数组的新特性,提高顶点位置、法线、颜色、色彩指数、纹理坐标、多边形边缘标识的传输速度,引入了新的纹理特性等等。OpenGL 1.5又新增了“OpenGL Shading Language”,该语言是“OpenGL 2.0”的底核,用于着色对象、顶点着色以及片断着色技术的扩展功能。
OpenGL 2.0标准的主要制订者并非原来的SGI,而是逐渐在ARB中占据主动地位的3Dlabs。2.0版本首先要做的是与旧版本之间的完整兼容性,同时在顶点 与像素及内存管理上与DirectX共同合作以维持均势。OpenGL 2.0将由OpenGL 1.3的现有功能加上与之完全兼容的新功能所组成(如图一)。借此可以对在ARB停滞不前时代各家推出的各种纠缠不清的扩展指令集做一次彻底的精简。此 外,硬件可编程能力的实现也提供了一个更好的方法以整合现有的扩展指令。
目前,随着DirectX的不断发展和完善,OpenGL的优势逐渐丧失,至今虽然已有3Dlabs提倡开发的2.0版本面世,在其中加入了很多类似 于DirectX中可编程单元的设计,但厂商的用户的认知程度并不高,未来的OpenGL发展前景迷茫。

16、Fortran

Fortran是计算开发人员使用的一种主要编程语言。在众多领域中,它是编程语言,这些领域包括计算流体动力学(包括天气与海洋建模)、有限元分析、分子动力学以及量子化学。
许多流行的计算软件包都是用Fortran语言开发出来的,这些软件随着时间的推移不断得到增强。Fortran编译器让开发人员能够以其母语(Fortran语言)进行编程,从而能够重新编译这些代码,以利用全新的性能与架构特性。

17、Hybrid SLI

Hybrid SLI(混合动力)可在需要时发挥出强劲的图形性能,并在只进行日常计算时自动转到静音、低功耗运行模式。将任意一款支持NVIDIA智能SLI技术的 GPU(图形处理器)与任意一款支持NVIDIA智能SLI技术的主板(板载GPU)搭配使用即可实现终极控制。当运行要求的3D游戏和应用程序时可将 性能发挥到更高,当仅执行浏览网页、文字处理以及观看高清视频等日常计算任务时可自动降到板载GPU工作模式,从而降低噪音并延长电池续航时间。

18、NVIDIA

NVIDIA(英伟达)PhysX技术能够为游戏加入史无前例的逼真度。凭借PC中的NVIDIA(英伟达)GeForce(精视)GPU(图形处理 器),用户可以体验到动感十足的PhysX特效,其中包括剧烈的爆炸、可在外力下做出反应的碎片、逼真的水效果以及栩栩如生的人物。

19、NVIDIA SLI技术是什么

NVIDIA SLI技术是一项革命性平台创新技术,用户可在一块SLI认证主板上搭配使用多款图形解决方案,从而智能地扩展图形性能。
SLI技术如何工作
利用每个NVIDIA图形芯片(GPU)和MCP里的专有软件算法和专用稳定性逻辑电路,NVIDIA SLI技术可提供两倍于单一图形解决方案的性能。现现在一块SLI认证主板可以支持三颗GPU(图形处理器)同时运行,让你能够获得可达单颗GPU 2.8倍的性能。

20.以下为目前显卡支持的功能明细:

1.SLI问题,NVIDIA的卡目前有哪些是可以支持SLI的,可以支持几路?
支持双路或者三路SLI的卡有:GTX480 GTX470 GTX465 GTX285 GTX280 GTX275 GTX260 GTS250。只支持双路SLI的卡有:GTX460 9800GT 9600GT 9600GSO(512M) 9600GSO(384M) 9500GT。只支持三路SLI的卡有9800GTX+ 9800GTX。另外有两款卡为内部双路SLI,也就是Quad,如果用两块卡的话就等于四路SLI。
2.OPENGL支持列表明细如下:
支持OPENGL2.1的卡有:9400GT 9500GT 9600GSO(384M) 9600GSO(512M) 9600GT 9800GT 9800GTX 9800GTX+ 9800GTX2 GTX260 GTX280 GTX285 GTX295。
支持OPENGL3.0的卡有:GTS250 GTX275。
支持OPENGL3.1的卡有:GT210 GT220。
支持OPENGL3.2的卡有:GT240。
支持OPENGL4.0的卡有:GTX480 GTX470 GTX465 GTX460。
3. DirectX支持列表:
DX11,GTX480 GTX470 GTX465 GTX460。
DX10.1,GT210 GT220 GT240
其余其他型号均只支持到DX10。
4.HDMI标准
目前仅有GTX460能够支持HDMI的1.4标准,注意,分辨率能支持到4096X2160,具体格式如下:3840X2160 24HZ/25HZ/30HZ 4096X2160 24HZ。
其他显卡带有HDMI接口的均为1.3a标准,分辨率2560X1600,另外:VGA接口的分辨率为2048X1536。
5.数字供电好处:

  • 体积小,数字MOSFET、DRIVER CSP封装,数字排感体积小,PCB面板也可以更小。
  • 数字供电GPU峰值电压仅140mv,模拟供电GPU峰值电压达300mv。
  • 数字供电转换效率高,模拟供电通常转换效率在70-80%,数字供电转换效率在90%左右。
  • 数字供电电流更大,模拟供电每相通常极限为30A,数字供电每相极限可达30A。
  • 数字供电更耐高温,CSP封装MOSFET工作温度上限为200度,而模拟供电采用的MOSFET工作温度上限为100度左右。
  • 数字供电工作频率更高,数字供电MOSFET工作频率达800KHz,模拟供电常采用的电感频率仅300KHz。
  • 数字供电内阻更小,数字供电采用排感内阻要小于模拟供电常采用的电感。
21.软件下载:

1.nVidia nTune 5.05.54.00
nVidia nTune 2005软件可以对系统进行基准测试、管理芯片组和系统配置文件、解决性能问题、进行Windows动态超频、nVidia nTune 2005由nTune、NVIDIA Monitor、NVIDIA Performance和NVIDIA Profile Manager组件组成。
下载地址:http://www.onlinedown.net/soft/36884.htm
2.NVIDIA BIOS Editor(NiBiTor) v5.6
其主要本领有以下4项:1.支持自定义显卡的核心频率与显存频率。2.支持自定义显卡的核心电压。3.支持调整显卡的Timing值。4.支持温控功能, 可以给显示核心设置一个温度上限,如果当超频后显卡的核心温度高于此预设值时,将会自动关闭显示核心,以保护硬件不受损坏。
下载地址:http://www.crsky.com/soft/4811.html
3.NVFlash v5.91.01
NVFlash是一款用于NVIDIA显卡BIOS刷新的老牌工具,本次发布的为5.77版,支持AMD、Atmel、ST、Tenx、PMC、 SST、MX、WBond等厂商多款型号EEPROM芯片。NVFlash具体命令行操作格式如下:1、升级BIOS:nvflash --filename。2、保存BIOS文件:nvflash --save filename。3、对比显卡BIOS版本:nvflash --compare filename。4、升级TV数据:nvflash --tv filename。5、显示BIOS版本:nvflash --version filename。6、显示BIOS字节数:nvflash --display。7、开启写保护EEPROM:nvflash --protecton。8、关闭写保护功能:nvflash --protectoff。9、设置IEEE 1394标识:nvflash --guid。10、显卡适配器列表:nvflash –list
下载地址:http://www.crsky.com/soft/4674.html
4.NVFLASH 5.67 Windows版
NVIDIA显卡BIOS刷新程序(windows环境)
下载地址:http://driver.zol.com.cn/detail/19/184444.shtml
5.MagicPanel HD 3008Beta1
魔盘HD(Magic Panel HD)是一款为DIY发烧友打造的具有创新意义的软件,这是一个由影驰多年研发经验沉淀而成的智能软件。玩家可以通过魔盘HD友好而简单的界面恢复 BIOS、调控风扇转速、对显卡进行超频同时还可以根据用户显卡型号自动检测BIOS和驱动,让玩家有全新的使用体验。
下载地址:http://www.szgalaxy.com/zh-cn/magic.aspx?class=6
6.EVGA Precision v1.9.5
作为NVIDIA的重要合作伙伴,在国外EVGA一直以出优质而闻名,近期该公司又自行研发了显卡超频程序——EVGA Precision。和目前流行其他超频工具类似,EVGA Precision除了拥有核心以及Shader的调节监控能力,还提供了自带的测试模块,还可以将调节好的数据保存,以后直接在进入Windows时载 入。
下载地址:http://www.crsky.com/soft/14722.html
7.RivaTuner 2.24
Rivatuner是强而有力的显卡微调修正工具,适用于 98/98se/ME/2000/XP/2003/Vista操作系统,在大多数情况下这些改变并不能提升显卡的性能,但是它们能够提高图象显示质量和解决一些兼容性问题。
下载地址:http://www.onlinedown.net/soft/6463.htm
8.Fraps v3.0.3 Build 10808 汉化版
Fraps 是一款 游戏辅助 + 媒体录制 软件,用它可以轻松了解机器在运行游戏时的帧数,从而了解机器的性能!另外它还具备在游戏中的截屏和录像功能,可以方便的进行屏幕截图和视频捕捉,网上许多魔兽战况等游戏录像都是先用其录制然后压缩处理的。
此为汉化安装版,已集成 Fraps 视频解码器,无需预装原版。主流游戏建议选择30~60FPS作为录制帧率,必要时可开启游戏中的垂直同步选项以保持画面连续性。

Fraps v3.0.3 Build 10808 汉化版更新:
- 更正视频文件超过4GB时容易出现卡死/卡滞的Bug;
- 更正鼠标指针的显示Bug;
- 更正鼠标指针错位Bug;
- 更正录制1920x1200以上尺寸视频文件时崩溃的Bug;
- 更正在Windows2000中停止视频抓取后崩溃的Bug;
- 更正在部分DX10游戏中崩溃的Bug;
- 更正fraps.dll会引起Windows崩溃的Bug;
- 更正Explorer程序重启后丢失Fraps系统托盘图标的Bug;
- 更正frapsvid.dll以及frapsv64.dll会引起程序崩溃的Bug;
- 修正随系统启动时的问题;
- 更正录制《星际争霸》视频时游戏出现卡滞的Bug;
- 更正Fraps主程序CPU占有率Bug;
- 更正《植物大战僵尸》游戏中显示不正常的Bug;
- 更正在部分早期Direct Draw游戏中截取功能不正常的Bug。
注:此汉化版无需安装,只需运行下”绿化.bat”即可
下载地址:http://www.crsky.com/soft/7769.html
9.3DMark 06 1.2.0
3DMark是FutureMark公司出品的3D图形性能基准测试工具,具有悠久的历史,迄今已成为业界标准之一。出品的3DMark06可以衡量PC在下一代游戏中的3D性能、比较高的游戏硬件、展示惊人的实时3D画面。

3DMark06简介:3DMark06主要使用新一代游戏技术衡量DirectX 9级别的3D硬件。此前的3DMark都是随着新版DirectX和新一代硬件的发布而推出,在一定程度上限制了3DMark对硬件性能的充分挖掘。 现在,DirectX 9已经发布3年,该级别的硬件已经遍布高中低各个领域,因此3DMark06可以完全利用DirectX 9的特性。事实上,3DMark06所有测试都需要支持SM3.0的DirectX 9硬件,不过只支持SM2.x的硬件也可以运行大部分测试。

3DMark06要点:
● 两个HDR/SM3.0测试:需要DirectX 9级别硬件且支持SM3.0、16-bit浮点纹理和16-bit浮点混合;
● 两个SM2.0测试:需要DirectX 9级别硬件且完全支持SM2.0;
● 两个全新CPU测试:均支持多线程、多核心处理器,需要DirectX 9级别硬件且完全支持SM2.0;
● 纹理测试:集中考察显卡的关键性能;
● demo:演示实时3D画面,并附带原声音乐;
● 可根据需要进行多种不同范围的测试设置;
● 一个基于CPU测试的小游戏:使用游戏引擎的CPU测试场景。

通过使用3DMark06及其测试结果在线比较服务,用户可以获得:
● 3DMark得分:电脑3D性能的衡量标尺;
● SM2.0得分:电脑ShaderModel 2.0性能的衡量标尺;
● HDR/SM3.0得分:电脑HDR和ShaderModel 3.0性能的衡量标尺;
● CPU得分:电脑处理器性能的衡量标尺;
● 与全球各地的电脑进行性能比拼;
● 为用户硬件升级提供指导;
● 欣赏下一代实时3D画面。
下载地址:http://download.pchome.net/system/benchmark/detail-3684.html
10.DMark Vantage 1.0.2

3DMark Vantage是业界第一套专门基于微软DX10 API打造的综合性基准测试工具,并能全面发挥多路显卡、多核心处理器的优势,能在当前和未来一段时间内满足PC系统游戏性能测试需求。和PCMark Vantage一样,新3DMark也改变了命名方式,不再以年份做结尾,而是同样使用了一个意为“优势”的单词。不知道这是不是受了Windows Vista的启示,但很显然,苦心磨砺的3DMark Vantage必将带来全新的体验,掀起新一轮的处理器、显卡“拷问”之旅,并进一步巩固Futuremark在业界的领导地位。和3DMark05的 DX9专用性质类似,3DMark Vantage是专门为DX10显卡量身打造的,而且只能运行在Windows Vista SP1操作系统下。它包括两个图形测试项目、两个处理器测试项目、六个特性测试项目。图形和处理器测试项目都是全新制作的,其中前者借助DX10显卡的新 技术和性能打造了绚丽逼真的视觉特效,后者还特别加入了对人工智能(AI)和物理加速的专门测试。3DMark Vantage的另一个全新特性是引入了四种不同等级的参数预设(Preset)。此前的3DMark在得出结果的时候都只有一个简单的分数,而 3DMark Vantage按照画质等级划分成了Entry(E)、Performance(P)、High(H)、Extreme(X)四类,得分表达方式也改成了字母加数字的组合形式,从而更细致地反映系统性能等级,可以更对位、更公平地进行比较。当然,不同等级 之间的分数没有可比性
下载地址:http://download.pchome.net/system/benchmark/detail-87654.html
11.GPU-Z (显卡检测)V0.4.4
GPU-Z 0.4.4更新日志:
-增加支持NVIDIA GeForce GTX 460、GT 330、GT 315以及GT216核心ION
- 增加支持AMD HD 5670(Juniper)、移动版HD 5430、移动版HD 4200、移动版HD 4100
- 加入撼讯有奖调查活动
- 增加华氏温度选项
- 修正ATI显卡BIOS读取问题
- 修正ADT7473温度传感器十进制读数
- 修正GeForce 8300 IGP导致程序崩溃问题
- 增加RS780改版频率监控功能
- 改进ATI R6xx架构产品频率监控功能
下载地址:http://www.orsoon.com/Soft/7218.html
12.Furmark V1.82 >绿色多语版
这款软件和OpenGL FurRenderingBenchmark很相似,界面和使用上都很相似。不过不同的是FurMark已经在测试OpenGL 2.0的性能。因此 ,显卡要求NV GF6以上和ATI X1000以上。
这个测试提供很多选项设置,包括全屏/窗口设置、MSAA选项、窗口大小、测试时间、当然还有GPU稳定性测试(烤机)
更新日志:
1、在基准测试模式中所有选项均可用,包括(XB)>(FX)(DM)。
2、在皮毛渲染中增加新的置换贴图效果。
3、用户界面语言翻译通过XML文件实现(UTF-8格式、位于localization文件夹内)。
4、新的热键:P-开启/关闭后期效果渲染、T-开启/关闭温度曲线渲染。
5、GPU温度现以XML、CSV格式导出。
6、加大皮毛渲染工作量,进一步压榨显卡性能。
7、改进温度曲线可读性。
8、ZommGPU升级至新版,支持新型号显卡。
下载地址:http://www.xdowns.com/soft/6/54/2008/Soft_44172.htm

官网手机版

邮箱:support@szgalaxy.com

地址:深圳市福田区香蜜湖街道车公庙绿景纪元大厦51层51A

版权所有 深圳市嘉实威业科技有限公司 粤ICP备14038543号

400-700- 3933

周一至周五9:00-18:00