Facebook Sharer
选择您要替换的背景颜色:
【农历新年】背景图片:
个性化设定
 注册  找回密码
查看: 8502|回复: 57
打印 上一主题 下一主题

[转载]NVIDIA D10U繪圖核心GeForce GTX 280正式登場

[复制链接]

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

跳转到指定楼层
1#
发表于 2008-6-17 05:03 PM |只看该作者 |倒序浏览
NVIDIA D10U繪圖核心
GeForce GTX 280正式登場
文: Kopo Ko / 評測中心




NVIDIA 16 日宣佈推出第二代 Unified 架構繪圖產品,核心代號為 D10U , 並命名為 GeForce GTX 200家族,除核心提升至 240 個 Strreaming Processors ,且大幅改良微架構設計外,更首次加入 ParallelCompute 模式,進一步強化平行運算能力。究竟 NVIDIA 能否憑藉 D10U 核心再創高峰, HKEPC 編輯部找來 MSIGeForce GTX 280 繪圖卡,進行效能測試並深入分析優劣勢所在。







全新 GeForce GTX 200 家族正式發佈



NVIDIA 16 日正式發佈全新 GeForce GTX 200 家族,係為 NVIDIA 第二代 Unified架構產品,其目標不單是提供最強的 3D 繪圖效能,同時亦優化了平行運算能力,為非 3D 軟件提供硬件加速功能,並為繪圖核心加入Parallel Compute 模式,顯見 NVIDIA 繪圖卡產品已不再只定位於 3D 遊戲應用,而是擴大至一般應用軟件層面,並以「Two Personlities 、 One GPU 」作口號,與傳統 CPU 同場較勁。

為凸顯第二代 Unified Shader 引擎產品, NVIDIA 一改沿用已久的產品命名法則,產品階級不再以數字分別,改為 GTX 、GT 、 GS 及 G ,分別代表 Enthusiast 、 High-end performance 、 Mid-rangePerformance 及 Entry Market 。

GeForce GTX= Enthusiast
GeForce GT= High-end performance
GeForce GS= Mid-range performance ( 暫定 )
GeForce G= Entry ( 與 IGP 產品共用 )

接在產品階級後面是一組 3 位數字,分別代表著產品世代及型號,以 GeForce GTX 280 為例,即代表高階第二代 Unified 架構產品,型號為 80 。現時已得悉型號的區分如下︰


GTX= 260 through 290
GT= 230 through 250
GS= 210 through 220
G= 201 through 209




相較上代 GeForce 8 及 GeForce 9 高階產品, GeForce GTX 200 核心變得更為複雜,處理核心數目是上代的1.88x ,同一時間可處理的線程是上代的 2.5x ,加入 Double-Precision Floating-Point支援,擁有更快速的 Geometry Shading 處理能力, 512Bit 記憶體介面,更具效率的指令排序, NVIDIA再度大幅提升繪圖產品的性能,以捍衛得來不易的繪圖江山。

GeForce GTX200 家族核心代號為 D10U , 6 月 16 日率先上市的是高階型號 GeForce GTX 280 ,定價為$649 美元,緊接著 6 月 26 日將再推出效能級型號 GeForce GTX 260 ,定價為 $399 ~ 449 美元。



[ 本帖最后由 real.gigaleon 于 2008-6-25 07:50 PM 编辑 ]




收藏收藏0

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

2#
发表于 2008-6-17 05:04 PM |只看该作者
D10U ︰ 240 個 Streaming Processors

NVIDIA 指出,全新 GeForce GTX 200 家族為第二代 Unified 架構,其效能約為上代 GeForce 8 及GeForce 9 高階產品的 1.5x ,核心代號為 D10U ,採用 65nm 制程,由台積電 (TSMC) 代工,內建 14億個電晶體,是現時內建電晶體最多、效能最高且最複雜的繪圖晶片。

D10U 繪圖核心與上代 G80 、 G92 相同,均採用 Scalale Processor Array (SPA)架構,即核心內建若干數目的 Texture Processing Clusters (TPC) ,每個 TPC 內擁有若干若數目的Streaming Multiprocessors (SM) ,而每個 SM 則擁有 8 個 Streaming Processor (SP)。

事實上,欲提升繪圖核心的運算能力,最直接的方法就是增加運算處理單元, D10U 擁有 10 個 TPC ,相比 G80 、 G92多出兩個,每個 TPC 內建的 SM 數目亦由 2 組變成 3 組,每組 SM 內建的 SP 數目保持為 8 個,因此, D10U 合計擁有240 個運算處理單元,較 G80 、 G92 高出 1.88x ,運算能力高達 933 GFLOPS 。

雖然號稱為第二代 Unified 架構,但 D10U 仍然不支援 DirectX 10.1 及 Shader 4.1 ,據 NVIDIA回應指,現時支援 DirectX 10.1 及 Shader 4.1 的遊戲絕無僅有,因此 NVIDIA 無意在現階段支援 DirectX10.1 及 Shader 4.1 ,直至市場開始對這項規格有一定需求,而且更不排除跳過 DirectX 10.1 及 Shader 4.1,直接研發下一個版本規格。



G80 , G92
D10U
TPCs
8
10
SMs per TPC
2
3
SPs per SM
8
8
Total SPs
128
240


D10U ︰ 512Bit 、 1GB Framebuffer

D10U 的記憶體介面由 G80 的 384Bit ,提升至 512Bit ,由 8 組 64Bit 寬度組成,據 NVIDIA表示,提升記憶體介面寬度主因在於, D10U 核心架構擴大後需要再更新平衡記憶體頻寬,以支援現有及未來的負載,而 512Bit 是 D10U最有效率的規格設定。

不單是記憶體介面提升至 512Bit , D10U 的 Memory Crossbar 亦進一步優化,以往執行 IndexedPrimitive Fetches 時, Front End 與 Data Assembler 會爭奪 Memory Crossbar控制,導致不必要的 Latency ,但新一代 D10U 的 Memory Crossbar 將不會出現此情況。

此外, NVIDIA 高階繪圖卡產品的 Framebuffer 將會提升至 1GB 容量,現今的 3D 遊戲為提升真實度,已使用大量不同的Textures ,包括採用 Normal maps 以提升物件表面的質感、 Cubemaps 提升反射、倒影效果及高像度Perspective Shadow 作 Soft Shadows 應用,意味著 3D 遊戲將使用更多 Framebuffer,因此提升容量是必然的,尤其是在啟動反鋸齒技術時更為顯著。




G80
G92
D10U
Memory Interface
384
256
512
Default
Framebuffer

768MB
512MB
1024MB

D10U ︰擴大內部 Buffer 容量

以往 GPU 面對較長的 Shaders 指令,會導致 Local Register 容量耗盡,需要採用外部記憶體作暫存,進而導致大幅度的Latency 。為令 D10U 在執行複雜且較長的 Shader 之際,能有更佳的執行效率, D10U 核心內建的 LocalRegister 大小是上代 G80 、 G92 的一倍。

據 NVIDIA 表示,增加 Local Register 容量僅會小幅增加 D10U 的 Die Size ,但卻能有效提升 Shader的執行效率。圖下為 NVIDIA 提供的 1x 及 2x Local Register 容量比較,在 3D Mark Vantage進行測試,可以看到明顯的效能增長。


另一方面, D10U 亦增加 Internal Output Buffer ,容量是上代 G80 、 G92 的 6x ,令 D10U擁有更高的 Geometry Shadering 及 Stream Out 效率。同時, D10U 提升了 Post-TransformCache 容量,此項改變有效減少 Geometry 與 Vertex Stage 之間的 Latency 。


回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

3#
发表于 2008-6-17 05:05 PM |只看该作者
D10U ︰改良 Dual Issue 設計

NVIDIA G80 、 G92 的 Stream Processor 能在同一週期處理一次整數指令、 Floating Point運算或涵數運算,因此 G80 擁有 128 個 Stream Processor ,理論上在同一週期內最多能完成 128 筆資料及指令,另外,G80 加入了 Dual Issue 設計,當進行 MADD(Multiply-ADD) 運算時,則可同時多運算一組MUL(Multiply) 運算。

而新一代 D10U 進一步改良 Dual Issue 設計,當 SP 的 MAD Unit 在處理 MUL 與 ADD 的同時, SFUUnit 可以用相同的時脈處理另一組 MUL ,執行效率較上代 G80 、 G92 大幅提升,最高可達 93 ~ 94% 。

為令 Dual Issue 設計充分發揮, D10U 也更改微架構設計,包括 Register Allocation 、Instruction Scheduling 及 Instruction Issue ,這些改變令 SP 與 SFU 在 Dual Issue處理上盡情揮灑。

D10U ︰ 80 個 Texturing Unit 、 32 個 ROP

擁有 8 個 TPC 的 G80 ,內建 64 個 Texture Filtering Unit 及 32 個 TextureAddressing Unit ,因此,每次可處理 64 個 Pixels 的 Texture Filtering 、 32 個 Pixels的 Texture Addressing 、 32 個 Pixels 的 Anisotropic bilinear Filtering , 或32 個 8 Bit integer 、 16 Bit Floating Point 的 bilinear-Filtered Pixels 。

G92 也有明顯改良,其增至 64 個 Texture Addressing Unit ,令 Texture Addressing 及 8 Bit integer 的 bilinear-Filtered Pixels 處理能力提升至 64 個。

而 D10U 更進一步提升至 80 個 Texture Filtering Unit 及 Texture Addressing Unit,每次可處理 80 個 Pixels 的 Texture Filtering 、 80 個 Pixels 的 TextureAddressing 、 80 個 8 Bit Integer Bilinear-Filtered Pixels 、 40 個 Pixels的 Anisotropic Bilinear Filtering 或 40 個 16 Bit Floating Point 的bilinear-Filtered Pixels 。

此外, D10U 採用更高效率的 Scheduler 排序器,減少不必要的 Latency ,讓晶片的實際執行盡量貼近理論峰值,據 NVIDIA 表示,相較上代 G92 ,新一代 D10U 的 Texture Unit ,效率顯著提升約 22% 。



G92
D10U
Heretical
Bilinear Fillrate

33,600
51,840
Measured Rate
25,600
48,266
Real Performances
76.2%
93.1%
Source : NVIDIA , Complied by HKEPC Hardware , June 2008

ROP 數目方面, D10U 由上代的 G80 的 24 個提升至 32 個,令 D10U 的於高解像度及反鋸齒能力上更上一層樓, D10U可處理每筆 32 個 Pixels (4 pixel per POR Partition x 8 Partition) ,每個 ROPPartition 於 8x MSAA 模式最高支援 32 個 color 及 Z sample ,每個 ROP 內建 2 組Z/Stencil 運算單元,因此單一週期可處理高達 64 個 Stencil Shadow 運算。

此外, D10U 改變了 Z-Culling 效能,尤其是在高解像度方面,由 ZROP Unit 數目增加,令 Early-Z機制的效率有效拉升, D10U 的最高 ZROP cull rate 可達 256 Sample/clock 或 32pixels/clock 。

D10 vs. G80



GeForce
8800GTX
GeForce
GTX 280
Increase%
Core
128
240
87.5%
TEX
64t/clk
80t/clk
25%
ROP Blend
12p/clk
32p/clk
167%
GFLOPs
518
933
80%
Memory Bandwidth
86GB
142GB
65%
Texture Fill
37 GT/s
48 GT/s
29.7%
ROP Blend
7GBL/s
19 GBL/s
171%
Source: NVIDIA, Complied by HKEPC Hardware, June 2008


回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

4#
发表于 2008-6-17 05:06 PM |只看该作者
D10U ︰新增 Parallel Compute 模式



現今的 GPU 已不再侷限於 3D 繪圖應用,從數學運算 (e.g. MATHLAB)、金融分析、醫學檢查、氣象預測、電子線路設計、生物分子結構分柝及光學模擬運算等專業領域,乃至影像編碼等一般應用程式,皆可運用 GPU進行硬體加速運算,未來應用勢將更為廣泛。

D10U針對平行運算進行了重大修正改變,除原有的Graphics模式,當應用於平行運算時,將改為Parallel Compute模式。Parallel Compute模式,是 D10U 為核心加入了硬體Thread Scheduler (線程排序器),以及稱為「Atomic」的記憶體處理單元,且在每組SM內部加入Share Local Memory,而這也是首代Unified架構所未見的。




為提升平行運算效率, D10U 加入硬體 Thread Scheduler ,以保証核心的 SP 達至接近 100% 負載。上代Unified Shader 架構,當線程需要讀寫記憶體時,該組 SP 必須等待讀寫動作完成,才會執行其他指令,但 D10U 加入了硬體Thread Scheduler ,當線程需要等待讀寫記憶體, Thread Scheduler 會立即切換該組 SP 進行其他指令,不會讓SP 出現閒置情況。

另外, D10U 新增 8 個「 Atomic 」的記憶體處理單元,可執行極微密的記憶體讀、改、寫動作,並提供粒狀記憶體位置存取,為平行運算帶來更有效的架構管理。

D10U 亦強化了平行運算的記憶體讀寫效能,以往每組 TPCs 內建一組 L1 Cache ,讓 TPC 內每組 SM可共同分享資料,而不需要讀寫外部記憶體以提升效率。新一代的 D10U 更在每一組 SM 內建有 Local Memory ,讓每組 SM內的每個 SP 也能共同分享資料,令平行運算效率大大提升。

不僅如此, D10U 更可在平行運算模式下,將原用於 Texture 用途的 Texture Cache , 也變成平行運算的快速記憶體暫存,以提高記憶體頻寬及讀寫效率。



回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

5#
发表于 2008-6-17 05:07 PM |只看该作者
D10U ︰可同時處理 30,720 Threads

據悉, NVIDIA Unified Shader 架構支援兩種不同的運算方式,其中針對整個 TPCs 下達執行指令,稱為 Multipleinstruction, multiple data (MIMD) 模式,另一種則是全新的 Single instruction,multiple thread (SIMT) 模式,直接向每個 SM 下達執行指令。

SIMT 運算模式大幅改善純 SIMD(Single instruction, multiple data)模式的執行效率,並且更易編程。值得注意的是, SIMT 不需像傳統 SIMD 模式需要設定 vector 寬度,令核心可以全速執行而不需要理會vector 的大小。

此外,傳統 SIMD 模式入的資料如果小於 MIMD 及 SIMD 寬度時,會減低執行容積,而 SIMT 模式則可以在任何情況下保持最大執行效率。

每個 SIMT 多線程指令最高可擁有 32 個平行線程,稱為一個「 warp 」, D10U 每組 SM 支援 32 個 warps ,即1024 個 Threads ,相比上代 G80 、 G92 每組 SM 僅支援 24 個 waprs ,即 768 個 Threads 。

如果把整顆 D10U 核心與上代 G80 、 G92 比較, D10U 最高可同時處理高達 30,720 個 Threads (1024 x3 x 10) ,相比上代 G80 、 G92 僅 12,280(768 x 2 x 8) ,吞吐量高出 2.5x 。



G80 , G92
D10U
TPCs
8
10
SMs per TPC
2
3
Threads per SM
768
1024
Total Threads execute
12,288
30,720

D10U ︰支援 Double Precision

D10U 其中一個重要改良是加入了 Double Precision 雙精算及 64-Bit Floating Point 運算支援,鎖定高階科學、工程、財經運算軟件、以及需要高精確度的數學運算。

D10U 的每組 SM 包含了一個 Double Precision 64Bit Floating Unit ,而整顆核心則擁有 30 個。

這 30 個 Duoble Precision 64Bit Floating Unit 如同接上了保險絲的 MAD Unit ,能精確完成MAD 指令,並完全符合 IEEE 754R floating Point 規定,而 D10U 的 Double Precision效能等同於一顆 8 核心的 Xeon 處理器,高達 90 Gigaflops 。

D10U 與上代繪圖核心規格比較︰





G80
G92
D10U
Fabrication Process
90nm
65nm
65nm
Number of Transistors
681 Million
754 Million
1.4 Billion
Processor Core
128
128
240
Memory Interface
384
256
512
Texture Filtering Unit
64
64
80
Texture Addressing Unit
32
64
80
ROPs
24
16
32
Source: NVIDIA, Complied by HKEPC Hardware, June 2008


回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

6#
发表于 2008-6-17 05:07 PM |只看该作者
新二代 Unified 架構    MSI GeForce GTX 280 繪圖卡




圖為 MSI 推出的 GeForce GTX 280 繪圖卡,採用 NVIDIA P651 公板設計、 高達 14 層 Layers PCB,繪圖卡尺寸為 4.376 x 10.50 inches 、 Dual Slot 設計 ,需要外接一組 6 Pin 及 8 PinPCI-Express 供電,產品最高功耗僅為 236W 。

GeForce GTX 280 繪圖核心為「 D10U-30 」,晶片印上 G200-300-A2 ,採用 65 奈米制程由 TSMC(台積電)代工,擁有 240 個 Unified Streaming Processor 、 80 個 Texture FilteringUnit 、 80 個 Texture Address Unit 及 32 個 Raster Operations Unit ,核心時脈為602MHz , Stream Processor 部份為 1296MHz ,其運算效能高達 933 Gigaflops 。

GeForce GTX 280 繪圖核心支援 CUDA 2.0 運算平台,已可在 177.34 驅動程式使用, NVIDIA 已附有 BadaBOOM 視訊編碼軟件及 Folding@Home 等作示範,效果令人滿意。

此外, NVIDIA 在收購 PhyX 公司後, 將會在下一版本驅動程式中加入 PhyX 物理運算支援,所有支援 PhyX 的遊戲將會被追加硬體物理運算加速。

顯示輸出方面, D10U 繪圖核心與 G80 相同,並未內建繪圖輸出單元,因此,須使用外置的 NVIO-2 顯示輸出晶片,支援雙Dual-Link DVI 及 7 Pins HDTV 輸出端子,與 NVIO-1 的主要分別在於新增 10-Bit Color 支援。

GeForce GTX 280 支援 HDMI 輸出,但需要配合 NVIDIA 專用的 DVI to HDMI Dongle ,由於 D10U並沒有像 ATI 內建音效 Codec ,因此用家仍需要透過外部 SP/DIF 接線,才能讓 HDMI 接口支援音效輸出。

值得注意的是, P651 預留了日後支援 Display-Port 輸出的佈局,在 PCB 上預留加入 Display-PortTransmitter 晶片的走線,不過 NVIDIA 表示,有鑑於市場上 DisplayPort 屏幕仍未普及,因此短時間內未規劃推出Display-Port 輸出版本。


GeForce GTX 280 採用 D10U-30 繪圖核心


( 左 ) 需採用 NVIO2 顯示輸出    ( 右 ) 留有 DisplayPort 走線,可加入 Transmitter 晶片


支援 512Bit 記憶體介面    -0.8ns GDDR3 記憶體



(左 )Qimonda HYB18H512321BF -1.0ns GDDR3   ( 右 ) 正背面合共 16 顆 GDDR3 顆粒


GeForce GTX 280 支援 512Bit 記憶體介面, P651 PCB 正背面合計 16 顆Hynix H5BS5223CFR -0.8ns 16M x 32 GDDR3 記憶體顆粒,記憶體時脈為 2214Mhz DDR,記憶體頻寬高達 140.8GB/s 。


支援 Hybrid Power 省電技術


作為 NVIDIA 高階繪圖卡產品, GeForce GTX 280 支援 3-Way SLI 技術,以三張 GeForce GTX 280 繪圖卡達成協同運算。此外, GeForce GTX 280 亦支援 ybrid Power 省電技術。


用家如果採用 nForce 790i(MCP65) 、 nForce 780a(MCP72XE 、nForce 750a(MCP72P) 、 GeForce 9200(MCP78U) 及 GeForce 8200(MCP78S)主機板,可將繪圖卡設定為 Save Power Mode ,繪圖卡即會進入休眠狀態,功耗將會下降至接近 0W ,繪圖工作將交由晶片組的 IGP繪圖核心處理,直至用家把繪圖回復正式模式,而切換模式並不需要重啟系統。


據 NVIDIA 表示, GeForce GTX 280 最高功耗為 236W ,這是在 100% 重負載下的最大值,在 2D 閒置下功耗只有 25W ,以 PureVideo 硬件解碼技術進行 Blu-Ray 播放,功耗約為 35W 。



( 左 ) 支援 3 Way SLI 技術    ( 右 ) 需外接 6Pin 及 8pin PCI-E 電源

( 左 ) 雙組 DVI 及 1 組 HDTV 輸出,可外接 HDMI Dongle   ( 右 ) 供電模組採用 7 相供電設計


Dual Slot 散熱器、 CoolerMaster 代工




GeForce GTX 280 最高功耗達 238W ,需要一定效能的散熱器才能因應,因此 , NVIDIA採用 CoolerMaster 代工的 TM71 散熱器, Dual Slot 設計並擁有 4 支 Heatpipe 導熱管,風扇最高轉速為2900rpm ,工作聲噪由 26 ~ 38 dBA 。




回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

7#
发表于 2008-6-17 05:08 PM |只看该作者
測試平台︰







Testing Platform
CPU
Intel Core 2 Extreme QX9770
Motherboard
GIGABYUTE X48-DQ6
Memory
A-DATA DDR2-1066 Extreme CL4 1GB x2
VGA
MSI GeForce GTX 280


MSI GeForce 9800GTX


MSI GeForce 9800GX2


MSI Radeon 3870 X2
PowerSupply
GIGABYTE ODIN GT 1200W
OS
MS Windows Vista SP1
Driver
Forceware 177.34


ATI Catalyst 8.6


回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

8#
发表于 2008-6-17 05:08 PM |只看该作者
效能對比︰




NVIDIA
GeForce
GTX 280

NVIDIA
GeForce
9800GTX

NVIDIA
GeForce
9800GX2

ATI
Radeon HD
3870 X2

3D Mark 05








16 x 10
19346
18685
2097421274
19 x 12
18553
17725
20512
20765
16 x 10 8AA
17137
12532
18870
18712
19 x 12 8AA
16001
10816
17823
17658










3D Mark 06








16 x 10
15763
13114
16674
16877
19 x 12
14781
11826
16118
16190
16 x 10 8AA
11128
7367
11886
11735
19 x 12 8AA
9981
6470
10957
11400










3D Mark Vantage 16x10








Total
7297
3553
6319
3971
GPU
6762
3147
5789
3414










3D Mark Vantage 19x12








Total
4908
2097
3305
2082
GPU
4751
2008
3179
2014










Company of Hero
(High and On)DX10









16 x 10
58.3
45.0
58.9
50.1
19 x 12
56.9
42.7
58.5
48.8
16 x 10 8AA
56.3
39.3
21.3
42.5
19 x 12 8AA
49.6
29.4
16.8
35.9










Farcry1.4
(Ultra and HDR on)









16 x 10
179.52
132.64
179.11
145.54
19 x 12
170.83
113.29
169.85
126.61
16 x 10 8AA
164.74
118.16
162.51
133.42
19 x 12 8AA
158.96
97.12
156.46
117.81











回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

9#
发表于 2008-6-17 05:09 PM |只看该作者
F.E.A.R
(Max and on+16x AF)









16 x 10
154
86
148
137
19 x 12
125
69
121
107
16 x 10 8AA
135
52
133
63
19 x 12 8AA
108
40
107
52










Crysis (High)








16 x 10
48.33
31.14
47.59
22.26
19 x 12
39.47
25.62
39.36
21.83
16 x 10 8AA
32.78
17.06
32.60
19.48
19 x 12 8AA
26.88
10.48
26.71
15.63










PT Boats-
Knights of the sea(High)









16 x 10
65.4
49.6
65.4
45.4
19 x 12
62.9
42.3
63.2
43.8
16 x 10 8AA   
35.6
10.3
35.8
4.3
19 x 12 8AA   
30.1
8.9
30.7
3.5

擁有 240 個 SP 的 GeForce GTX 280 繪圖卡,在效能表現上大幅壓制採用 G92 繪圖核心的 GeForce9800GTX ,以及兩顆 RV670 的 Radeon HD3870 ,並與擁有兩顆 G92 繪圖核心的 GeForce 9800GX2效能相若,表現令人滿意。

據 NVIDIA 指出,現有的 Forceware 177.34 驅動程式仍未完全優化 GeForce GTX 280 ,相信新驅動程式面世後, GeForce GTX 280 效能仍有提升空間。

此外, GeForce GTX 280 核心針對 PhyX 物理運算作出了優化,雖然 177.34 的驅動程式仍未支援 PhyX加速,但下一代版將追加此功能, GeForce GTX 280 表現將比第一代 Unified 架構的 GeForce 9800 、 8800更勝一籌。


回复

使用道具 举报

20

主题

0

好友

7313

积分

百变名嘴

Rank: 13Rank: 13Rank: 13Rank: 13

10#
发表于 2008-6-17 05:09 PM |只看该作者
CDUA 測試︰



NVIDIA
GeForce
GTX 280
Intel
Core 2 Extreme
QX9770
MPEG to H.264 Test


Software
BadaBoom
Main Concept H.264 Encoder
File Size
689.2MB 1080p MPEG2 File
Used Time
17.26 mins
31.7 mins

GeForce GTX 280 支援 CDUA 2.0 平台,為測試其平行運算效能,編輯部找來首個支援 CDUA 2.0 平台的BadaBoom 視訊編碼程式,與著名視訊編碼程式 Main Concept H.264 Encoder 作出對比測試,結果 D10U GPU大勝 3.2GHz Intel 四核心,未來 CUDA 2.0 將會進入不同範疇的應用,日後會否變成 CPU 只是副手,重責大任由 GPU一肩扛起,成為市場焦點所在。

功耗測試︰



NVIDIA
GeForce
GTX 280

NVIDIA
GeForce
9800GTX

NVIDIA
GeForce
9800GX2

ATI
Radeon HD3870 X2
Idle
241.2W
210.4W
280.3W
271.4W
3D Rendering (Max)
351.1W
345.6W
360.3W
369.2W

集成了 1.4 Billion 個電晶體,但 D10U 仍採用 65 奈米制程,全因 NVIDIA 在制程技術採取保守主義,雖然成本、 Die Size 與功耗無法降低,但成熟的制程卻帶來優秀的良率。

儘管如此, GeForce GTX 280 的功耗表現還是較兩顆 G92 核心的 GeForce 9800GX2 優勝,不過要進一步下降功耗,看來要等待 NVIDIA 推出半代更新版本。

溫度及聲噪測試︰



NVIDIA
GeForce
GTX 280
Ambient Temp
25.5C
Idle
52.2 ~ 53.7C
3D Rendering (20Mins)
73.6 ~ 74.1C



Amibent Noise
48.2 dBA
Idle
52.1 dBA
3D Rendering (20Mins)
53.6 dBA
Full Fan Speed
60.2dBA

看到規格書上寫上 236W 時,還以為 GeForce GTX 280 會是又熱又吵,但測試結果卻出乎意料之外,全因 CoolerMaster代工的 TM71 擁有四支高導熱性能的 Heatpipe,其中一支更把熱傳導至卡的金屬外殼上,令核心的熱力平均、快速地帶走,如此優秀的散熱設計,將對欲推出非公版散熱器的廠商相當困擾,因為要找到優於公板散熱器的代替品著實不易。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

JBTALKS.CC |联系我们 |隐私政策 |Share

GMT+8, 2024-12-26 11:13 AM , Processed in 0.145032 second(s), 27 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

Ultra High-performance Dedicated Server powered by iCore Technology Sdn. Bhd.
Domain Registration | Web Hosting | Email Hosting | Forum Hosting | ECShop Hosting | Dedicated Server | Colocation Services
本论坛言论纯属发表者个人意见,与本论坛立场无关
Copyright © 2003-2012 JBTALKS.CC All Rights Reserved
合作联盟网站:
JBTALKS 马来西亚中文论坛 | JBTALKS我的空间 | ICORE TECHNOLOGY SDN. BHD.
回顶部