La Arquitectura de la GF100 o Fermi

Por fin NVIDIA ha liberado por fin las especificaciones de Fermi o la llamada GF100 que tendrá un rendimiento al menos ≥100% que la generación previa GT200.

El GPU cuenta con las siguientes especificaciones en comparación con las antiguas y más nuevas arquitecturas disponibles en el mercado:

AMD
Cypress
AMD
RV790
NVIDIA
G92
NVIDIA
GT200
NVIDIA
GF100
Shader units 1600 800 128 240 512
ROPs 32 16 16 32 48
Texture Units 80 40 64 80 64
DirectX 11 10.1 10 10 11
Transistors 2154M 959M 754M 1400M 3200M
Memory Type GDDR5 GDDR5 GDDR3 GDDR3 GDDR5
Memory Bus Width 256 bit 256 bit 256 bit 512 bit 384 bit


Y podemos ver que la GF100 incrementa en un 115% los shader processors ahora llamado CUDA cores, y cuenta con un disponibles del 50% en el ancho de banda de la memoria en comparación con la GT200 y manteniendo las frecuencias de la arquitectura anterior.

El GPU está organizado según el diagrama que vemos abajo, el Motor Gigathread actúa como un complejo soporte que distribuye el trabajo entre los componentes del GPU que trabajan en paralelo. Un controlador de memoria GDDR5 de 385 bits conecta el GPU a 12 módulos de memoria con un estimado de 1536 MB (1.5 GB) o 3072 MB (3.0 GB) dependiendo de la densidad del chip usado, además se esperan versiones con menos memorias para el mercado de bajo nivel.

Este nivel de paralelismo es logrado gracias a que hay caches en cada nivel que ayudan a administrar el tráfico de los datos, y permiten que los datos y las instrucciones clave permanezcan en el chip. Hay caches de 64Kb L1 en cada SM, y una cache de 768Kb L2 para el vertex las texturas y los datos ROP además de usarse para otros propósitos generales.

A diferencia de su competencia de GPUs con tessellators unificados, la aproximación de NVIDIA es distribuir el trabajo en 16 SMs usando motores PolyMorph. Cada motor PolyMorph da a su propio SM su tessellator. Cada GPC cuenta con su propio Motor Raster. Por lo que la jerarquización ofrece a la GF100 un incremento de 8 veces más rendimiento en la geometría que la GT200decentralizando estos componentes con una arquitectura en paralelo.

Una de las diapositivas nos manifiesta una muy buena observación y es que desde hace 5 generaciones de los GPUs GeForce es decir desde la GeForce FX 5800 la habilidad de procesar geometría en los GPUs y la complejidad geométríca en los juegos ha impedido el desarrollo cuando por ejemplo lo comparamos con el rendimiento de los Shaders y su implementación. Mientras el crecimiento y rendimiento de los Shaders ha crecido 150 veces entre estas generaciones, la geometría se la ha pasado reposando ya que solo creció 3 veces. Y es por esto que los juegos no han sido de una calidad tan realista y por lo que los creadores de películas en 3D requieren usar granjas de PCs que se ocupen del cálculo de la geometría.

El Tesselation es la manera de incrementar el rendimiento de la geometría y mantener los gráficos con los que disponemos hoy. Lo más complejo en un objeto 3D es dibujar de forma precisa el objeto en la pantalla. El Tessellation o Mosaico permite que el GPU enfoque sus recursos en seleccionar porciones del objeto en 3D en donde se requiere mayor complejidad segun las instrucciones del mapa de desplazamiento y añadir así sus detalles geométricos. DirectX 11 permite generar geometría generalizada.

Las siguientes imágenes muestran cómo es que el tessellation funciona en DirectX11 en algunos demos.

NVIDIA explica como simplemente añadiendo tessellation en la GT200 tendríamos un cuello de botella, pero que funciona perfectamente bien en la GF100 por la forma en la que está dispuesta.

Las siguientes imágenes detallan la jerarquía de la geometría y como es que componentes vitales son distribuidos en los SMs haciéndola una arquitectura escalable y paralela.

El incremento en el rendimiento del tessellation es hasta de 6.44 veces en comparación con una ATI Radeon HD 5870.

Y en una prueba más intensa como el Unigine Heaven benchmark, la GF100 produjo un incremento de 1.6 veces (60%) más frames por segundo y una diferencia máxima del 80%.

En Cubemap las prueban lanzaron un rendimiento hasta 4.7 veces mayor que una ATI Radeon HD 5870.

Además NVIDIA introduce alguna mejoras en la calidad de la imagen con la GF100. La primera es algo llamado Accelerated Jitter Sampling que permite reducir las sombras irregulares y reduce el ruido generado de forma aleatoria al rededor de las sombras que llegan a distorsionar las superficies que se encuentran al rededor de las sombras, es decir hace sombras más bellas y reales.

El ralismo se incremnta gracias al nuevo filtro 32X CSAA anti-aliasing

En las siguientes imágenes hay comparaciones entre el 16x CSAA de la GT200 y la 32x CSAA que se ofrece con la GF100

La baja en el rendimiento final con el 32x CSAA en vez del filtro a 16x CSAA se espera se insignificante con una baja del 7%

Esperamos a Fermi la bestia gráfica que seguramente se comerá nuestros bolsillos pero también a muchos les quitará el aliento por un instante.

según


Add this page to your favorite Social Bookmarking websites
Digg! Reddit! Del.icio.us! Mixx! Free and Open Source Software News Google! Live! Facebook! StumbleUpon! MySpace! Yahoo! Cannotea! Ask! Meneame TwitThis Joomla Free PHP
Comentarios (0)Add Comment

Escribir comentario
Tienes que estar logueado para escribir un comentario. Puedes registrate si no tienes ya una cuenta creada.

busy

Ultimos Comentarios

Relax: Adivinanalo con una chu...
Lo que viene despues (en el programa nocturno) es Digalo con...
13/03/10 04:52
mkosto

Por Fin es Viernes de Campeona...
como que salio la propaganda un poco tarde ni modo no pedi p...
12/03/10 20:51
milo_smiler1

Por Fin es Viernes de Campeona...
mañana estaré por allá, asi qu epasare a ver que onda. sa...
12/03/10 03:05
Bab¬¬

Por Fin es Viernes de Campeona...
el mapa esta un poco mal el hotel esta mucho mas al norte, e...
12/03/10 02:25
fredstation

Tech Preview de Crysis 2
osea. como 6 segundos de la vercion de PC pues a ver que...
11/03/10 22:10
fredstation

Encuesta de la Semana

¿Qué Plataforma Prefieres?

Imagen Geek

EGS06

Top 10

DISCOS DUROS:

1.- VelociRaptor VR150
2.- Barracuda 7200.12
3.- Caviar Black
4.- Barracuda 7200.11
5.- SpinPoint F1
6.- Caviar Green
7.- EcoGreen F2

TARJETAS DE VIDEO:

1.- ATI Radeon HD 4870 X2
2.- Nvidia Geforce GTX 295
3.- Nvidia Geforce 9800 GX2
4.- Nvidia Geforce GTX 285
5.- Nvidia Geforce GTX 275
6.- ATI Radeon HD 4890
7.- ATI Radeon HD 3870 X2

PROCESADORES:

1.- Intel Core i7 920
2.- Intel Core 2 Quad Q9550
3.- AMD Phenom X4 9950 Black
4.- Intel Core 2 Quad Q6600
5.- AMD Phenom X4 9850
6.- Intel Core 2 Duo E8600
7.- AMD Phenom X3 8600

PLACAS MADRE:

1.- EX58-Extreme
2.- Rampage II Extreme
3.- EX58-UD4P
4.- EP45-UD3P
5.- MSI Eclipse
6.- Foxconn X58 Blood Rage
7.- ASUS P5Q-PRO Turbo
8.- MA790FXT-UD5P
9.- M4A79T Deluxe
10.- MA78GM-US2H

Modslaberos Online

  • mkosto
  • fredstation
Now 2 members and 87 guests online
Mod´s Labs

Somos la Comunidad Mexicana de Adictos a la Tecnología más grande. Esforzándonos cada día por poner al alcance de todos el conocimiento sobre la tecnología necesario para desempeñarse en la época actual.

Información de Contacto +011 (52) 222 210 5654
+011 (52) 241 108 4332
mago@modslabs.com
vickoh@modslabs.com
www.modslabs.com
Oficinas: Privada Abasolo #4 int. 7
Cuautlancingo, Puebla
C.P. 72710, México

Taller: Cedros #39
Tlaxco, Tlaxcala
C.P. 90250, México
Detalles del Staff