Generic Viagra online

Más cosas sobre el Larrabee y algo de especulación extra sobre PS4

General 4 Diciembre, 2009

Hace poco que dije que Intel había acabado ya el Larrabee, solo que me equivoque de par en par, no en el hecho de que estuviera acabado, que lo esta, sino en el hecho de que el procesador de 48 núcleos no es el Larrabee sino el nuevo procesador del proyecto TeraScale de Intel, que empezó con la presentación de Polaris hace dos años y ahora ha continuado con la de este procesador de 48 núcleos que repito no se trata del Larrabee sino de otra arquitectura completamente distinta.

Para quitarme de encima la pesadez de estar hablando todo el rato de “La industria” voy a hablar de la arquitectura de ambos procesadores, uno de ellos esta pensado para la computación en la nube mientras que el otro como coprocesador multimedia a gran escala, no me gusta llamar al Larrabee GPU desde el momento que es mucho más versátil que una GPU, tampoco GPGPU debido a que dicha palabra es una contradicción en si misma.

48 núcleos en la nube

Este procesador compuesto por la friolera de 48 núcleos no se trata de un procesador comercial sino de un experimento de Intel del que solamente se fabricaran 100 copias, sus caracteristicas son las siguientes:

  • Velocidades de reloj entre 1Ghz y los 3Ghz, hay 8 velocidades de reloj posibles.
  • Consumo desde los 25W a los 125W.
  • El procesador tiene 384KB de memoria compartida para comunicarse entre ellos.
  • 24 nodos.
  • Cada nodo tiene 2 núcleos y 1 “router”
  • Fabricado a 40nm
La arquitectura del procesador es curiosa, ya que viene a imitar a nivel de chip lo que existe en los superordenadores compuestos por decenas de procesadores comunicados entre si a través de “routers”, se puede decir que Intel lo que ha buscado con el diseño de este procesador es colocar un DataCenter en un solo chip. No sería de extrañar que cada uno de los procesadores soportara virtualización pero en este caso lo que más interesa personalmente es la forma en la que están comunicados estos procesadores entre ellos puesto que este era el problema que Intel tenía con el Larrabee y posiblemente hayan solucionado el problema del anillo de memoria del procesador con la idea del router+memoria para mensajes.
Intel Larrabee
Después de años en que Intel ha tenido un montón de problemas parece ser que la versión que han presentado al final de la revisión actual del Larrabee parece ser que el modelo que tienen terminado esta basado en las caracteristicas técnicas del prototipo mostrado en el 2007, solo que con la diferencia de estar fabricado a 45nm y con cambios en el sistema de memoria interno y el ancho de banda que lo hacen más eficiente.
Esta es la arquitectura general del Larrabee. Como ya he hablado varias veces de la arquitectura lo que me interesa es especular un poco sobre como han solucionado el problema del anillo de memoria en el caso del Larrabee y como he dicho antes creo que el procesador prototipo de 48 núcleos para la computación en la nube esta muy relacionado con ello.
Supongamos que la cache L2 no se encuentra en el núcleo sino que fuera de ella en una matriz de memoria donde cada 256K se encuentra conectada a un “router” que permite hacer dos cosas, por un lado el acceso de cada uno de los núcleos a su cache L2 privada y por otro lado que los procesadores puedan pasarse mensajes entre si a través de sus “routers”. Intel no ha mencionado nada sobre como se comunican los diferentes núcleos, quizás este equivocado pero creo que la presentación simultánea en el SC09 de ambos procesadores no es casual.
Lo curioso es que la versión inicial del Larrabee que Intel ya tiene acabada es la misma versión que las especificaciones iniciales que se dieron en 2007 con 16 núcleos, una velocidad de reloj de 2Ghz, una potencia de calculo de 1 TFLOP y unos 150W de consumo. La gracia es que muchos lo compararan con la potencia bruta de la arquitecturaEvergreen de AMD para decir que el Larrabee esta desfasado y solamente alcanza 1 TFLOP, lo que no tienen en cuenta toda esta gente es que el Larrabee es un procesador de propósito general con un nivel de flexibilidad que a día de hoy no tiene ninguna GPU, es por eso que llamar al Larrabee GPU o GPGPU es una autentica perdida de tiempo, cuando más bien se trata de un Stream Processor de propósito general.
Existe otro Stream Processor de propósito general llamado Broadband Engine que es la primera iteración de la arquitectura Cell y se encuentra en Playstation 3, la potencia en coma flotante de este procesador es de unos 204.8 GFLOPS, una velocidad de reloj de 3.2 Ghz y en su versión de 45nm tiene un consumo aproximado de 81W aproximadamente. Lo que realmente nos interesa es el consumo por vatio dado a que es lo realmente importante en un entorno cerrado como es una consola de videojuegos.
En lo que a coma flotante de simple precisión se refiere (donde tanto el Cell como el Larrabee es conde apuntan más alto) el Cell nos da una potencia de 2.52 GFLOPS/W mientras que el Larrabee 6.82 GFLOPS/W, no es de extrañar que Sony al final haya descartado completamente al Larrabee.
Espera un momento Urian, ¿no decías que el Larrabee es la GPU? Entonces a que viene compararlo con el Cell.
Por el hecho de que empiezo a pensar que Sony tomara este diseño pero no con 4 Larrabee sino con 2 para PS4:
Sony no adoptara la versión de 16 núcleos y 45nm sino una que posiblemente tenga un proceso de fabricación de unos 22nm, lo que no solamente llevaría una reducción del coste del chip sino también del consumo. Dos Larrabee de 24 núcleos y a 2.5Ghz darían en conjunto una potencia de casi 4 TFLOPS para todo el sistema en 2012. En la presentación de Tim Sweeney, CEO de Epic Games, llamada The End of GPU Roadmap este menciona por un lado sistemas de 4 TFLOPS y por otro lado la aparición de unidades SIMD16, lo que viene a cuadrar mucho con lo que estoy diciendo de la posible configuración de Sony para el Larrabee.
En el caso de la memoria, si PS3 tiene un total de 512MB repartidos en 256+256 y originalmente fue lanzada a un proceso de 90nm, el máximo que podemos esperar por cada uno de los Larrabee son 4GB de memoria, haciendo un total de 8GB de memoria RAM para todo el sistema. Para terminar se seguirá usando BluRay y el disco duro del sistema podría hasta 1 Terabyte.
Se ha de tener en cuenta ante todo esto que Sony es una empresa tecnológica, su visión es que los videojuegos están en el mundo de los avances tecnológicos  y por esto están tomando este camino.
Controversia Larrabee vs GPU DX11
Un amigo me comento el otro día si es una buena idea colocar 2 Larrabee y no 1 Larrabee+GPU DX11 en lo que al sistema se refiere y he de decir que si hay algo que echo a faltar cuando se habla de aspectos técnicos es la detección de colisiones, verdadero cuello de botella de las consolas de videojuegos, y se habla demasiado de las arquitectura gráficas que tienen dichos sistemas sin tener en cuenta el enorme desequilibrio entre la CPU y la GPU.
Dicho desequilibrio provoca que procesadores gráficos capaces de llegar a una cifra determinada en bruto, vean sus cifras trituradas como mínimo hasta una cuarta parte debido al problema de la detección de colisiones. No merece la pena sacar una GPU de una potencia descomunal para que luego la detección de colisiones desde la CPU se cebe con ella, es por eso que un sistema equilibrado por ambos bandos como es el del doble Larrabee es mucho mejor que la otra solución.
Sabemos que otro salto gráfico igual de grande que el que hemos visto generación tras generación no es posible debido a que no existe demanda como para soportar dichos costes, por lo que un sistema personal de videojuegos es una perdida de tiempo, no obstante no lo es un Home Server con varios sistemas Playstation virtualizados al mismo tiempo dentro de un hogar, quizas Sony tome una virtualización de 4 sistemas en una misma casa, una especie de mininube casera.
Cada televisor HD vendría a tener una especie de terminal de bajo coste (con las que Sony recuperaría el dinero) a la que se podrían conectar diversos periféricos y controladores, dicha terminal tendría acceso al Home Server PS4 que hay en la casa, el cual le otorgaría parte de la potencia para reproducir los juegos de la consola que estén almacenados en el disco duro de esta, así como todo tipo de contenido de diversos medios y todo ello para diversos usuarios al mismo tiempo.
El planteamiento de una consola como Home Server no es nuevo para Sony, se lo estuvieron planteando seriamente de crear una especie de nube a partir de la idea original del Cell basada en un Broadband Engine masivo de 4 núcleos a 4Ghz, dicho procesador hubiera sido imposible a nivel doméstico pero no a nivel de nube a distancia, pero la poca velocidad de las redes alrededor del mundo hicieron que Sony desestimara completamente la idea que podría recuperar con Playstation 4.

17 Comentarios

  1. TacticsCosplay

    preparados!? amigos, esto va a costar igual que un core i9 “gulfftown – nuevos macPRO” no se como SONY se va a librar de las mega perdidas billonarias produciendo las PS4, pero si la falla al igual que ps3, pueden decirle bye bye a toda la rama sony, pero bueno, es casi imposible que le puedan ganar a un i7, Xeon, y menos a un i9 en ordenadores caseros, pero veremos cuanto $$$ la siguente ps4…

    suerte!!!

    Reply

  2. Me encantan tus aportaciones sobre el hipotetico hardware de PS4, podrias hacer algún articulo o comentario sobre lo que especulas puedan llegar a mover estos bichos en formato soft?

    Que llegaremos a ver en la próxima generación? hasta donde se llegará?

    Suerte y gracias por todo el curro que te pegas amigo.

    Reply

  3. Pues al parecer Larrabee no va a salir como producto para consumidores:

    http://www.semiaccurate.com/2009/12/04/intel-kills-consumer-larrabee-focuses-future-variants/

    Reply

Leave a Reply