Home / High-Tech / NVIDIA annonce son GP100 avec 3840 coeurs CUDA et 16Go de HBM2

NVIDIA annonce son GP100 avec 3840 coeurs CUDA et 16Go de HBM2

Article mis à jour le 17 août 2016 à 11 h 02 min

On en aura eu des pronostics sur Pascal depuis l’annonce de cette nouvelle gamme gravée en 16nm FinFET et remplaçant Maxwell 2 chez NVIDIA. Mais l’attente est terminée, le caméléon venant de dévoiler son GP100 directement sur son devblog. N’attendez pas une carte graphique grand public pour tout de suite par contre, c’est dans la Tesla P100 destinée aux serveurs que la puce s’affichera.

nvidia gp100 tesla p100

Le GP100 sur une Tesla P100

Au programme de ce GP100, on aura 6 GPC comprenant un maximum de 60 SM (Streaming Multiprocessor), chaque SM  ayant chacun le droit à 64 coeurs CUDA et 4 TMU (Texture Mapping Unit), soit un total de 3840 coeurs CUDA et 240 TMU pour la puce à son plein potentiel. Côté VRAM, on aura huit contrôleurs 512-bit pour un bus mémoire de 4096-bit et jusqu’à 16Go de HBM2 (pour une bande passante maximale théorique de 720Go/s). Dans la Tesla P100, 56 SM sont actifs pour un total de 3584 coeurs CUDA. Comme le montre le tableau qui suit, Maxwell avait abandonné la course au FP64 (calcul double précision), se concentrant sur le FP32 (calcul simple précision),  mais Pascal revient à la charge avec un rapport de 2:1 (FP32:FP64) profitant de la nouvelle finesse de gravure et des dernières avancées technologiques. Cela permettra d’oublier le 3:1 de Kepler et surtout le risible 32:1 de Maxwell.

Tesla K40 Tesla M40 Tesla P100
GPU GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal)
SM 15 24 56
TPC 15 24 28
Coeurs CUDA FP32 / SM 192 128 64
Coeurs CUDA FP32 / GPU 2880 3072 3584
Coeurs CUDA FP64 / SM 64 4 32
Coeurs CUDA FP64 / GPU 960 96 1792
Freq. Base 745 MHz 948 MHz 1328 MHz
Freq. Boost 810/875 MHz 1114 MHz 1480 MHz
FP64 GFLOPs 1680 213 5304
TMU 240 192 224
Bus mémoire 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2
VRAM max Jusqu’à 12 Go Jusqu’à 24 Go Jusqu’à 16 Go
Cache L2 1536 ko 3072 ko 4096 ko
TDP 235 Watts 250 Watts 300 Watts
Transistors 7.1 milliards 8 milliards 15.3 milliards
Taille du die 551 mm² 601 mm² 610 mm²
Gravure 28-nm 28-nm 16-nm

Ca annonce du gros gain et on n’en est pas mécontent. Le caméléon exploite les forces de Maxwell en profitant du passage de la gravure 28nm au 16nm FinFET pour corriger le tir en double précision. Les fréquences base/boost sont revues à la hausse et la VRAM a le droit à un gros level up avec l’arrivée de la HBM2. Le point qui pourra faire tiquer est le TPD de 300W, ce qui laisse présager du lourdingue chez les constructeurs partenaires avec gros effort mercatique sur les appellations des dissipateurs à venir. Reste maintenant à voir comment NVIDIA va décliner sa gamme avec quel type de GP100 sur le très haut de gamme, et le GP104 sur le haut de gamme, puisqu’on sait que la HBM2 sera limitée au très haut de gamme et que les GDDR5 et GDDR5X iront peupler les cartes qui suivront. Dans tous les cas, Pascal (tout comme Polaris dans une moindre mesure en l’absence de Vega jusqu’à début 2017) mérite que les joueurs attendent pour changer de GPU !

Sébastien T.

Passionné depuis toujours par l’informatique et les jeux vidéos, je transforme ma passion en expertise. J’utilise quotidiennement les outils et systèmes Microsoft. Je ne délaisse pas mon côté ouvert, notamment via l’utilisation des OS Debian et Archlinux.

A voir aussi

Un milliard d'Instagrammers

Un milliard d’Instagrammers

Il y a désormais un milliard de personnes inscrites sur Instagram. Et combien de selfies …

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Rapport de faute d’orthographe

Le texte suivant sera envoyé à nos rédacteurs :