Fujitsu va fork arm une ligne de puces de serveur pour chasser les nuages
En ce qui concerne les jetons, il y a une grande différence entre un kicker et un fork.
Le kicker est un successeur qui implémente une architecture et une conception et qui inclut des améliorations de la microarchitecture pour améliorer les performances du cœur (cœur dans le double sens de ce mot en ce qui concerne les processeurs) ainsi que tirer parti des processus de fabrication de puces (et maintenant de l'emballage) pour faire évoluer davantage les performances dans un socket.
La bifurcation est une sorte de divergence, littéralement une bifurcation sur la route qui fait toute la différence comme pourrait le dire Robert Frost. Il peut y avoir une compatibilité - comme les différences entre les gros et les petits cœurs sur les marchés Arm, Power et maintenant X86. Intel et AMD vont mettre en œuvre cette année des stratégies de gros-petit cœur dans leurs gammes de processeurs de serveur, AMD dans ses Epycs "Bergamo" et Intel dans ses SP Xeon "Sierra Forest". Intel a des puces Atom et Xeon compatibles X86 et maintenant des cœurs E et P depuis une décennie et demie, donc ce n'est pas précisément nouveau pour le plus grand fabricant de processeurs au monde.
Et ce genre de fourche est ce que nous pensons que le fabricant japonais de processeurs et de systèmes Fujitsu fera avec ses futurs processeurs "Monaka" et "Fugaku-Next", dont le premier a été révélé récemment et dont le dernier est allé sur les tableaux blancs avec puanteur marqueurs - eh bien, c'était le début d'une étude de faisabilité par le ministère japonais de l'Éducation, de la Culture, des Sports, des Sciences et de la Technologie, avec Éducation, Culture, Sports, Science étant une variable X et constituant ainsi l'abréviation MEXT - de retour dans Août 2022.
Fujitsu est un partenaire étroit du RIKEN Lab, le principal centre de recherche HPC du pays, depuis la conception du supercalculateur "Keisuko" K de 1,2 milliard de dollars, qui a commencé en 2006 pour franchir la barrière des 10 pétaflops en virgule flottante de précision 64 bits. traitement et qui a été livré en 2011. La conception du supercalculateur "Fugaku" de 910 millions de dollars et 513,9 pétaflops, qui a vu Fujitsu passer de son architecture Sparc64 à une architecture Arm personnalisée à turbocompresseur vectoriel, a commencé en 2012. Le système Fugaku a été livré en juin 2020, était pleinement opérationnel en 2021 et les travaux sur le système Fugaku-Next ont commencé un an plus tard, dans les délais prévus.
Selon la feuille de route publiée par Fujitsu et RIKEN Lab au SC22 en novembre dernier, il est prévu que la machine Fugaku-Next soit opérationnelle "vers 2030", et ce timing est important (nous y reviendrons dans un instant).
Voici les idées de recherche abordées et la technologie incarnée dans Fugaku-Next et qui s'attaque :
Toutes les idées que vous attendez d'une machine installée dans six ou sept ans sont là - un mélange de HPC traditionnel et d'IA et l'ajout d'informatique quantique et neuromorphique. Les superordinateurs du futur seront sans aucun doute puissants, mais il serait peut-être préférable de l'appeler "flux informatique" plutôt que "super informatique" car il y aura un mélange de différents types de calcul et d'applications comprenant des flux de travail de différentes applications plus petites travaillant de concert. , soit en série, soit en boucles itératives.
De manière significative, Fujitsu et RIKEN mettent l'accent sur "la compatibilité avec l'écosystème existant" et "les systèmes hétérogènes connectés par des réseaux à haut débit". Fujitsu indique en outre que l'architecture du système Fugaku-Next utilisera un boîtier émergent à haute densité, disposera d'accélérateurs économes en énergie et hautes performances, d'une faible latence et d'une mémoire à large bande passante.
Si l'histoire est un guide, et avec les superordinateurs japonais, c'est absolument le cas, alors une machine est installée dans l'année précédant sa mise en service, ce qui signifie que Fugaku-Next sera installé "vers 2029" environ.
Gardez tout cela à l'esprit lorsque nous examinons le processeur "Monaka" sur lequel Fujitsu travaille sous les auspices de la New Energy and Industrial Technology Development Organization (NEDO) du gouvernement japonais. Fin février, Fujitsu, NEC, AIO Core, Kioxia et Kyocera ont tous été sollicités pour travailler sur un traitement et des interconnexions de centres de données plus économes en énergie. Plus précisément, l'effort NEDO veut avoir des processeurs de serveur économes en énergie et des SmartNIC boostant la photonique.
Dans cet effort, il semble que Fujitsu fabrique un dérivé du processeur A64FX Arm au cœur du système Fugaku, mais les gens confondent cela avec le fait que Monaka est le processeur de suivi qui sera utilisé dans le système Fugaku-Next. .
C'est précisément ce qui a été dit : "Fujitsu affinera encore cette technologie et développera un processeur à faible consommation d'énergie qui pourra être utilisé dans les centres de données verts de nouvelle génération."
Voici les tâches assignées aux partenaires NEDO :
Le processeur Monaka est prévu pour 2027 et vise à fournir des performances supérieures à une consommation d'énergie réduite :
Comment cela se produira n'est pas clair, mais l'implication est qu'il s'agira d'un processeur de serveur basé sur Arm, mais optimisé pour les hyperscalers et les constructeurs de cloud et non pour les centres HPC et AI. Cela devrait signifier plus de cœurs et moins de traitement vectoriel par rapport à A64FX (ou plutôt, le kicker à A64FX dans le système Fugaku-Next) et très probablement l'ajout d'unités mathématiques matricielles de faible précision pour l'inférence IA. Quelque chose conceptuellement comme les SP Xeon "Sapphire Rapids" d'Intel et les futurs processeurs AMD Epyc avec des moteurs Xilinx DSP AI en termes de capacités, mais avec un noyau Arm et un accent sur l'efficacité énergétique, des performances par watt beaucoup plus élevées.
En fait, alors que Fujitsu se tourne vers 2027, lorsque Monaka entrera dans les systèmes de production, il dit qu'il sera en mesure de fournir 1,7 fois les performances des applications et 2 fois les performances par watt du processeur "Another - 2027", quel qu'il soit.
La partie déroutante, qui a amené certaines personnes à croire que Monaka est le processeur qui sera le moteur de l'A64FX et qui sera utilisé dans le système Fugaku-Next, est cette phrase : "Non seulement en augmentant les charges de travail HPC traditionnelles, mais en fournissant également des performances élevées pour Charges de travail d'IA et d'analyse de données."
Mais voici la chose que nous soulignons souvent : le HPC consiste à obtenir des performances à tout prix, et les hyperscalers et les constructeurs de cloud doivent obtenir les meilleures performances raisonnables au coût le plus bas et à la plus faible consommation.
Ce sont des points de conception très différents, et bien que vous puissiez créer du HPC dans le cloud, vous ne pouvez pas créer un cloud optimisé pour l'exécution d'applications Web et vous attendre à ce qu'il fonctionne bien sur la simulation et la modélisation HPC ou même sur les charges de travail de formation à l'IA. Et vice versa. Un cluster HPC ne serait pas optimisé pour un faible coût et une faible consommation d'énergie et serait un mauvais choix pour les applications Web. Vous pouvez vendre de vrais systèmes HPC sous un modèle cloud, bien sûr, en mettant InfiniBand et de gros nœuds avec beaucoup de GPU dans 20 % des nœuds d'un cloud, mais cela ne sera jamais aussi bon marché que l'infrastructure cloud ordinaire, qui a ce point de conception différent.
Le Fugaku-Next étant un supercalculateur hétérogène de style "ordinateur de flux", il est très raisonnable de penser qu'un kicker du processeur Monaka Arm destiné à l'infrastructure cloud pourrait se retrouver dans le système Fugaku-Next. Mais ce n'est pas la même chose que de dire qu'il n'y aura pas de successeur à A64FX, dont les chercheurs ont déjà montré qu'il peut voir ses performances multipliées par 10 d'ici 2028 avec d'énormes quantités de cache L3 empilé et des réductions de processus sur les cœurs Arm. C'est sans améliorations architecturales sur les cœurs A64FX, et vous savez qu'il y aura des ajustements ici.
Nous pensons qu'il est beaucoup plus probable qu'un successeur de Monaka, que nous attendrions en 2029 compte tenu d'une cadence de processeur de deux ans, puisse être inclus dans Fugaku-Next, mais qu'il y a très peu de chances qu'il soit le seul processeur du système. – à moins que les réservoirs économiques et MEXT et NEDO ne doivent partager l'argent.
La Grande Récession a gâché le projet original "Keisuko", qui avait Fujitsu faisant un processeur scalaire, NEC faisant un processeur vectoriel et Hitachi faisant l'interconnexion de tore que nous connaissons maintenant sous le nom de Tofu. NEC et Fujitsu se sont retirés parce que le projet était trop cher et qu'ils ne pensaient pas que la technologie pourrait être suffisamment commercialisée pour couvrir les coûts. Fujitsu a repris le projet et l'a livré avec brio, mais nous soupçonnons que gagner de l'argent avec Sparc64fx et A64FX a été difficile.
Mais, avec le soutien du gouvernement, comme Fujitsu l'a fait grâce à sa relation avec RIKEN, et le désir du Japon d'être indépendant en ce qui concerne son supercalculateur le plus rapide, rien de tout cela n'a d'importance. Ce qui était vrai en 2009 concernant la valeur de l'indépendance de la chaîne d'approvisionnement (que de nombreux pays ont ignorée pour des raisons de facilité et de coût réduit des supercalculateurs) est encore plus vrai en 2029.
Fujitsu n'est pas précis, et Satoshi Matsuoka, directeur du RIKEN Lab et professeur à l'Institut de technologie de Tokyo, a commenté les informations selon lesquelles Monaka était utilisé dans la machine Fugaku-Next dans son fil Twitter : "Rien n'a encore été décidé si Monaka alimentera #FugakuNEXT ; c'est certainement l'un des éléments techniques à l'étude." Mais il a également ajouté ceci : "Puisque #HPC (avec IA, BD) n'est plus un marché de niche, le but n'est pas de créer une machine à l'échelle singleton ***, mais des plates-formes S&T qui s'étendront sur les SC, les clouds, etc. À cette fin, la généralité SW et la pénétrabilité du marché, en particulier pour les hyperscalaires, sont indispensables. Nous nous associerons à des fournisseurs partageant la même vision."
Nous pensons qu'il y aura deux processeurs Arm utilisés dans Fugaku-Next : un adapté à l'inférence de l'IA et aux charges de travail génériques du processeur et un réglé pour effectuer une simulation HPC et une formation à l'IA vraiment difficiles. Appelez-les A64FX2 et Monaka2 si vous voulez. La seule façon d'avoir une puce est si le budget l'exige, comme cela s'est produit avec la machine K.
Mais, ce ne sont certes que des spéculations, et nous devrons attendre et voir.
Avec les faits saillants, les analyses et les histoires de la semaine directement de nous dans votre boîte de réception, sans rien entre les deux.Inscrivez-vous maintenant