Lenovo amplía su sistema HPC líder en el Centro Leibniz de Supercomputación
Lenovo Infrastructure Solutions Group, Intel y el Centro Leibniz de Supercomputación , LRZ, de la Academia de Ciencias y Humanidades de Baviera, han anunciado el comienzo de la segunda fase del superordenador SuperMUC-NG del LRZ.
El sistema proporcionará soluciones integradas de alto rendimiento para la comunidad de usuarios del LRZ, utilizando inteligencia artificial para implementar simulaciones, modelado y análisis de datos avanzados que acelerarán la investigación y ayudarán a resolver los mayores retos de la humanidad.
Financiado por el Estado Libre de Baviera y el Ministerio Federal Alemán de Educación e Investigación, esta segunda fase aborda la expansión del SuperMUC-NG, parte del Centro Gauss de Supercomputación (GCS), para continuar siendo uno de los superordenadores más rápidos y con mayor eficiencia energética del mundo.
Soluciones integradas con IA
Desde que se inició la fase uno del SuperMUC-NG, los investigadores han utilizado el superordenador no solo para la simulación y modelado tradicionales, sino también para automatizar el reconocimiento de imágenes y patrones en observaciones planetarias, datos climáticos de los satélites, imágenes médicas y registros de salud, y datos demográficos. El éxito en la utilización del SuperMUC-NG en estos proyectos ha aumentado la demanda de alto rendimiento y mayor velocidad para el análisis de datos y el aprendizaje automático.
Para dar cabida a esta demanda y asegurar que los investigadores tienen lo que necesitan, el SuperMUC-NG se mejorará con procesadores Intel Xeon Scalable de nueva generación (internamente conocidos como «Sapphire Rapids») y las próximas GPU HPC de Intel basadas en la arquitectura HPC Xe, conocida internamente como «Ponte Vecchio».
Esta segunda fase también utilizará almacenamiento de objetos asíncrono distribuido (DAOS), aprovechando la 3a generación de los procesadores Intel Xeon Scalable (conocidos internamente como «Ice Lake») integrados en la plataforma Lenovo ThinkSystem SR630 V2. DAOS proporciona 1 petabyte de almacenamiento de datos y hará posible obtener resultados más rápido de grandes volúmenes de datos, mientras que la arquitectura del sistema ofrece aplicaciones de inteligencia artificial y cargas de trabajo con gran densidad de datos y computación y altamente escalables. En general, los nodos de computación del SuperMUC-NG de esta segunda fase ofrecerán un rendimiento por vatio (High Performance Linpack) cuatro veces mayor que la fase uno.
«El Centro de Supercomputación de Leibniz ha sido desde hace tiempo un importante socio de innovación para Lenovo e Intel. Esta segunda fase es una emocionante oportunidad de compartir nuestra experiencia en lo que en Lenovo llamamos soluciones de «exaescala para cualquier escala» que utilizan tecnologías avanzadas de exaescala en clústeres de cualquier tamaño y ofrecen a los investigadores con los recursos especializados que necesitan para acelerar los proyectos», comenta Scott Tease, vicepresidente de IA y HPC en Lenovo Infrastructure Solutions Group. «Mediante la implementación de nuestro sistema de refrigeración mediante agua caliente Neptune y un sistema inteligente integrado para inteligencia artificial y aprendizaje profundo, LRZ continuará siendo un referente en tecnologías avanzadas durante muchos años, y establecerá nuevos criterios para la investigación y el desarrollo».
Garantizando un enfoque sostenible
Las mejoras realizadas en esta segunda fase asegurarán que el SuperMUC-NG es ahora capaz de realizar más tareas con la mayor eficiencia energética posible. La clave está en la integración de 240 nodos de computación de Intel en Lenovo ThinkSystem SD650 con la refrigeración mediante agua caliente de Neptune y conectados al sistema de almacenamiento DAOS a través de una red de alta velocidad. La innovadora tecnología de enfriamiento por agua de Lenovo elimina aproximadamente el 90 % del calor del sistema, reduciendo el consumo energético general y aumentando significativamente la eficiencia general y, en definitiva, permitiendo que los procesadores trabajen al máximo rendimiento.
Además, los componentes para la fase dos del SuperMUC-NG se fabricarán en Europa, en las nuevas instalaciones de Lenovo en Hungría, para mejorar aún más la huella ecológica de la cadena de suministro del proyecto.
«Proporcionar recursos y servicios que ayuden a los investigadores a acelerar sus proyectos es la base de todo lo que hacemos en el LRZ», declaró el profesor Dieter Kranzlmüller, director del LRZ. «Nuestro trabajo con Lenovo y otros partners para integrar funcionalidades avanzadas de IA en esta nueva fase ayudará al centro a alcanzar esta meta, y asegura que los investigadores reciben lo que necesitan para sobresalir en sus campos científicos. Y no solo eso, sino que con la tecnología de refrigeración mediante agua caliente podemos proporcionar estas mejoras en un modo lo más sostenible y con la mayor eficiencia energética posible».
Comienzo de la fase dos
El LRZ recibirá el sistema de almacenamiento DAOS en el último trimestre de 2021, y el sistema de computación le seguirá durante el segundo trimestre de 2022. El equipo del LRZ están preparando a su comunidad de usuarios para las mejoras de la fase 2 ofreciendo asistencia y asesoría para adaptar y optimizar los códigos y algoritmos de IA, y proporcionando acceso a los investigadores a los sistemas de GPU especializados en aplicaciones de IA. El programa de formación del LRZ también ofrece una amplia variedad de cursos sobre aprendizaje automático y profundo, que muestran a los usuarios cómo pueden adaptar sus algoritmos actuales o desarrollar y formar los suyos propios.