Заказчики: Суперкомпьютерный центр имени Лейбница (Leibniz-Rechenzentrum, LRZ) Продукт: Проекты суперкомпьютерных платформ Второй продукт: Intel Xeon Scalable Дата проекта: 2017/12 — 2021/06
|
Технология: Суперкомпьютер
Технология: Процессоры
|
Содержание |
2021: Вторая фаза работ с суперкомпьютером SuperMUC-NG
18 июня 2021 года стало известно о том, что Lenovo Infrastructure Solutions Group, Intel и Суперкомпьютерный центр Лейбница (LRZ) при Баварской академии естественных и гуманитарных наук объявили о второй фазе работ с суперкомпьютером SuperMUC-NG. Система будет обеспечивать интегрированные решения для пользователей LRZ, используя искусственный интеллект для реализации продвинутых симуляций, моделирования и анализа данных.
Как сообщалось, благодаря финансированию со стороны Свободного государства Бавария и Федерального министерства образования и научных исследований Германии, в рамках второй фазы компьютер SuperMUC-NG, который входит в состав Суперкомпьютерного центра Гаусса (GCS), будет оптимизирован и сохранит статус одного из быстрых и энергоэффективных суперкомпьютеров в мире.
С момента запуска первой фазы специалисты используют суперкомпьютер SuperMUC-NG не только для традиционных симуляций и моделирования. Компьютер помогает автоматизировать распознавание изображений и выявление закономерностей при наблюдении за планетами, а также анализировать климатические данные со спутников, медицинских изображений и документов о состоянии здоровья, демографических данных. В связи с использованием SuperMUC-NG в этих проектах, вырос запрос на аналитику данных, машинное обучение и скорость работы с памятью.
Чтобы удовлетворить этот запрос и обеспечить исследователям необходимую поддержку, SuperMUC-NG дополнят процессорами Intel Xeon Scalable следующего поколения (кодовое название Sapphire Rapids), а также графическими HPC-процессорами на базе HPC-архитектуры Xe под кодовым названием Ponte Vecchio.
На втором этапе также будет введено в работу распределенное асинхронное объектное хранилище (DAOS) с процессорами Intel Xeon Scalable 3-го поколения (кодовое название Ice Lake), которые интегрированы в платформу Lenovo ThinkSystem SR630 V2. DAOS дает возможность хранения 1 петабайта данных и обеспечивает надлежащую пропускную способность для больших объемов данных. Архитектура системы позволяет справляться с нагрузками, которые предполагают необходимую масштабируемость, вычисления и большие объемы данных, а также работу с приложениями искусственного интеллекта. В целом, вычислительные узлы SuperMUC-NG во второй фазе будут обеспечивать в четыре раза большую производительность на ватт, чем это было во время первой фазы (по тесту High Performance Linpack).
Суперкомпьютерный центр Лейбница – важный партнер как для Lenovo, так и для Intel. Вторая фаза — это возможность поделиться нашим опытом в том, что Lenovo называет Exascale for Everyscale, то есть в решениях, использующих экзафлопсные технологии в кластерах всех размеров, и предоставить исследователям специализированные ресурсы, необходимые для ускорения работы над проектами. рассказал Скотт Тиз, вице-президент подразделения HPC и ИИ в Lenovo Infrastructure Solutions Group |
Оптимизация второго этапа позволят SuperMUC-NG выполнять дополнительные задачи при максимально возможном энергосбережении. Важный фактор – интеграция 240 вычислительных узлов Intel в Lenovo ThinkSystem SD650-N V2 с использованием технологии водяного охлаждения Neptune и подключением к DAOS через сеть. Технология прямого водяного охлаждения Neptune от Lenovo отводит около 90 % тепла от вычислительной системы, снижая общее энергопотребление и оптимизируя общую эффективность. Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Кроме того, компоненты для второй фазы работы SuperMUC-NG будут производиться в Европе, на специализированном заводе Lenovo в Венгрии, что позволит дополнительно снизить негативное воздействие на окружающую среду в цепочке поставок.
Наша работа с Lenovo и другими партнерами по интеграции возможностей ИИ в рамках данной фазы поможет центру в решении этой задачи и позволит обеспечить исследователей всем необходимым для достижения результатов в своих областях. поведал профессор Дитер Кранцльмюллер, директор LRZ |
LRZ получит систему хранения данных DAOS в IV квартале 2021 года, а вычислительная система станет доступна во II квартале 2022 года. Команда LRZ подготавливает своих пользователей к оптимизации второй фазы. Для этого оказывается поддержка и проводятся консультации по адаптации и оптимизации кодов и алгоритмов ИИ, а исследователям предоставляется доступ к системам GPGPU, предназначенным для работы с приложениями ИИ. В программу обучения LRZ также входят курсы по машинному и глубокому обучению.
2017: Планы построить вычислительный комплекс следующего поколения
В конце декабря 2017 года компании Lenovo и Intel объявили о планах построить вычислительный комплекс следующего поколения для суперкомпьютерного центра имени Лейбница (LRZ) Баварской академии наук в Мюнхене, Германия.
Задачи проекта
Являясь одним из ведущих европейских вычислительных центров для профессионалов в научных, исследовательских и академических сообществах, LRZ не только управляет экспоненциально растущими объемами данных, но и отвечает за оперативную обработку и анализ этих данных, чтобы ускорить реализацию исследовательских проектов по всему миру. После завершения строительства в конце 2018 года суперкомпьютер SuperMUC-NG будет поддерживать LRZ в исследованиях по целому ряду научных дисциплин: астрофизике, гидродинамике, биологии, медицине и другим. Он обеспечит предоставление доступных, безопасных и энергоэффективных высокопроизводительных (HPC) сервисов, которые используют передовые технологии, оптимизированные для работы с широким спектром научных дисциплин.
Ожидается, что по итогам проекта LRZ получит доступ к большей вычислительной мощности, но благодаря инновационной технологии водяного охлаждения сможет значительно сократить энергозатраты.
Решение в основе проекта
SuperMUC-NG представляет собой комплексное решение, которое обеспечивает высокую производительность для ускорения выполнения критически важных исследовательских проектов. Система обеспечит вычислительную мощность в 26,7 петафлопс, реализованную с использованием более 6500 вычислительных узлов Lenovo Think System SD650 следующего поколения, процессоров Intel Xeon Platinum с технологией Intel Advanced Vectir Extensions (Intel AVX 512) и архитектуры Intel Omni-Path. Система будет поддерживать интеграцию с Lenovo Intelligent Computing Orchestrator (LiCO), программным обеспечением для управления вычислительным кластером с интуитивно понятным графическим интерфейсом для ускоренной разработки приложений HPC, AI и поддержки облачных сред. Система позволит исследователям LRZ виртуализировать, обрабатывать огромное количество данных и оперативно делиться результатами с коллегами.
Ожидаемый эффект
Поддержание инфраструктуры высокопроизводительных вычислений связано с крайне высокими операционными затратами. Благодаря технической оптимизации Intel, а также использованию технологий водяного охлаждения от Lenovo, которая отводит выделенную тепловую энергию и поддерживает оптимальную температуру в системе, суперкомпьютер SuperMUC-NG позволит сократить расходы на сопровождение. По утверждению Lenovo, в сочетании с программным обеспечением Lenovo Energy Aware Run-Time (EAR), которое динамически контролирует мощность системной инфраструктуры во время работы приложений, комплексная технология водяного охлаждения Lenovo обеспечивает LRZ на 45% большую экономию электроэнергии по сравнению с аналогичной системой воздушного охлаждения. Предполагается, что эти инновации в области энергоэффективности помогут еще больше снизить количество выделяемого центром углерода, а также совокупную стоимость владения.
Кроме того, ожидается, что после окончания работ система SuperMUC-NG в суперкомпьютерном центре имени Лейбница войдет в отраслевой список TOP500.