The post has been translated automatically. Original language: Russian
Swiss Higher Technical School of Zurich (ETH Zurich) held the official launch ceremony of the Alps supercomputer at the Swiss National Supercomputing Center (CSCS) in Lugano. The system built by HPE has already taken the sixth place in the latest TOP500 rating and has an established FP64 performance of 270 Pflops (theoretical peak is 354 Pflops). By November, the remaining modules of the machine will be put into operation, and its maximum performance will be about 500 Pflops.
The June TOP500 ranking featured a section of 2,688 HPE Cray EX254n nodes with the "fantastic four" NVIDIA Quad GH200. To be more precise, this is still an "old" version of the accelerator with the H100 (96 GB HBM3), a 72-core Arm Grace processor and 128 GB LPDDR5x - a total of 10,752 Grace Hopper. This section consumes 5.2 MW and is in 14th place in the Green500. Nodes, of course, use the SOE.
This is the main, but not the only section of the supercomputer. Back in 2020, HPE deployed 1024 dual processor nodes with 64-core AMD EPYC 7742 (Rome) and 256/512 GB of RAM. Its performance is 4.7 Pflops. In addition, the Alps includes 144 nodes with one 64-core AMD EPYC, 128 GB of RAM and four NVIDIA A100 (80 or 96 GB HBM2e).

RAM and four AMD Instinct MI250X (128 GB HBM2e) and 128 nodes with four AMD Instinct MI300A hybrid accelerators. Most of the nodes will be connected by the HPE Slingshot-11: 200G interconnect-connection to a node or accelerator. A more precise configuration of the system will be revealed in November.
Lustre storage for the future machine was updated last year. The main storage is the Cray ClusterStor E1000 with a Slingshot-11 connection. Thus, 100 Pbytes of usable HDD capacity (8480 × 16 TB) with a bandwidth of 1 TB/s (300 thousand IOPS for writing, 1.5 million IOPS for reading) and 5 Pbytes of SSD, as well as backup capacities, were added. Two tape libraries with a volume of 130 PB each are responsible for archival storage.

A feature of the system is its geo-distribution (in fact, the nodes are located in four places) and a cloud-based usage model. Thus, the MeteoSwiss meteorological service of the country has received a dedicated virtual cluster at its disposal, which has already made it possible to switch to using a higher-resolution meteorological model that better reflects the difficult terrain of Switzerland. In addition, for safety reasons, some of the Alps nodes are located on the territory of the Federal Polytechnic School of Lausanne (EPFL).
Alps replaces the Piz Daint supercomputer (Cray XC50/40, 21.2 Pflops), the end of the life cycle of which was announced at the end of July 2024. For now, the CSCS will have the Arolla + Tsa machines (for the needs of MeteoSwiss) and Blue Brain 5 (solves the tasks of brain reconstruction and simulation). Alps, in addition to traditional HPC loads, will be used to develop AI solutions.
Швейцарская высшая техническая школа Цюриха (ETH Zurich) провела церемонию официального запуска суперкомпьютера Alps в Швейцарском национальном суперкомпьютерном центре (CSCS) в Лугано. Система, построенная HPE, уже заняла шестую строчку в последнем рейтинге TOP500 и имеет устоявшеюся FP64-производительность 270 Пфлопс (теоретический пик — 354 Пфлопс). К ноябрю будут введены в строй остальные модули машины, и её максимальная производительность составит порядка 500 Пфлопс.
В июньском рейтинге TOP500 участвовал раздел из 2688 узлов HPE Cray EX254n с «фантастической четвёркой» NVIDIA Quad GH200. Если точнее, это всё же «старый» вариант ускорителя с H100 (96 Гбайт HBM3), 72-ядерным Arm-процессором Grace и 128 Гбайт LPDDR5x — суммарно 10 752 Grace Hopper. Данный раздел потребляет 5,2 МВт и в Green500 находится на 14 месте. Узлы, конечно же, используют СЖО.
Это основной, но не единственный раздел суперкомпьютера. Ещё в 2020 году HPE развернула 1024 двухпроцессорных узла с 64-ядерными AMD EPYC 7742 (Rome) и 256/512 Гбайт RAM. Его производительность составляет 4,7 Пфлопс. Кроме того, в состав Alps входят 144 узла с одним 64-ядерным AMD EPYC, 128 Гбайт RAM и четырьмя NVIDIA A100 (80 или 96 Гбайт HBM2e).

RAM и четырьмя AMD Instinct MI250X (128 Гбайт HBM2e) и 128 узлов с четырьмя гибридными ускорителями AMD Instinct MI300A. Большая часть узлов будет объединена интерконнектом HPE Slingshot-11: 200G-подключение на узел или ускоритель. Более точную конфигурацию системы раскроют в ноябре.
Lustre-хранилище для будущей машины обновили ещё в прошлом году. Основной СХД является Cray ClusterStor E1000 с подключением Slingshot-11. Так, было добавлено 100 Пбайт полезной HDD-ёмкости (8480 × 16 Тбайт) с пропускной способностью 1 Тбайт/с (300 тыс. IOPS на запись, 1,5 млн IOPS на чтение) и 5 Пбайт SSD, а также резервные ёмкости. За архивное хранение отвечают две ленточные библиотеки объёмом 130 Пбайт каждая.

Особенностью системы является её геораспределённость (фактически узлы размещены в четырёх местах) и облачная модель использования. Так, метеослужба страны MeteoSwiss получила в своё распоряжение выделенный виртуальный кластер, что уже позволило перейти на использование метеомодели более высокого разрешения, которая лучше отражает сложный рельеф Швейцарии. Кроме того, для подстраховки часть узлов Alps размещена на территории Федеральной политехнической школы Лозанны (EPFL).
Alps приходит на смену суперкомпьютеру Piz Daint (Cray XC50/40, 21,2 Пфлопс), о завершении жизненного цикла которого было объявлено в конце июля 2024 года. В CSCS пока останутся машины Arolla + Tsa (для нужд MeteoSwiss) и Blue Brain 5 (решает задачи реконструкции и симуляции мозга). Alps же помимо традиционных HPC-нагрузок, будет использоваться для разработки ИИ-решений.