付録. 新旧TSUBAME比較¶
付録.1. システム概要比較¶
T3/T4のシステム概要比較
TSUBAME3.0 | TSUBAME4.0 | |
---|---|---|
倍精度総理論演算性能 | 12.5PFLOPS | 66.8PFLOPS |
半精度総理論演算性能 | 47.2PFLOPS | 952PFLOPS |
総主記憶容量 | 135TiB | 180TiB |
総ハードディスク容量 | 15.9PB | 44.2PB |
総SSD容量 | 327TB | |
計算ノード数 | 540台 | 240台 |
総コア数 | 15,120コア | 46,080コア |
総GPU数 | 2,160台 | 960台 |
インターコネクト | Intel Omni-Path HFI 100Gbps | InfiniBand NDR200 200Gbps |
インターネット接続 | SINET5 100Gbps | SINET6 100Gbps |
付録.2. 計算ノード比較¶
T3/T4の計算ノード比較
TSUBAME3.0 | TSUBAME4.0 | |
---|---|---|
演算部名 | 計算ノード HPE SGI ICE-XA 540台 | 計算ノード HPE Cray XD665 240台 |
ノード構成(1台あたり) | ||
CPU | Intel Xeon E5-2680 v4 2.4GHz × 2 Socket | AMD EPYC 9654 2.4GHz × 2 Socket |
コア数/スレッド | 14コア / 28スレッド×2CPU | 96コア / 192スレッド×2CPU |
メモリ | 256GiB | 768GiB (DDR5-4800) |
GPU | NVIDIA TESLA P100 for NVlink-Optimized Servers ×4 | NVIDIA H100 SXM5 94GB HBM2e × 4 |
SSD | 2TB | 1.92TB NVMe U.2 SSD |
インターコネクト | Intel Omni-Path HFI 100Gbps ×4 | InfiniBand NDR200 200Gbps × 4 |
付録.3. ソフトウェア比較¶
T3/T4のソフトウェア比較
付録.3.1 システムソフトウェア比較¶
T3/T4の比較
TSUBAME3.0 (2023.4.6 現在) | TSUBAME4.0 | |
---|---|---|
OS | SUSE Linux Enterprise Server 12 SP5 | RedHat Enterprise Linux Server 9.3 |
ジョブスケジューラ | Univa Grid Engine 8.6.11 | Altair Grid Engine 2023.1.1 |
コンパイラ | GCC 4.8.5, 12.2.0 Intel Compiler 23.0.0 NVIDIA HPC SDK 22.2 |
GCC 11.4.1 Intel oneAPI compiler 2024.0 and MKL NVIDIA HPC SDK 24.1 AOCC 4.1.0 |
MPI | Intel MPI 21.8.0 SGI MPT 2.16 OpenMPI 3.1.4 |
Intel MPI 2021.11 OpeMPI 5.0.2 |
CUDAライブラリ | 11.0.3 (12.1.0利用可) | 12.3.2 |
CUDAドライバ | 450.172.01 | 545.23.08 |
OmniPathドライバ(OPA) | 10.10.3.1.1 | |
InfiniBandドライバ(OFED) | 23.10-1.1.9 |
付録.3.2 商用アプリケーション比較¶
T3/T4の商用アプリケーション比較
ソフトウェア名 | 概要 | TSUBAME3.0 | TSUBAME4.0 |
---|---|---|---|
ANSYS | 解析ソフトウェア | ○ | ○ |
ABAQUS | 解析ソフトウェア | ○ | ○ |
ABACUS CAE | 解析ソフトウェア | ○ | ○ |
MSC Nastran | 解析ソフトウェア | ○ | |
MSC Patran | 解析ソフトウェア | ○ | |
Gaussian | 量子化学計算プログラム | ○ | ○ |
GaussView | 量子化学計算プログラム プリポストツール | ○ | ○ |
AMBER | 分子動力学計算プログラム | ○ | ○ |
Materials Studio | 化学シミュレーションソフトウェア | ○ | ○ |
Discovery Studio | 化学シミュレーションソフトウェア | ○ | ○ |
Mathematica | 数式処理ソフトウェア | ○ | ○ |
Maple | 数式処理ソフトウェア | ○ | |
AVS/Express | 可視化ソフトウェア | ○ | |
AVS/Express PCE | 可視化ソフトウェア | ○ | |
LS-DYNA | 解析ソフトウェア | ○ | ○ ※ANSYSに含む |
COMSOL | 解析ソフトウェア | ○ | ○ |
Schrodinger | 化学シミュレーションソフトウェア | ○ | ○ |
MATLAB | 数値計算ソフトウェア | ○ | ○ |
VASP | 量子分子動力学計算プログラム | ○ | ○ |
Linaro forge(旧:Arm Forge) | デバッガ | ○ | ○ |
Intel Compiler | コンパイラ | ○ | ○ ※oneAPIに含む |
PGI Compiler | コンパイラ | ○ | ○ ※NVIDIA HPC SDKに含む |
付録.3.3 フリーウェア比較¶
T3/T4のフリーウェア比較
ソフトウェア名 | 概要 | TSUBAME3.0 | TSUBAME4.0 |
---|---|---|---|
GAMESS | ソルバ・シミュレータ | ○ | ○ |
Tinker | ソルバ・シミュレータ | ○ | ○ |
GROMACS | ソルバ・シミュレータ | ○ | ○ |
LAMMPS | ソルバ・シミュレータ | ○ | ○ |
NAMMD | ソルバ・シミュレータ | ○ | ○ |
QUANTUM ESPRESSO | ソルバ・シミュレータ | ○ | ○ |
CP2K | ソルバ・シミュレータ | ○ | ○ |
OpenFOAM | ソルバ・シミュレータ、可視化 | ○ | ○ |
CuDNN | GPUライブラリ | ○ | ○ |
NCCL | GPUライブラリ | ○ | ○ |
Caffe | DeepLearningフレームワーク | ○ | |
Chainer | DeepLearningフレームワーク | ○ | |
TensorFlow | DeepLearningフレームワーク | ○ | ○ |
DeePMD-kit | MD用DeepLearningフレームワーク | ○ | ○ |
R | インタプリタ(Rmpi,rpudに対応) | ○ | ○ |
clang | コンパイラ | ○ | ○ ※AOCC |
Apache Hadoop | 分散データ処理ツール | ○ | ○ |
POV-Ray | 可視化 | ○ | ○ |
ParaView | 可視化 | ○ | ○ |
VisIt | 可視化 | ○ | ○ |
turbovnc | リモートGUI(X11) 表示 | ○ | ○ |
gnuplot | データ可視化 | ○ | ○ |
Tgif | 画像表示・編集 | ○ | ○ |
GIMP | 画像表示・編集 | ○ | ○ |
ImageMagick | 画像表示・編集 | ○ | ○ |
TeX Live | TeX ディストリビューション | ○ | ○ |
Java SDK | 開発環境 | ○ | ○ |
PETSc | リニアシステムソルバ、ライブラリ | ○ | ○ |
FFTW | 高速フーリエ変換ライブラリ | ○ | ○ |
DMTCP | チェックポイント・リスタート | ○ | ○ |
Singularity | Linux container for HPC | ○ | ○ ※Apptainer |
Open OnDemand | HPC向けWebポータル | ○ |
付録.4. ストレージ比較¶
T3/T4のストレージ比較
TSUBAME3.0 | 用途 | マウント | 容量 | ファイルシステム |
---|---|---|---|---|
Homeディレクトリ 共有アプリケーション配備 |
/home /apps |
40TB | GPFS+cNFS | |
高速ストレージ領域1 | /gs/hs0 | 4.8PB | Lustre | |
高速ストレージ領域2 | /gs/hs1 | 4.8PB | Lustre | |
高速ストレージ領域3 | /gs/hs2 | 4.8PB | Lustre | |
ローカルスクラッチ領域 | /scr | 各ノード1.9TB | xfs (SSD) | |
共有スクラッチ領域 | /beeond | 計算ノード依存 | BeeGFS |
TSUBAME4.0 | 用途 | マウント | 容量 | ファイルシステム |
---|---|---|---|---|
高速ストレージ領域 Homeディレクトリ |
/gs/fs /home |
372TB | Lustre | |
大容量ストレージ領域 共有アプリケーション配備 |
/gs/bs /apps |
44.2PB | Lustre | |
ローカルスクラッチ領域 | /local | 各ノード1.92TB | xfs(SSD) |