2024-06-20
TSUBAMEでのアプリケーション利用においていくつかのアプリケーションでたびたび少数ユーザによるライセンス占有の状況が見られます。ユーザ数に対してライセンス数が不足がちなアプリケーションにおいてはライセンスの制限を設けております。
現在Abaqusのライセンス制限は1ユーザあたり 140 Tokenとしていますが、これはTSUBAME2およびTSUBAME3でのキュー構成と古いAbaqusのライセンス管理に基づいた設定値だったので、これを1ユーザあたり 120 Tokenに変更いたします。
全体のToken数が500のため140 Tokenのジョブでは3本しか同時に実行できなかったところ、120 Tokenのジョブは4本を同時に実行できるようになります。 これにより少ないユーザによる占有状態が抑制され、より多くのユーザに同時に利用していただくことが期待できます。
Abaqusの並列数と使用するライセンス数およびサンプルプログラムでの実行時間の関係は下表の通りです。試行回数が少ないため誤差を含んでおり数値の逆転も見られますが参考としてください。
CPU数(GPUも1でカウント) | Token数 | 資源タイプ | 実行時間(s) |
---|---|---|---|
1 | 50 | cpu_4 | 524 |
2 | 59 | cpu_4 | 265 |
3 | 67 | cpu_4 | 179 |
4 | 76 | cpu_4 | 136 |
5 | 85 | cpu_8 | 112 |
6 | 94 | cpu_8 | 94 |
7 | 103 | cpu_8 | 87 |
8 | 112 | cpu_8 | 81 |
8+1GPU | 120 | gpu_1 | 61 |
9 | 120 | cpu_16 | 73 |
10 | 125 | cpu_16 | 79 |
11 | 130 | cpu_16 | 71 |
12 | 135 | cpu_16 | 68 |
13 | 140 | cpu_16 | 66 |
これまでの制限値である 140 Tokenでは最大13CPUのジョブを1本まで実行可能ですが、変更後の 120 Tokenでは最大9CPUのジョブを1本まで実行可能となります。1CPUまたは2CPUでのジョブは同時に2本まで実行可能となります。
13CPUのジョブを実行するにはcpu_16の資源タイプを指定する必要があり、8CPUでcpu_8の資源タイプを指定した場合に比べて課金係数は2倍になりますが、実行時間は2割程度の差しか生じないため効率が良くありません。8CPUのジョブを資源タイプcpu_8を指定して実行することで最も速く効率的となることが期待できます。
それでもこれまでに比べると計算時間が長くなることは否めないため、gpu_1(8CPU+1GPU)での実行の余地を残した 120 Tokenといたします。1GPUを使用することでCPU数を2倍にするのに近い効果が得られライセンス数あたりの効率が良くなりますが、この場合は資源タイプによる課金係数が大幅に高くなりますのでご注意ください。速度を求めないのであれば資源タイプcpu_4を指定して4CPUで実行するのが最大効率になります。
将来的にはTSUBAME3で実施していたようにシステム的に制限値以上のライセンス使用が出来なくなる予定ですが、現在は機能しておらず制限値を超えて実行できてしまう状態です。
制限値を下げることで余裕が生じるためライセンス不足の状況は改善する見込みですが、上述の通りシステム的な制限は未実装のため、ユーザの皆様にご協力いただく必要があります。
制限値を超えて実行しているジョブを発見した場合、断りなくジョブの強制終了を行う可能性があります。また、そのような状況が継続的に見られる場合、購入済みアプリケーションへのアクセスを遮断する可能性があります。
十分にご注意の上、ご利用いただくようお願いいたします。