対象プログラム | 大気化学シミュレーション |
アプリケーション名 | GLOMAP/TOMCAT |
チューニング方法 | ハイブリッド並列化(OpenMP/MPI) |
成果 | 速度が4倍に改善 |
HECToR dCSE Teamによる大気化学シミュレーション(GLOMAP/TOMCAT)のパフォーマンスの改善
Graham Mann, University of Leeds
Mark Richardson, Numerical Algorithms Group Ltd (NAG)
HECToR CSE Team, Numerical Algorithms Group Ltd (NAG)
HECToR 向けのNAG の計算科学とエンジニアリング(CSE)サポートサービスのもとで業務を行う NAG の HPC専門家は、GLOMAP-mode TOMCATアプリケーションの主要部分を再構築し、研究者がランタイムを4倍加速できるようにマルチコア実行パフォーマンスを改善し、新しい科学研究とより高い解像度を可能にしました。
プロジェクトの主任研究員であり、GLOMAP/TOMCAT の主要ユーザである Graham Mann 博士(リーズ大学)の試算によれば、GLOMAP-modeのユーザは費用 £44,000 を伴うHECToR 上で15 カ月の期間に渡りXT4リソースのおよそ3200万の AU (アロケーションユニット)(注)を消費すると見積もられています。HECToR 及びその他のスーパーコンピュータ上でGLOMAP-mode TOMCATコードを使用した今後の研究を推定した場合、最適化によりかなりのコスト削減をもたらすことができるでしょう。研究者にとってはモデルの時間ステップ毎のCPU時間の削減が重要であり、かつそうすることで新しい科学研究が可能になります。
dCSE の成功について、Mann 博士は次のように述べています。「NAG による最適化によって一般に15-20% 速く実行可能になります。特に我々にとって重要なのは、XT4上の256コアまで効率的なスケーリング性が得られたことです。この改善されたスケーリングは時間ステップ毎の実行時間を大幅に削減できることを意味しています。よってより多くの時間ステップを必要とする科学的シナリオの研究が可能になりました。」またMann 博士は次のように言及しています。「NAGがOpenMPによる更なる並列レベルをコードへ追加したことにより、ノード当りより多くのコアを用いてXT6(フェーズ2b)スーパーコンピュータを効果的に使用することができます。」
HECToR HECToR はResearch Councils を代行する EPSRC により管理されており、英国学術界の科学と工学をサポートする任務を負っています。エジンバラ大学にある Cray XT スーパーコンピュータはUoE HPCx 社によって管理されています。 CSE サポートサービスはNAG 社によって提供されており、高度なスーパーコンピュータの効率的な活用のために、ユーザは確実に適切なHPC専門家にコンタクトできます。CSEサポートサービスの重要な特徴は分散型CSE(dCSE)プログラムです。これは簡潔なピアレビューを経てユーザからの提案に応える、特定のコードのパフォーマンスとスケーラビリティに対処するプロジェクトです。dCSE プログラムは、伝統的なHPCユーザアプリケーションサポートとNAG によるトレーニングで補われる、約 50 の集中的プロジェクトから成り立っています。 これまでに完了した dCSE プロジェクトは、CSEの尽力により可能なコスト削減と新しい科学の優れた適用例をもたらしました。ここで報告されているTOMCAT/GLOMAPプロジェクトは成功を収めたパフォーマンス改善であり、新たなサクセスストーリーとなっています。 |
プロジェクトの背景
この dCSE プロジェクトの目的は、TOMCAT大気化学コードと特にGLOMAPエアロゾルプロセスをマルチコアノードで大規模スーパーコンピュータを利用できるようにすることでした。その目標は問題を解く時間を削減することにより高解像度の計算を実行可能にすることでした。またマルチコア実行パフォーマンスを改善することにより、リソースのコスト効率を高くすることでした。リーズ大学のGraham Mann はプロジェクトの主任研究員でした。NAG のHPC専門家であるMark Richardson はNAG CSE チームとGLOMAP 開発者と協力して10人月のプロジェクトを遂行しました。
GLOMAP
エアロゾルは太陽放射を散乱し吸収することによって、また雲の特性に作用することによって気候に影響を与えます。エアロゾルの気候への「強制力」は、過去150年に渡る気候変動の定量化における最も大きい不確実性の一つです。GLOMAPは、エアロゾルの微物理的かつ化学的プロセスの包括的な処理を可能にする、全球の大気エアロゾルモデルおよび化学モデルです。このモデルはエアロゾルのグローバルなライフサイクルと気候におけるエアロゾルの影響の研究に使用されます。GLOMAP はTOMCAT 化学輸送モデルとUKCA エアロゾル化学気候モデル内で機能します。 http://www.env.leeds.ac.uk/research/icas/clouds/current/glomap.htm
プロジェクトの結果
このプロジェクトは当初クアッドコアノードの XT4システムに重点を置いていました。pure-MPIコードのデータアクセスは再構築され、同じプロセッサ数で12% 高速化されました。HECToR のマルチコアノードでスケールさせた場合に更にパフォーマンスを引き出すために、OpenMP 並列がこのコードへ導入されました。ハイブリッド並列では、コードは追加ノードを使用して4倍高速に実行することができました。これらの最適化により、GLOMAP-mode TOMCATアプリケーションは、HECToR に実装された24コアノード XT6 システムで優れたコストパフォーマンスとターンアラウンドタイムを達成出来ます。
(注)アロケーションユニット(allocation unit, AU)はHECToRにおけるノード課金単位です。大まかに言えばLinpackベンチマーク(Rmax)を基にした1時間当たり1Tflopsの実行量がkAUに相当します。例えば60Tflopsのプロセッサ群は60kAU/時間に相当します。
詳細なテクニカルレポートは以下で参照いただけます。
http://www.hector.ac.uk/cse/distributedcse/reports/
さらに詳しくお知りになりたい場合は、日本NAG株式会社 コンサルティンググループご相談窓口 https://www.nag-j.co.jp/nagconsul/toiawase.htm (あるいはメール:consul@nag-j.co.jp)までお問い合わせください。