対象プログラム | 地球力学熱対流シミュレーション |
アプリケーション名 | CITCOM |
チューニング方法 | マルチグリッド法の改善,マルチグリッドサイクルの実装,局所的メッシュの改良 |
成果 | 30%以上の加速化 |
HECToR dCSE Teamによる地球力学熱対流シミュレーション(CITCOM)のパフォーマンス改善
Jeroen van Hunen & Charles Augarde, University of Durham
Sarfraz Nadeem, Numerical Algorithms Group Ltd (NAG)
HECToR CSE Team, Numerical Algorithms Group Ltd (NAG)
NAGにおいて英国の国立学術スーパーコンピューティング設備であるHECToR 向けの、計算科学技術(CSE)サポートサービス業務を行うNAGのHPC専門家は,地球力学熱対流モデルCITCOMのマルチグリッド法の実装を改良して、パフォーマンスを改善しました。
dCSE プロジェクトの主任調査員で HECToRにおける CITCOM の主要ユーザであるダラム大学の van Hunen 博士は、HECToR 上でこれまで£25,000のコストで約180万AU(アロケーションユニット)(注)を使用しました。 HECToR や、CITCOMコードを実行する他のスーパーコンピュータ上の今後の研究状況を推定すると、このdCSEプロジェクトで達成された最適化は大幅なコスト削減を実現できると考えられます。しかし研究者にとってはスケーラビリティと速い収束性が重要な結果で、これにより新しい科学研究を進めることが可能になります。特に、マルチグリッド法と併せた局所的メッシュ・リファインメントの開発と、この重要な先駆的研究に基づく今後の進展により、CITCOMユーザは極めて大きな数値問題を扱うことが可能になります。
dCSE の成功に言及して,van Hunen博士は次のように述べています。「この仕事は私にとってコードを最適化する優れた土台となりました。これにより以前は大きすぎて対処できなかった研究課題に取り組むことができます。」
HECToR HECToR はResearch Councils を代行する EPSRC により管理されており、英国学術界の科学と工学をサポートする任務を負っています。エジンバラ大学にある Cray XT スーパーコンピュータはUoE HPCx 社によって管理されています。 CSE サポートサービスはNAG 社によって提供されており、高度なスーパーコンピュータの効率的な活用のために、ユーザは確実に適切なHPC専門家にコンタクトできます。CSEサポートサービスの重要な特徴は分散型CSE(dCSE)プログラムです。これは簡潔なピアレビューを経てユーザからの提案に応える、特定のコードのパフォーマンスとスケーラビリティに対処するプロジェクトです。dCSE プログラムは、伝統的なHPCユーザアプリケーションサポートとNAG によるトレーニングで補われる、約 50 の集中的プロジェクトから成り立っています。 これまでに完了した dCSE プロジェクトは、CSEの尽力により可能なコスト削減と新しい科学の優れた適用例をもたらしました。ここで報告されているCITCOMプロジェクトは成功を収めたパフォーマンス改善であり、新たなサクセスストーリーとなっています。 |
プロジェクトの背景
この dCSE プロジェクトの目的は、収束性改善のためにマルチグリッド法を実装することによりCITCOMの並列パフォーマンスとスケーラビリティを改善することでした。ダラム大学のJeroen van Hunen 博士とCharles Augarde博士はプロジェクトの主任研究員でした。NAGのHPC専門家であるSarfraz Nadeem はNAG CSE チームとCITCOM ユーザと協力して12人月のプロジェクトを遂行しました。
CITCOM
CitCom (for California Institute of Technology Convection in the Mantle) はGNU General Public Licenseのもとでリリースされた、地球マントルに関する熱対流問題を解くために設計された有限要素コードです。C で書かれたコードの最新版であるCitComSは共有メモリや分散型メモリのプラットフォームを含む様々な並列処理コンピュータ上で稼働します。
http://www.geodynamics.org/cig/software/citcoms
プロジェクトの結果
このdCSE 作業の結果, CITCOM は2次元の検証問題について30%以上高速化しました。これはマルチグリッド法の改善,マルチグリッド・サイクル(Vサイクル, Wサイクル, Fサイクルあるいはフルマルチグリッドサイクル(FMG))の実装,そして高粘度傾斜領域近傍での局所的メッシュ・リファインメントの実装によって実現されました。
プロジェクトは任意のプログラムに対する最善のスキーマに関する手引きを作成するため4つのマルチグリッドスキーマ,つまりVサイクル, Wサイクル, FMG(V)サイクル及び FMG(W)サイクルのパフォーマンスの分析も行いました。またプロジェクトは全てのマルチグリッドスキーマのスケール性能の調査を行いました。これらは適切なMPI配置が設定された場合には、一般的に優れていることがわかりました。
(注)アロケーションユニット(allocation unit, AU)はHECToRにおけるノード課金単位です。大まかに言えばLinpackベンチマーク(Rmax)を基にした1時間当たり1Tflopsの実行量がkAUに相当します。例えば60Tflopsのプロセッサ群は60kAU/時間に相当します。
詳細なテクニカルレポートは以下で参照いただけます。
http://www.hector.ac.uk/cse/distributedcse/reports/
さらに詳しくお知りになりたい場合は、日本NAG株式会社 コンサルティンググループご相談窓口 https://www.nag-j.co.jp/nagconsul/toiawase.htm (あるいはメール:consul@nag-j.co.jp)までお問い合わせください。