スーパーコンピューティングの発展戦略の方向に関する考察(その2)
2017年 7月31日
葛 蔚:中国科学院過程工程研究所研究員、博士課程指導教官
郭 力:中国科学院過程工程研究所研究員、中国科学院大学兼職教授
李 静海:中国科学院過程工程研究所
陳 左寧:国家並行計算機工程技術研究中心
胡 蘇太:国家並行計算機工程技術研究中心シニアエンジニア
劉 鑫:国家並行計算機工程技術研究中心副研究員
(その1よりつづき)
4 研究実例
4.1 マルチスケールシミュレーションと高性能コンピューターシステム
中国科学院過程工程研究所はマルチフェーズ複雑系のマルチスケールシミュレーションに対して、国家並行計算機工程技術研究中心は国家「863」計画プロジェクトの開発する、自前のプロセッサに基づく高性能コンピューターシステムに対して、演算対象やモデル、ソフトウェア、ハードウェアの構造と論理の一致するスーパーコンピューティングの面で有益な探求を行い、この道の大きな可能性を示し、その普遍的な意義は、さらに高度な研究に値すると言える。
4.1.1 マルチフレーズ複雑系のマルチスケールシミュレーション
近年、中国のスーパーコンピューターは、ピーク速度にせよ、実測性能にせよ、世界と同じ歩みを保ち、世界をリードする水準へ到達して来た。だがそのスーパーコンピューティングのソフトウェアと応用の面での発展は、ハードウェアに比べて大きく遅れている。またスーパーコンピューティングの核心的な基礎部品とパーツ(チップ)の研究開発に対する中国の支援水準も米日などの競争対手とは距離がある。特に高性能CPU基礎部品のバックエンド生産やパッケージ、テストなどと設計ツールは長期にわたって国外の制約を受け、国内の技術は一代以上後れており、他者の制限を受ける局面を完全に脱却することはできていない。
長年にわたって、中国科学院過程工程研究所は、応用を牽引力とし、「演算対象とモデル、ソフトウェア、ハードウェアの論理と構造の一致」という原理に従い、スーパーコンピューティングの発展の新たな道においてたゆまぬ努力を続けてきた。そのうちの多くの考え方と経験は、立ち入った検討と普及に値するものである。
国家自然科学基金委員会などの継続的な支援の下、中国科学院過程工程研究所は1980年代初めから、マルチフェーズシステムのマルチスケールの方法に対する研究を開始し、独自のエネルギー最小マルチスケール(EMMS)モデルを提出し、グローバルとメソスケールの安定性という条件の制約により、マルチフェーズ反応プロセスシミュレーションの精度と速度を高めた。このモデルの検定・拡張・深化の過程においては、擬粒子などの離散化方法を発展させ、これらが複雑系のマイクロスケールの振る舞いを記述する有効な方法であり、高度の並列性を幅広く備えているとの認識に至り、スーパーコンピューティングの重要な応用分野となると論じた。EMMSモデルの気体・液体や乱流などその他の分野への拡張によって形成された極値型マルチスケールの方法は、安定性の制約を、複雑系のマイクロスケールとメソスケールのシミュレーションを加速する共通の方法としている。両者の結合は、普遍的意義を持った新たなスーパーコンピューティングモデルを定義するものとなる。EMMSパラダイム、すなわち離散化方法を用いたシステム中の近距離強相関作用のシミュレーションは、極値型マルチスケール方法を利用したシステム中の長距離相関の記述である。前者の計算は、大規模で粒度の細かい並列計算的に適応するローカル性や追加可能性などの良好な特性を備え、後者の含む複雑な計算は大きく減少される。両者の結合は、高性能のスーパーコンピューティングの実現に、まったく新たなルートを提供するものとなる。
2007年以降、汎用計算図形プロセッサ(GUGPU)の出現は、この考え方の検証に技術的な基礎を提供するものとなった。財政部「国家重大科学研究設備開発プロジェクト」などの支援の下、中国科学院過程工程研究所は、上述の考えに基づき、Moleシリーズ高性能スーパーコンピューティングシステムを開発し、中国がヘテロジニアスな並列を通じて世界のスーパーコンピューティングの先端に追いつき、さらにこれを追い越すことを先導した。中国国内ではまず2008年2月、100テラフロップスCPU+GPGPU並列システムが完成した。2010年4月に完成したペタフロップスシステム[5,6]は、同年のTop500の第19位とGreen500の第8位につけた(当時の世界のペタフロップス級スーパーコンピューティングシステムのうちのトップ)。これは現在も高効率で運行中である。同システムは、全国6都市に分布した10基の100テラフロップス以上のシステムとともに、中国科学院で、計算能力合計5000テラフロップスを超える分散式GPGPUスーパーコンピューティング環境を形成した。
実際の応用の需要を考慮すれば、ピーク性能のさらなる拡張の必要はない。このため研究はその後、異なる応用の実例におけるEMMSパラダイムの実行可能性と汎用性のさらなる探求へと転換され、混相流直接数値シミュレーションや、材料とナノ・マイクロシステムのマイクロシミュレーション、生物高分子動的挙動シミュレーションなど、世界の先端水準に達する応用を実現し、この計算パラダイムの優位性と将来性を初期的に証明した。このシステムはさらに、幅広い産業応用も実現した。協力パートナーには、中国石油化工や中国石油天然気、宝鋼、シェル石油、BP、トタル、ゼネラル・エレクトリック、アルストム、BHPビリトン、ユニリーバ、BASF、フランス電力、兗礦など10社余りの世界トップ500企業が含まれている。
これと同時に、実験や計測、可視化、制御システムとの結合を通じて、中国科学院過程工程研究所の研究員はさらに、世界初の仮想プロセス工学のモデルシステムを構築した。これは、マンマシンインターフェースによって入力された操作指令を通じて、実験装置とシミュレーションシステムに同時に働き、それぞれの操作状態を改変し、可視化システムにおいて直観的にオンラインで両者の挙動を対比するものである。これによって世界で初めて、パイロット規模の化学工業装置に対する凖リアルタイムのシミュレーションを実現し、プロセス工学の研究開発モデルの変革の広大な見通しを示し、この分野の発展の流れを率いるものとなった。
これらの応用を土台として、コンピューター体系の構造とチップの設計レベルでEMMSパラダイムを実現する技術案がより一層明確にされた。この案は、マルチスケールシミュレーションにおける異なるアルゴリズムと操作の計算やメモリ、通信の特徴を明確化し、このパラダイムの下での典型的な安定性条件の求解、連続体モデルと離散要素進化シミュレーションのアルゴリズムの特徴を帰納し、相応するマルチスケール体系構造を提起した。この案を検証するため、Intel MICマルチコアプロセッサを借用し、CPU-MIC-GPGPUノード内で連結した緊密な3層構造を実現し(図1)[7,8]、既存のシステムをこれによってレベルアップし、完全にEMMSパラダイムに基づく未来のマルチスケールスーパーコンピューティングモデルの優位性と実行可能性を初期的に示した(図2)[7]。中国科学院過程工程研究所は近年、国家並行計算機工程技術研究中心と協力し、このようなコンピューティングモデルのハードウェアの実現案を探求し、進展を実現した。今後は、メソスケール演算をターゲットとした新型プロセッサのさらなる開発が期待される。
図1 Mole-8.5Eシステムの3層構造ノードマップ[7,8]
図2 モデル-ソフトウェア-ハードウェア構造一致性原理マップ[7]
4.1.2 自前のプロセッサに基づく高性能コンピューターシステム
近年、国家並行計算機工程技術研究中心は、国家「863」計画プロジェクト「自前のプロセッサに基づく高性能コンピューターシステムの開発」(図3)の研究を請け負う過程で、核融合・核分裂エネルギー、実機外形全流れ場計算・最適化設計、新薬の研究開発とタンパク質のフォールディング、大型工学設備構造力学分析、数理工学などの国民経済・国防の重大で困難な応用ニーズに向け、分野における応用アルゴリズムと計算モデルを指導とし、多目標の最適化に向けた平衡構造設計方法と多くの要素が結合した設計最適化方法を採用し、多態・マルチスケールの自己適応体系構造を革新的に打ち出し、システム内部の異なるスケールにおいて多種類の計算形態を融合し、異なる分野における難度の高い応用のニーズに基づき、構造計算の規模を臨機応変にし、計算形態を統合し、計算効率を高める。
図3 神威・太湖之光コンピューターシステム
多態・マルチスケール自己適応体系構造は複数のスケール上でヘテロジニアスを実現する。これには、プロセッサ内部、プロセッサ間、ノード間、システムレベルのヘテロジニアスなどが含まれる。このうちプロセッサ内部ではクライアントサーバのヘテロジニアスをサポートする。プロセッサ/ノード間のヘテロジニアスにおいては、国産のマルチコア/メニーコアプロセッサ、商用マルチコア/メニーコアプロセッサ、GPGPUなどのさまざまなプロセッサの透明な共存をサポートする。システムレベルのヘテロジニアスは、各種の高性能コンピューターシステムのシームレスな結合をサポートする。この体系構造は、異なる類型のプロセッサやノード、高性能計算システムの優位性を十分に発揮し、応用の需要と多目標の最適化に基づき、スピーディーで柔軟な配置を実現する。同時にシステムは、仮想化オペレーティングシステムや分野の典型的な応用とマシンの構造に向けたコンパイル最適化技術、自己適応精密バランスディスパッチなどを通じて、応用の効率的な自己適応配置を実現し、システムの性能を十分に発揮すると同時に、基盤ヘテロジニアス構造のユーザーに対する開放を最大限に実現するものとなる。
同プロジェクトは、自前のメニーコアプロセッサを使用した技術ロードマップで、チップ上に大量の簡略化計算コアを統合し、商用プロセッサよりもさらに高い計算能力を実現した。応用の特徴に応じたプロセッサの構造の最適化を通じて、メニーコアプロセッサをさらに省エネで効率的なものとした。国産プロセッサ設計において国家の重大な応用への共通のサポートの提供を通じて、応用効率を大幅に高めた。同プロジェクトが実現したスーパーコンピューターシステムは現在、ピーク性能や実測性能、性能・エネルギー消費比などのカギとなる技術指標においていずれも、世界をリードする水準へと到達している。
4.2 マルチスケールコンピューティングモデル
以上の探索に基づき、普遍的な意義を持ったマルチスケールコンピューティングモデルを提出し、未来の高効率スーパーコンピューティングシステムの開発を支えることがすでに可能となっている。この種のシステムは、実際の運用効率と使用可能性を大きく高められるだけでなく、普遍性も備えており、中国のスーパーコンピューティングの全面的で飛躍的な発展に重要なチャンスを提供するものとなる。
中国科学院過程工程研究所と国家並行計算機工程技術研究中心は、物理モデルとハードウェア構造の両面からの探索によって、演算対象とモデル、ソフトウェア、ハードウェアの構造と論理の一致性は、未来のスーパーコンピューティングの発展の重要な方向であり、広大な発展の余地を備えており、両者の結合は、未来のスーパーコンピューティングの発展を率い、リードする可能性を持っていることを示している。とりわけ注意に値するのは、自然界と産業システムにおいて、マルチスケールの構造と挙動が高い普遍性を備えていることである。これは物質世界の階層構造によって决定されている。このため上述の原理に基づけば、マルチスケール構造を備えたスーパーコンピューティングシステムは、天然の普遍性を備えていると言える。このような共通性は、より高い関心を呼ぶべきものである。
総体的に言って、マルチスケール構造を備えた複雑系の各部分または要素間の作用方式は、マクロからミクロに至るまで少しずつ簡素化しており、より明確で信頼できる数理モデルによって記述できるようになっている(多くのミクロ運動のモデルはまだ成熟していないものの、いったん構築されれば、その正確性は間違いない)。だがスケールの縮小に伴い、対応する部分または要素の数量は急激に増加し、相応する直接シミュレーションの計算量も急激に増え、理論的には計算できない程度に達する。
幸運なことに、EMMSパラダイムに基づくますます多くのシステムに対する研究によれば、少なくとも従来の力学や伝達、反応挙動について言えば、安定性条件の導入を通じて、基本要素とシステム全体に介在し得る「メソスケール」上に「粗粒化」された離散モデルを構築することで、このスケール上のシステムの挙動を十分な精度で示すことができる。さらにこの「粗粒化」された離散要素間の粗粒化の作用は、ローカルで追加可能なもので、さらに計算可能なものである。同時にこれら要素の運動はまだ、全体の安定性条件の制約を満たすものではない。この条件の解を求めることによって、システムのグローバルな挙動を直接予測し、粗粒化離散要素の進化的計算を簡略化・加速することができる。
これらの複雑系の共通性を十分に利用すれば、その進化シミュレーションをターゲットとした高効率スーパーコンピューティングシステムを構築することができる。すなわちローカルデータ交換チャンネルを備えた大量の簡単な計算集約的処理要素を通じて、高度で拡張可能な基盤離散要素シミュレーションサブシステムを構築し、より高いグローバルデータ交換速度と複雑な指令処理能力を備えたいくつかのレベルの処理要素アレイを通じて、安定性条件の解を求めるサブシステムを提供する。各層の処理要素間においては、共有メモリまたは通信ネットワークを通じて、樹形の連結を実現する。レベルが高いほど処理要素は少なくなるが、複雑性はより高くなる。このような体系構造は、計算する問題の特徴に十分に寄り添ったものとなり、システム全体の複雑性を引き下げ、その実際の使用効率を高めるものとなる。各レベルのより具体的な構造形式と異なるレベル間の比率は具体的な応用のニーズに基づいて最適化・確定する必要があるものの、これらの構造の特徴は普遍的に適用されるものとなる。同時に、ソフトウェアとハードウェアの緊密な連結と、再構成可能ハードウェアなどの技術の利用を通じて、具体的な計算任務の実行効率をさらに最適化し、EMMSパラダイムの構造の一致性と多層的処理の優位性を十分に生かすことができる。
5 実施の提案
中国のスーパーコンピューティングの発展においては、応用を牽引力とし、学術領域の交差と協力を十分に重視し、自前のスーパーコンピューター体系の構造の革新とシステムの開発を引き続き推進する必要がある。重大問題の解決を目標とし、高性能計算アプリケーションソフトウェアの研究開発に対する支援を引き続き強化し、高性能計算の応用水準の向上に土台を固める必要がある。
(1)特定分野における応用を牽引力とした新型コンピューター体系構造の研究とシステムの開発を大いに推進する。上述の分析に基づき、スーパーコンピューティングには、国家の科学技術と経済社会の発展の優先分野の一つとして、長期的で強力な支援を引き続き提供する必要がある。とりわけ中国が応用ニーズをめがけて自ら提起した体系構造により高い関心を寄せる必要がある。論証グループを発足し、プロジェクトのシステムの事前調査と既存の成果の総括を通じて、システムの論理構造を確定し、シミュレーションシステムの初期的試験を経て、プロジェクト全体の設計の実行可能性を論証しなければならない。これを土台として、国内のさまざまな分野のスーパーコンピューティング応用の研究機関と研究員を組織し、各自の応用の特徴に対して立ち入った調査研究・分析を行い、演算対象やモデル、ソフトウェアの構造の分析を精錬し、完全で系統的、定量的な結論を形成し、汎用ハードウェアシステムの設計に信頼できるデータを提供する。同時に、ハードウェア開発分野の関連機関(コンピューター・マイクロ電子など)を組織し、関連するハードウェア技術の調査研究と事前研究を展開する。各者の凖備が十分に整った後、国家重大特別プロジェクトを適時に始動し、国内の関連機関と合同で、高性能エクサスケールスーパーコンピューターシステムを開発し、大規模な応用凖備を展開し、同時的な検収を実現する。
(2)重大問題の解決を目標とし、高性能計算アプリケーションソフトウェアの研究開発に対する支援を引き続き強化する。中国は、高性能計算アプリケーションソフトウェアの研究開発に対する支援を着実に強化し、重要な応用分野を選び、長期的な高性能計算アプリケーションソフトウェア発展計画を構築する必要がある。スーパーコンピューターの研究開発の過程においては、アプリケーションソフトウェアの開発を同時的に展開する必要があるだけでなく、マシンの使用の全ライフサイクルにおいてアプリケーションソフトウェアを持続的に開発し、中国の大型並列アプリケーションソフトウェアが外国に依存している受動的な局面を少しずつ変えていく必要がある。高性能計算アプリケーションソフトウェアの研究開発においても、多くの学術領域の共同作業を際立たせ、大規模並列ソフトウェアの技術水準を高める必要がある。
このように、コンピューター体系構造と応用モデルにおいて根源からの革新を進め、計算効率や出力ロス、信頼性などの技術的なボトルネックを打破し、中国の核心部品(プロセッサチップ)を完全に自前で制御可能なものとすることができれば、我々は、スーパーコンピューター技術の分野で世界をリードする水準へと到達することができる。マルチスケールの計算方法とコンピューター体系の構造は、重要で有効な切り口となる。中国はこの方面ですでに優位性と特色とを形成しており、これには十分な重視の必要がある。これを土台として、中国は、戦略発展分野において、重大な影響を持つ多くの応用モデルを形成し、中国の高性能計算の応用水準を新たなステップへと進ませ、最終的には、国家の経済建設や科学技術の進歩、国家安全などの一連の重大で困難な問題の解決への貢献が見込まれる。
(おわり)
参考文献:
[5]. Ge W, Wang W, Yang N, et al. Meso-scale oriented simulation towards virtual process engineering (VPE) — The EMMS Paradigm. Chemical Engineering Science. 2011. 66, 4426-4458.
[6]. Wang X, Ge W. Chapter 5: The Mole-8.5 Supercomputing System. In: Vetter, J. S. eds. Contemporary High Performance Computing from Petascale toward Exascale. Boca Raton: Chapman & Hall / CRC, 2013.
[7]. Ge W, Lu L, Liu Sh W, et al. Multiscale discrete supercomputing – A game changer for process simulation? Chemical Engineering Technology. 2015. 38, 575-584.
[8]. Li B, Zhou G F, Ge W, et al. A multi-scale architecture for multi-scale simulation and its application to gas–solid flows. Particuology. 2014. 15, 160-169.
※本稿は葛蔚,郭力,李静海,陳左寧,胡蘇太,劉鑫「関于超級計算発展戦略方向的思考」(『中国科学院院刊』第31卷第6期、2016年、pp.614-623)を(『中国科学院院刊』編集部の許可を得て日本語訳・転載したものである。記事提供:同方知網(北京)技術有限公司