第130号
トップ  > 科学技術トピック>  第130号 >  スーパーコンピューティングの発展戦略の方向に関する考察(その1)

スーパーコンピューティングの発展戦略の方向に関する考察(その1)

2017年 7月31日

葛 蔚:中国科学院過程工程研究所研究員、博士課程指導教官

郭 力:中国科学院過程工程研究所研究員、中国科学院大学兼職教授

李 静海:中国科学院過程工程研究所

陳 左寧:国家並行計算機工程技術研究中心

胡 蘇太:国家並行計算機工程技術研究中心シニアエンジニア

劉 鑫:国家並行計算機工程技術研究中心副研究員

概要:

 スーパーコンピューティング能力は、国家の科学技術の競争力と総合的国力の重要な指標であり、経済社会の発展や国防、国家安全の重要な下支えでもある。とりわけネットワーク化やビッグデータ、クラウドコンピューティング、仮想現実の迅速な発展を背景として、スーパーコンピューティングは、科学技術発展の優れた武器として科学研究モデルの根本的な変革を引き起こしているだけでなく、重要な社会インフラ施設となって我々の生産・生活方式に深刻な変化をもたらすものとなる。だが現在、スーパーコンピューティングは、応用効率が低い、エネルギー消費が高い、安定性が低い、応用しにくいなどの厳しい試練に直面している。複雑系のマルチスケールシミュレーションの面での長年にわたる探求と蓄積に基づき、本稿は、演算対象とモデル、ソフトウェア、ハードウェアの論理と構造の一致という原理に基づき、コンピューターの体系構造を最適化し、商品化された汎用ハードウェアシステムの開発における難点の緩和と克服をはかるもので、この課題のブレークスルーを実現するための普遍的な意義を持った道となり得る。

キーワード:スーパーコンピューティング、マルチスケールコンピューティングモデル、エネルギー最小マルチスケール(EMMS)パラダイム、仮想プロセス工学

1 重要な意義

 スーパーコンピューティングは、革命的な研究開発手段であり、国家の科学技術発展の水準を代表している。同時にこれは、現代社会の重要な情報インフラとなり、人類の生産と生活の方式に深刻な変化をもたらしている。

 2005年、米大統領情報技術諮問委員会(PITAC)は、当時の米国のジョージ・W・ブッュ大統領にあてた報告書『コンピューティングサイエンス:米国の競争力の確保』[1]で、「コンピューティングサイエンスは、理論と実験に続く第三の科学の支柱である。21世紀で最も偉大な科学のブレークスルーはコンピューティングサイエンスを通じて得られるだろう」と繰り返し強調している。同報告書はさらに、「このカギとなる時に長期的な視野を持てない限り、米国は、科学をリードするポジションと経済的な競争力を望むことはできない」と論じている。スーパーコンピューティングは間違いなく、コンピューティングサイエンスの先端であり、核心である。2014年、米エネルギー省の報告書『エクサスケールコンピューティングの10大挑戦』[2]はさらに明確に、エクサスケール(エクサフロップス)コンピューティングはグローバル経済を変えることになると指摘している。

 具体的には、本稿においては、スーパーコンピューティングの重要性が、次の3つの面に集中的に体現されると考える。

(1)スーパーコンピューティングはすでに、革命的な研究開発手段である。既存の理論に基づいたスーパーコンピューター上での仮想実験、すなわちコンピューターシミュレーション、さらには仮想現実は、現実の実験をますます補助し、さらには代替するようになっている。例えば核実験の禁止後、コンピューターによってシミュレーションされた核爆発は核実験を完全に代替した。各国の大型機の開発も、計算力学とスーパーコンピューティングによる空気力学と構造の設計に依存している。同様に、新薬開発から精密医学まで、触媒機序の分析からリアクターのスケールアップと最適化まで、建築や橋梁の設計から地質災害の防止まで、スーパーコンピューティングは、現代科学技術のほとんどすべての分野で理論と実験研究の限界を突破し、研究開発のプロセスを大きく加速し、費用を大きく低下させた。これによって形成される産業技術からもたらされる効果や利益ははかりしれないもので、国防と国家安全の重要な支点の一つとなっている。同時に、スーパーコンピューティングの総合性は、さまざまな学術領域の交差や融合を有効に促進し、複雑系科学や脳科学など21世紀に最も人の心を動かす先端科学の形成を促進している。

(2)スーパーコンピューティングはすでに、現代社会の重要な情報インフラとなっている。現在迅速に発展している情報社会にとって、スーパーコンピューティングは、工業社会にとってエネルギーと交通が持っていたのに匹敵する重要性を持っていると言っても過言ではない。スーパーコンピューティングの応用は現在、従来の科学研究分野から、社会経済の各方面へと浸透しつつある。電子商取引や金融、社会管理においてはすでに、データマイニングなどの手段を用いて人びとの消費や行動習慣を分析し、生産と流通をより精確に指導し、経済や社会の運営効率を高めることが始まっている。それと同様に、交通と物流の管理と最適化、疾病の予防と制御、天気予報と気候予測、経済の定量予測と調整、さらにはレジャー娯楽などの分野での応用もまもなく、爆発的な成長を迎え、新興産業の台頭を引っ張り、電力や水道水のように日常生活において不可欠な資源へとスーパーコンピューティングを発展させている。

(3)スーパーコンピューティングは現在、人類の生産と生活の方式に深刻な変化をもたらしている。スーパーコンピューティング技術そのものが深刻な変革を目前にしており、その見通しははかりしれない。巨大なスーパーコンピューターは、コンパクトな情報処理設備として進化し、生産や生活の隅々にまで入り込み、クラウドコンピューティングやモノのインターネット、スマートデバイスなどを通じて、広大なネットワークを形成している。このようなユビキタスなスーパーコンピューティングとそれによって推進され支えられたインテリジェント製造やフレキシブル製造、仮想現実などの技術と産業は、「万物に魂が宿り」、「虚実が判別しにくい」時代をもたらすこととなる。人類は、エネルギーと資源が不足し、環境汚染や気候変動などで持続可能発展が重大な挑戦を迎える時に、まったく新しい能力を備えることとなる。生産効率は大きく高まり、エネルギーと資源の消耗は際立って低下し、人類の生存空間は大きく拡大され、より自由でグリーンな生活方式が次々と生まれるだろう。

 スーパーコンピューティングは、中国の自主革新と飛躍的な発展にとってとりわけ重要であり、発展が進むにつれてその重要性はますます高まることとなる。これまでの15年間、中国は、多くの国家級科学技術プロジェクトと助成計画を手配し、中国のスーパーコンピューティング能力の向上を力強く推進して来た。「天河」や「曙光」、「神威」などの一連のスーパーコンピューターの開発の成功は、国家級スーパーコンピューティングインフラを世界の先頭集団に仲間入りさせ、相応の規模の国家級高性能コンピューティングサービス環境を形成し、多くの重大な分野での応用を下支えして来た。このためスーパーコンピューティングに対する国家の投入を引き続き保持し、スーパーコンピューター技術の絶え間ない研究と革新を続け、中国のスーパーコンピューティングの発展をさらに高い段階に上昇させることは、国家の経済社会のモデル転換と高度化、中華民族の偉大な復興にとって、重要な戦略的意義を持っている。

2 挑戦と課題

 商品化された汎用ハードウェアを主導とした発展モデルは、効率やエネルギー消費、安定性などの問題から、すでに立ち行かなくなっている。応用に牽引されたモデルが少しずつ主流になりつつある。この転換のチャンスをつかむことで、中国のスーパーコンピューティングは飛躍的発展と全面的なリードを実現する望みがある。

 スーパーコンピューティングは重大な意義を持ち、急速に発展しているものの、近年は、重大な挑戦と発展の難題に直面しており、新たな考え方によってこれを突破することが迫られている。1990年代以来、商品化された汎用プロセッサの急速な発展は、スーパーコンピューターの発展を大きく促進してきた。HPC Top500[3]の統計によると、2000年以来、商品化された汎用ハードウェアを用いて構築されたスーパーコンピューターの数量は最高時で総量の90%以上に達した。だがコンピューターシステムの規模の増大とピーク演算性能の高まりにつれて、「商品化ハードウェア―ソフトウェア―応用」のモデルによって開発された機器は新たな挑戦に直面している。

(1)応用効率の低下。商品化された汎用ソフト・ハードウェアは、難度の高い分野の演算問題またはビッグデータの処理問題への照準を欠いており、システムの演算資源の利用率が比較的低く、機器の実際の性能は大きく制限され、大多数の機器で実際の応用効率はピーク性能の10%前後に過ぎない。

(2)運用の出力ロス。システム規模の拡大は、機器の電力消費量の急激な増加をもたらし、ハイエンドなスーパーコンピューティングシステムのエネルギー消費はすでに10メガワット級に達している。だが性能・エネルギー消費比の向上は遅滞しており、機器の運営コストは受け入れがたいものとなる。

(3)システムの信頼性が低い。システムのプロセッサのコア数が百万級以上、主要デバイスの数量が1千万級以上に達する現在、ハイエンドシステムの平均故障間隔を数時間レベルにまで到達させることはすでに困難となっており、高信頼性に対する影響は極めて大きい。

 さらに開発投入も、前期は多いが後期は少ない傾向にある。とりわけ中国では大型アプリケーションソフトウェアの開発の投入が不足しており、応用開発が深刻に遅れ、機器の潜在力を発揮することがなかなかできていない。こうしたモデルの下では、商品化された汎用ハードウェアの漸次的な技術改善に頼っているだけでは、スーパーコンピューターシステムのユーザビリティと需要に対する適応性が低下し続け、マシン全体の実用性もアルゴリズムの並列性とシステムの安定性の制限から大きく目減りし、マシン全体の性能の追求という意義が失われている。

 こうしたモデルの下では、商品化ハードウェアに向けたソフトウェアとアプリケーションの開発も、ハードウェアシステムの開発に常に遅れを取ったものとなる。商品化基盤技術の急速な発展は、スーパーコンピューティングシステムの有効使用年限を非常に限られたものとし(一般的に5年から7年)、研究開発や製造コスト(しばしば数億元にのぼる)と運営保守費用をますます高め(年間数千万元に達する)、こうした遅れがもたらす資源の浪費を非常に巨大なものとしている。コストやエネルギー消費、効率、フォールトトレランス、安定性などの問題で信頼できる解决案がないことから、世界ではいくつかの検討中のエクサスケールコンピューティングプロジェクトが数度にわたって延期されている。

 こうした苦境の背後にある共通の問題は、商品化されたソフト・ハードウェアの研究開発において、応用対象の構造に対する分析と利用が不足しており、コンピューターと演算対象の論理構造と物理構造が一致していないということにある。近年のマイクロエレクトロニクスと集積回路の分野での発展の趨勢は、演算部品の速度の向上が速く、エネルギー消費が低く、メモリ・通信部品の速度(帯域幅と遅延)の向上が遅く、エネルギー消費が高いというものである。両者の間の差を埋めるためには、マルチレベルのデータのキャッシュと交換を導入する必要がある。だがこうした補償は、演算ソフトウェアが相応する並列性とデータのローカル性を持っている時だけに適用される。そうでなければ、プロセッサ設計の複雑性の高まりと部品の利用率の低下、プログラミングの難度の高まりを招くのみとなる。応用から出発しなければ、演算対象の物理構造と演算の特徴から見て、演算ソフトウェアは、問題の内在的な並列性を十分に掘り出し、利用することが難しい。もう一方では、演算対象の構造と特徴を深く考慮すれば、現行の複雑なハードウェア設計は必要でないだけでなく、内在的な並列性の十分な発揮をむしろ阻止するものともなり得る。

 実際、大多数の演算対象の論理構造はいずれもマルチスケールのものである。だが現在、多くのスーパーコンピューティングシステム中の基本処理要素は依然として、ホモジニアスで単一スケールのものであり、メモリと通信の面での巨大な浪費を生み出している。最新のヘテロジニアスなスーパーコンピューティングシステムは、ダブルスケールの並列をサポートできるが、基本処理要素は依然としてホモジニアスなものにとどまっている。これらの問題を解決するための根本的な方法は発展モデルを改変することであり、商品化ハードウェアによる牽引から応用による牽引への転換をはかり、応用モデルの革新から着手し、演算モデルや体系構造、ソフト・ハードウェアの革新を引っ張る必要がある。これは中国にとって大きなチャンスと言える。

3 発展の考え方と戦略

 商品化汎用ハードウェアの発展のボトルネック問題と中国のハードウェア製造における劣勢を回避するためには、演算対象やモデル、ソフトウェア、ハードウェアの論理と構造の一致性を焦点とすることがスーパーコンピューティングの必然的な発展の趨勢であり、中国のスーパーコンピューティングの自主的で制御可能な飛躍的発展のための貴重なチャンスとなる。

 応用の角度から見ると、スーパーコンピューティングが国際的に直面している多くの問題は本質的にいずれも、演算対象の物理的構造と論理的特徴を十分に考慮しないことと関係している。この角度から出発することができれば、スーパーコンピューティングは今後、まったく新しい重大な発展のチャンスを迎えることとなる。その核心は、高効率のスーパーコンピューティングが、演算対象とモデル、ソフトウェア、ハードウェアの論理と構造の一致性を体現しているということにある。このような構造は、物理過程の普遍的で内在的なマルチスケール構造であり、グローバル相関から近距離相関へ、安定性の制約から動力学的な制御へという共通の特徴を備えている[4]

 演算対象の構造的特徴を利用することで、ハードウェアシステムの設計を有効に簡略化することができる。物理過程のマルチスケール分解を通じて、ラージスケールの長距離相関とスモールスケールの近距離作用を分離するということである。後者の演算量は非常に大きいが、十分に並列させることができる。前者は、並列は難しいものの、分解後の残余の演算量は比較的少ない。両者の結合は、システム全体の変遷を簡単かつ効率的に計算することを可能とする。ここにおけるマルチスケール分解は、ただの数学上の分解ではなく、物理メカニズムに基づいた簡略化と分解である。安定性の条件を導入することは、未確定のパラメータを要求するモデルを数学的に封印できると同時に、合理的な制約条件を物理的に導入し、演算量を大きく減らし、演算の精度を保証するものとなる。もしこの考え方を演算ハードウェアの設計に貫徹させることができれば、もたらされるプロセッサのマイクロ構造の簡略化設計は、中国の核心基板部品の自主的で制御可能な発展とマシン全体の技術の飛躍的な発展に近道を提供するものとなる。

 演算対象やモデル、ソフトウェア、ハードウェアの論理と構造の一致性は、自然界の内在的な階層性と並列性を反映したものであるため(階層性は一種の垂直な並列性である)、これには高い普遍性が備わっている。これによって設計されたスーパーコンピューティングシステムは、効率を高めると同時に、その汎用性には大きく影響せず、むしろ各分野の研究方法をシングルスケールの平均からマルチスケールの連成への方向に発展させるものとなる。同時にこのような物理・演算システムの内在的な一致性は、量子計算や生物模倣計算など、より基礎的なレベルから自然賦存を利用する破壊的な技術の発展と応用に適している。

その2へつづく)

参考文献:

[1]. Report to the President on Computational Science: Ensuring America’s Competitiveness, 2005. [2016-2-20]. https://www.nitrd.gov/Pitac/Reports/20050609_computational/computational.pdf.

[2]. Ashby S, Beckman P, Chen J, et al. The Opportunities and Challenges of Exascale Computing. The ASCAC Subcommittee on Exascale Computing, USA, 2010.

[3]. Top500 supercomputer sites. [2016-2-20]. http://www.top500.org/

[4]. Li J H, Ge W, Wang W, et al. From Multiscale Modeling to Mesoscience. Berlin: Springer, 2013.

※本稿は葛蔚,郭力,李静海,陳左寧,胡蘇太,劉鑫「関于超級計算発展戦略方向的思考」(『中国科学院院刊』第31卷第6期、2016年、pp.614-623)を(『中国科学院院刊』編集部の許可を得て日本語訳・転載したものである。記事提供:同方知網(北京)技術有限公司