中国のスーパーコンピュータ開発40年:MFLOPSから100 PFLOPSへ
2015年 6月30日
李 磊:法政大学理工学部 教授
略歴:
1961年中国江蘇省生まれ。1989年中国西安交通大学大学院理学研究科計算数学専攻博士課程修了、理学博士。1989年弘前大学大学院理学研究科研究生(日本政府国費)。1992年青森大学工学部助教授、工学博士(東北大学、1994年)。1997年山口大学理学部助教授。
2000年~2001年ニューヨーク州立大学客員研究員(文部科学省派遣)。2002年法政大学工学部(現理工学部)教授、同大学院工学研究科長、理工学部教授会主任、小金井図書館長等を歴任。
1.スーパーコンピュータの開発背景
いわゆる逐次処理方式を用いたノイマン型コンピュータの限界を見通して、1960年代から非ノイマン型の並列処理方式を用いる並列計算機(スーパーコンピュータ)の研究開発は盛んになり始めた。最近の光コンピュータや量子コンピュータなど、情報の表現や情報処理の稼働方式を本質的な転換を図ろうとする発想と違って、従来のノイマン型コンピュータの単一な処理の流れを複数の処理装置または複数の処理ステップを用いて並列に実行する、というアイデアは、"数による量的な転換"にすぎない単純なものである。並列と言っても、コンピュータアーキテクチャの構成やプロセッサ・メモリ同士の接続方式などには、様々な可能性があり、実在または開発中の並列計算機は多種多様である。すべてのコンピュータは何らかの基準で分類することは研究上では重要なことであろう。現在、スタンフォード大学計算機研究所長のM.J. Flynn教授の指令ストリームとデータストリームを着目した処理方式による分類法が定着している。Flynn教授は筆者の東北大学指導教官である中村維男教授の計算機アーキテクチャ国際研究プロジェクトのメンバーでもあった。
Flynn教授の分類法は、すべてのコンピュータをSISD型、SIMD型、MISD型、MIMD型の4種類に分類する。ここでのSはSingle(単一の)、MはMultiple(複数の)、IはInstruction(指令の流れ)、DはData(データの流れ)の略称である。即ち、従来のノイマン型コンピュータはSISD型になるが、SIMD型は単一の指令の流れで複数のデータの流れを同時に処理できるアレー型並列計算機と呼ばれ、MISD型は工場で部品の組み立てなどでよく見られるパイプライン方式を利用したベクトル計算機であり、MIMD型は最も一般的で、複数の異なる指令の流れで複数のデータの流れを同時に処理できる、いわゆる本当の意味での並列計算機を意味する。21世紀に入り、最近のスーパーコンピュータはほとんどMIMD型である。
2.なぜ中国はスーパーコンピュータが必要か
アメリカは20世紀半ばごろから、世界の科学技術の先駆者となり、スーパーコンピュータの分野でも例外ではなかった。1965年に開発されたIBM 2983 Array Processorは世界最初の並列計算機であるといわれ、その後、ASCベクトル計算機(1972年, Texas Instruments社, 30 MFLOPS)、Star-100 (1973年, CDC社, 50 MFLOPS)、ILLIAC IV (1973年, Burroughs社, 60 Processors, 50 MFLOPS)、BSP(1974年, Burroughs社, 16 Processors, 50 MFLOPS)が相次ぎ発表された。ここでのMFLOPSは並列計算機の演算速度の指標の一つであり、1秒で処理できる百万回浮動小数点演算の倍数を意味する。その他に、GFLOPS(=1000 MFLOPS)、TFLOPS(= 1000 GFLOPS)、PFLOPS(= 1000 TFLOPS)などの指標がスーパーコンピュータの性能評価に利用される。1976年に発表された米国Cray Research社のベクトル計算機Cray-1は初めて1秒で1億回以上の算術演算が実行できる160 MFLOPSに達成したとき、大きなニュースとなり、電子計算機の開発者及び利用者にとっては多大な刺激を受けた。民生・国防産業を問わず、高性能コンピュータは科学技術発展全般に強い影響を与えており、当時の西側諸国からやや性能のよいワークステーションさえ輸入禁止されていた中国は、自主開発を決意した。
中国は国家プロジェクトとして、Cray-1が誕生する1年前の1975年から、スーパーコンピュータの研究開発に着手したといわれている。筆者は1980年代初め、中国の大学院在学中に並列計算機用の並列アルゴリズムの設計と解析に興味を持ち、勉強し始めた。当時、復旦大学、武漢大学、国防科学技術大学、中国科学技術大学、西安交通大学、華中科学技術大学等でそれぞれ並列計算機のハードウェア、ソフトウェア、アルゴリズム設計と大規模数値シミュレーションへの応用等の研究グループが存在していた。北京で開催される第1回中国並列アルゴリズムシンポジウムに参加し、中国の著名科学者である銭学森氏の開会挨拶で、「並列処理技術はハイテクの中でのハイテクである」という名言は非常に印象的だった。
3.国防科学技術大学の銀河シリーズ
1983年12月、中国初のスーパーコンピュータYH-1(銀河-1ベクトル計算機、100 MFLOPS)はその開発プロジェクトを担当する国防科学技術大学(湖南省長沙市)で発表された。Cray-1より7年遅れの発表になるが、Cray-1に及ばないものの、秒速1億回の演算速度が達成できたことは、その後の中国スーパーコンピュータの研究開発に対し、大きな励ましになったことに違いない。大学院生在学中であった筆者は、その間、指導教官の西安交通大学の游兆永教授(故人)と一緒に、国防科学技術大学で開催されるYH-1の性能鑑定会に出席した。その時期はまさに中国のスーパーコンピュータの草創期で、並列処理関連の研究者はそれほど多くはなかったこともあり、国防科学技術大学をはじめ、他大学の研究グループにも親しく盛んに交流できた記憶がある。
中国初のスーパーコンピュータYH-1
1986年、国防科学技術大学からのGFLOPS級のスーパーコンピュータの開発申請は中国政府に許可され、1992年11月にGFLOPS級のYH-2(銀河-2)の完成に成功した。MISD型のベクトル計算機YH-1からMIMD型並列計算機YH-2への転換である。その後、1997年のYH-3(10 GFLOPS級)、2000年のYH-4(1024 Processors, TFLOPS 級)が相次ぎ発表された。銀河シリーズ・スーパーコンピュータは天気予報、流体シミュレーション、応用物理工学、石油・エネルギーや地震関連の大規模のデータ解析に広く利用されている。
毎年6月と11月に、TOP500(http://www.top500.org)は世界のスーパーコンピュータのランキングを公表している。その評価指標は線形代数問題の並列計算パッケージLINPACK(主要開発者の一人であるUC DavisのZhaojun Bai教授は銀河-1時代の復旦大学大学院生だった)を実行されるFLOPSで勝負するものである。2010年に国防科学技術大学から2.5 PFLOPS 級のスーパーコンピュータ天河1号(Tianhe-1)は発表され、TOP500の1位になった。天河1号は2048個のプロセッサ(同大学のFT-1000)で構成される。また、その後、32000個のCPUを持ち、最高性能の33.86 PFLOPSになる天河2号(Tianhe-2)も発表され、2013年6月より2015年6月26日現在ではTOP500の1位となっている。
天河2号スーパーコンピュータ
4.中国科学院の曙光シリーズ
国防科学技術大学の銀河シリーズに並行して、中国科学院計算技術研究所は1990年代初めから曙光シリーズ・スーパーコンピュータの開発をスタートした。曙光1号(1992年、640 MFLOPS)、曙光-1000(1995年、2.5 GFLOPS)、曙光-1000A(1996年、4 GFLOPS)、曙光-2000Ⅰ(1998年、20 GFLOPS)、曙光-2000Ⅱ(1999年、111.7 GFLOPS)、曙光-3000(2000年、403.2 GFLOPS)、曙光-4000L(2003年、4.2 TFLOPS)、曙光4000A(2004年、11 TFLOPS)、曙光-5000A(2008年、230 TFLOPS)、曙光-クラウド(2010年、1.27 PFLOPS)などが発表された。その中で、発表当時に曙光-5000A は世界スーパーコンピュータのトップ10にランクインし、曙光-クラウドは世界でPFLOPS級の3台目のスーパーコンピュータになったことは注目される。中国科学院管轄の曙光会社の2014年5月の発表によると、100 PFLOPS級の曙光7000スーパーコンピュータは開発し始めたという。
曙光5000スーパーコンピュータ
5.国家並列計算機工程技術センターの神威シリーズ
一方、高性能並列計算機システムを研究開発するために、1996年に中国国家並列計算機工程技術センターは設立された。同センターは神威というスーパーコンピュータシリーズを開発している。1999年に発表された神威-Ⅰ(384 GFLOPS)からスタートし、2007年の神威-3000A(18 TFLOPS)に続き、2011年10月、すべて中国国産CPU処理装置を用いる1.1 PFLOPSのスーパーコンピュータ、神威藍光が稼働開始した。このスーパーコンピュータは8704個の中国国産の申威1600プロセッサ(16コア64ビット)で構成される。また、システムを拡張すれば、更に10 PFLOPS級までのスピードアップが可能になるという。
PFLOPS級の中国スーパーコンピュータ神威藍光
6.Lenovo グループの深騰シリーズ
そのほかに、パソコンメーカとしてよく知られる中国lenovoグループが深騰というスーパーコンピュータシリーズを開発している。最初の深騰1800(2002年、1 TFLOPS)から、深騰6800(2003年、5.3 TFLOPS)、深騰7000(2008年、106 TFLOPS)、深騰X(開発中、1 PFLOPS)がある。
7.終わりに
中国は1975年からスーパーコンピュータの研究開発に着手してから、40年が過ぎ、累計投資100億元超(およそ2000億円以上)になるといわれている。スーパーコンピュータの演算速度は並列計算機を構成する個々のプロセッサの性能、増え続ける大規模のプロセッサ個数、プロセッサを相互結合するネットワークの直径と次数などのパラメータによるものと思われる。理論上の相互結合網の直径と次数の最適値は実用上では困難な面もあるが、活用できる空間はまだまだ残っていると思う。中国としては、高性能国産プロセッサの開発は言うまでもないが、神威藍光で注目されているように、中国国産チップを用いる100 PFLOPS級以上のスーパーコンピュータの開発を目指すものと思われる。
中国は世界一の人口大国、世界一のインターネット利用者大国で、ビッグデータ処理の需要も今後ますます膨らんでくる。中国各地で設置増え続けるクラウド計算センターからでも推測できるように、民間需要からの刺激も大きくなり、スーパーコンピュータの利用経験も今後さらに蓄積されると思われる。