【22-05】産業スマート化・高度化に大きく寄与するAI大規模モデル
劉 艷 付麗麗(科技日報記者) 2022年05月16日
人工知能は新世代産業変革のコア駆動力の一つで、その発展は、「モデルの大規模トレーニング」から、少しずつ「大規模モデルのトレーニング」の段階へと入っている。先進的なアルゴリズム設計を通して、できるだけ多くのデータを集約し、大量のハッシュレートを集め、集約化して大規模モデルをトレーニングすることにより、多くの企業にサービスを提供するというのが、人工知能の発展の新たなトレンドとなっている。
ロボット「小科」が「国家『第13次五カ年計画(2016~20年)』テクノロジーイノベーション成果展」で披露され、北京テレビ局は北京冬季五輪の実況中継に人工知能を駆使して手話通訳をするバーチャルアナウンサーを採用した。
多くの人は大規模モデルという概念及びその背後の技術的ブレイクスルーについては十分に理解していないにもかかわらず、世界最大のプレトレーニングモデル「悟道2.0」が主導するその応用は広く知られるようになっている。
昨年、北京智源人工知能研究院(以下「智源研究院」)は大規模モデル「悟道」を発表して、「中国初」と「世界最大」の記録を連続して打ち立ててきた。
それをシンボルに、ますます多くの研究機関や企業が「大規模モデルトレーニング」とスマート包摂推進の列に加わり、世界の人工知能技術発展と応用に中国の知恵と力を提供している。
包摂な社会のためにサービスを提供する悟道2.0
昨年6月1日、智源研究院や清華大学といった複数の機関が共同で開発した悟道2.0が発表された。そのパラメーター数は1兆7500億に達し、それまでの海外のプレトレーニングモデルの記録1兆6000億を超え、中国初で、世界最大の1兆クラスのプレトレーニングモデルとなった。
智源研究院の学術副院長を務める清華大学の唐傑教授によると、完全国産のGPU搭載スーパーコンピューターに基づいて打ち出された悟道2.0は、複数の世界レベルのイノベーションとブレイクスルーを達成した。また、プレトレーニングモデルの枠組み、アルゴリズム微調整、効率的なプレトレーニングの枠組みなどの面で、原始理論のイノベーションを実現した。世界公認の人工知能能力ランキングで、能力9項目でリードしている。
大規模プレトレーニングモデルの産業の普遍性や使いやすさを向上させるべく、悟道のチームが構築した効率的なプレトレーニングの枠組みは、オールリンクのオリジナルブレイクスルー、反復法を用いた最適化を実現し、プレトレーニングの効率が大幅に向上した。
唐教授は、「ニーズの多様化やシーンの断片化は、AIの応用の面で普遍的に存在している難点だ。オープンプラットフォームの悟道は、手軽で使いやすいと同時に、大規模化、産業化といったAI応用をめぐる問題解決をも重視している。大規模モデルの悟道は、『ハードルが低い+効率的+EQが高い』という特徴を備え、異なる業界や企業の大規模化、産業化の応用ニーズを満たすことができる。どんな企業、開発者であってもオープンソースの悟道2.0のプレトレーニングの枠組みを手に入れれば、すぐに配置して、実際の業務に応用できる」と説明する。
OPPO傘下のオープン型対話バーチャル音声アシスタントの小布は、大規模モデルの悟道が切り開いた「生成型応答システム」に基づいており、業界で共通するロングテール問題を解決し、応答1つ当たり生成コストを99%削減した。
効率的な機械翻訳やスマートな会話カスタマーサービス、音声放送がEC、メディア、教育、スマートハードウェアといった分野で既に、強大な発展のスペースを作り出し、大規模モデルが整えた汎用人工知能へと邁進する方向性は巨大なポテンシャルを秘めていることが検証されている。
智源研究院の張宏江理事長は、「今後、大規模モデルは電力網に似たスマート基礎プラットフォームを作り出し、発電所のように社会全体に『知力』を無限に供給し、各業界に効率的に恩恵をもたらすだろう」との見方を示す。
悟道2.0の超大規模スマートモデルトレーニング技術体制は、中国が人工知能応用のために構築したインフラで、従来型業界のスマート化改造、高度化のために既にサービスを提供し始めている。
新型研究開発メカニズムを構築
悟道の大規模モデルの開発により、中国の超大規模スマートモデル技術の独自コントロールと、先端技術の牽引を実現した。智源研究院の黄鉄軍院長は、3つの視点から、研究開発のメカニズムについて説明した。
一方で、新時代に「力を集中させて大きな事をする」という科学研究組織スタイル、つまり、重要な科学的問題に対する鋭い見方を保ち、ニーズ志向や問題志向で重要科学研究任務を計画し、大きな任務を迅速に論証・始動できるメカニズムを構築し、機関を横断し、しっかりと協力する強力な科学研究チームを立ち上げ、大きな問題を解決しなければならない。他方で、人材を中心に、自由な模索を奨励し、真実を追求し、実務に励む姿勢を堅持し、年功序列ではない人材発展スタイルを採用し、「代表作」や「業界内の評価」による人材選抜スタイルを堅持し、何かをする意欲と能力を持つ若手人材が中心的な役割を担うか主役になるようにしなければならない。
張理事長は、「当研究院は、『永遠に若い研究院』になることを目標に、若手学者の誘致を重視し、若手学者と共同で科学研究の新しいパラダイムを作り出すことを願っている。当研究院は、『代表作文化』を高く評価し、出身は不問で、論文数を見ることもなく、代表的な成果、代表的な存在になるポテンシャルを秘めているかしか見ない」と説明する。
唐教授は、「智源研究院は今後、引き続きメカニズムのイノベーションを推進し、頂点に立つと同時に、しっかりと足元も固めなければならない。そして、さらに多くの学者を呼び込んで、さらに多くの悟道のような大規模モデルの科学研究『代表作』を創出する。北京が率先して世界を牽引する人工知能イノベーションセンターになるよう推進すると同時に、エコシステムを構築し、技術と産業を連結させ、人工知能産業発展や一歩踏み込んだ応用を推進していく」との見方を示す。
産学研が相次いで参入
「新3年計画」のスタート地点に立ち、悟道は今後、さらにスマート化し、ハードルを下げ、エコシステムを構築するなど複数の視点から、有用性を高めるよう邁進する。
ますます多くの研究機関と技術企業が参入するにつれて、バーチャルデジタルヒューマンをはじめとする、大規模モデル応用に基づく技術革新、産業成果が中国全土で開花している。
昨年7月9日、中国科学院自動化研究所はクロスモーダル人工知能プラットフォーム「紫東太初」を発表した。このフルスタック国産化のプラットフォームに基づき、マルチモーダルの大規模モデルを中心として作り上げたバーチャルヒューマン「小初」は、画像や文字、音声を理解することができ、画像、文字、音声の3種類のモーダルを組み合わせて、協調させる能力を実際に備え、人工知能と人間の想像力の距離がさらに縮まった。
昨年9月28日、浪潮人工知能研究院は、人工知能巨大容量モデル「源1.0」を発表した。発表当時、このモデルは既にここ5年近くの中国語のインターネット上の膨大な量のコンテンツをほぼ読み終わっていた。
浪潮情報の劉軍副総裁は、「巨大容量化は、モデルのパラメーターが多く、トレーニングデータが膨大というのが主な特徴。源1.0のパラメーター数は2457億に、トレーニングデータ集の規模は5000GBに達する」と説明する。
中国工程院の王恩東院士が語るように、ロボットに人間と同じような論理、意識、推理といった認知能力を備えさせるというのが、コンピューター科学の一貫した模索、研究の方向性だ。「感知知能」をめぐる問題が比較的よく解決された後、人工知能の発展は、各種イノベーションを通して、さらに複雑な「認知知能」をめぐる問題を解決する発展段階に入っている。
黄院長は、「人工知能は新世代産業変革のコア駆動力の一つで、その発展は、「モデルの大規模トレーニング」から、「大規模モデルのトレーニング」の段階へと少しずつ入っている。先進的なアルゴリズム設計を通して、できるだけ多くのデータを集約し、大量のハッシュ‐レートを集め、集約化して大規模モデルをトレーニングすることにより、多くの企業にサービスを提供するというのが、人工知能の発展の新たなトレンドとなっている」との見方を示す。
※本稿は、科技日報「AI大模型:為産業智能化昇級"開閘放電"」(2022年3月11日付5面)を科技日報の許諾を得て日本語訳/転載したものである。