【24-62】「エンボディドAI」が今後のAIの中心に?(その1)
崔 爽(科技日報記者) 2024年07月04日
北京市中関村展示センターで展示されている人型ロボット。(画像提供:視覚中国)
米スタートアップ企業「Figure」が開発した人型ロボットの動画が、「人間に外観や動きがそっくり」という理由で大きな話題となっている。このロボットは人間と自然な会話ができ、人間の意図を理解することもできる。例えば、エンジニアが「何か食べ物を下さい」と指示すれば、少し考えてから、リンゴを取り、手渡してくれる。さらに、自分がどうしてそのような行動をしたのかも理解している。
この人型ロボットには、OpenAI社の大規模言語モデルが搭載されている。マルチモーダル技術のサポートにより、このロボットはハイレベルの視覚と言語知能を備えている。
大規模言語モデルやロボット製造などの技術の進歩に伴い、人工知能(AI)に身体性を持たせた「エンボディドAI」がAIの舞台において中心になりつつある。
エンボディドAIはAI産業の重要な発展方向性の一つだ。米半導体メーカーのNVIDIAはこのほど、ロボットにさらにスマートな「脳」を持たせるべく、人型ロボット向け汎用AI大規模モデル「Project GR00T」を発表した。「Project GR00T」を搭載したロボットは自然言語を理解できるほか、人間の行動を観察して、その動きを模倣することもできる。また、米電気自動車(EV)メーカー、テスラは2023年度株主総会で、イーロン・マスク最高経営責任者(CEO)が最新バージョンの人型ロボット「Optimus(オプティマス)」を発表した。これらはいずれもエンボディドAIが急激な発展段階に入ったことを示すものだ。
エンボディドAIはAI技術の集大成
エンボディドという概念は、英国の計算機科学者、アラン・チューリングが1950年代に論文の中で初めて言及したものだ。
中国の市場調査会社、賽迪顧問(CCIDコンサルティング)AI・ビッグデータ研究センターの鄒徳宝常務副総経理は「エンボディドAIはAIから派生した重要分野の一つで、エージェントとその物理的環境の緊密なインタラクションを強調しており、人型ロボットなどのエージェントによって、感知や意思決定、行動を実現する。AIはカメラやセンサーなどによって環境を理解し、ロボットアームや車輪などを通じて物理世界に作用し、物理的空間で学習、適応して指令を実行する」と説明した。
これにはAIのほぼ全ての技術が含まれており、「AIの集大成」と言うことができる。
AI搭載ロボットの開発を手掛ける達闥(クラウドマインズ)の創業者兼CEOの黄暁慶氏は「AIの強大な能力をフルに発揮させるためには、その能力を実際の形を持つロボットに搭載しなければならない。それをエンボディドと呼ぶ」と語った。
さらに「生物学的観点から見ると、人間は自然選択の産物であるため、汎用性を備えた究極のロボットの形態は人間と同じになるはずだ。機能性という視点から見ると、ロボットが人間の代わりに全ての物事をこなすためには、人間と類似した形態にしなければならない。AIの発展という視点から考えると、大規模言語モデルのトレーニングには大量のデータが必要だが、人間の言語や行動、知能などのデータや情報は極めて豊富であり、人型ロボットはトレーニングデータも最大限取得することができる」と見解を述べた。
鄒氏は「AIシステムに形を与えることで、ユーザーとの間のインタラクティブがより直観的かつ自然でスムーズになる。形を持つことでAIシステムが現実の世界をより感知し、理解できるようサポートすることもできる。形を持ったAIシステムは、さらに多くの分野、特に人間と密接に協力する必要があるシーンで応用することができる。例えば、医療分野では、形を持ったAIロボットが医師の手術をサポートすることができる」と説明した。
技術の進歩と課題が共に存在
大量のデータと強大な計算能力を有する大規模言語モデルは、マシンが世界を理解するための未曾有の能力を提供している。大規模言語モデルとエンボディドを結び付けることで、ロボットが今後、よりスマートでインタラクティブになっていくだろう。
中国工業・情報化部(省)が昨年11月に発表した「人型ロボットの革新的発展における指導意見」では、「人型ロボットにはAIや先端製造、新材料などの先進技術が集約されており、発展のポテンシャルが大きく、広い応用の見通しがあり、未来の産業における新たな競争の場になる」と指摘している。
鄒氏は「エンボディドAIの発展では、主に3つの面に注力すべきだ。1つ目はバイオニックメカニズムだ。マシンが生命体と同じような感知、意思決定、行動などの能力を備えるというのが、エンボディドAIの重要な目標の一つだ。そのため、神経系の働きや生命体の自己治癒力といった、より複雑な生物メカニズムを研究し、シミュレーションすることが、目標達成に向けた重要な手段となる。2つ目は、物理に基づいたスマートな意思決定能力だ。インテリジェントシステムが、自身を搭載した物理形態とより密接に融合することで、さまざまな環境下で自然かつ効果的にタスクを実行することができるようになる。つまり、より先進的なロボットのハード・ソフトウェア技術を発展させ、インテリジェントシステムの複雑な環境における動作や操作をサポートする必要がある。3つ目は、自主的に学習し、環境に適応することだ。エンボディドシステムが複雑で変化が多い環境下でタスクを実行し、問題を解決するためには、自主的に学習し、環境に適応する能力を備える必要がある。このことは、強化学習や転移学習といったマシンラーニング技術によって実現することができる」と指摘した。
(その2 へつづく)
※本稿は、科技日報「具身智能:步入AI舞台中央?」(2024年5月27日付6面)を科技日報の許諾を得て日本語訳/転載したものである。