科学技術
トップ  > コラム&リポート 科学技術 >  File No.24-96

【24-96】AIが「想像力」を「生産力」に変える(その1)

崔 爽(科技日報記者) 2024年10月23日

2024雲栖大会で、荷物のピッキングをする人型ロボットを見る来場者。(画像提供:視覚中国)

 中国浙江省杭州市で9月に開催されたアリババクラウド(阿里雲)が主催するグローバルAI会議「雲栖大会(Apsara Conference 2024)」では、来場者がブースに設置されたコンピューターで中国のゲーム「黒神話:悟空(Black Myth: Wukong)」をプレイしていた。驚いたことに、現場のコンピューターには本体がなく、ディスプレイだけだった。

 本体がないコンピューターはどうやって実現したのだろうか。ブースのスタッフによると、アリババクラウドのクラウドデスクトップサービス「無影雲電脳(Elastic Desktop Service)を活用したという。「無影雲電脳」はターミナルクラウドコンピューティング技術と大規模言語モデルの能力をベースにして、高速ネットワークを通じ、カスタマイズされたコンピューターソースをユーザーに分配することができる。ユーザーは個人のパソコンやモバイルデバイスでアプリケーションをダウンロードすると、それがクラウド上のスーパーコンピューターとなり、ゲームを楽しんだり、複雑な画像処理やデータ計算を行うことができる。

 今回の大会では、大規模モデルや自動運転、ロボットなどの業界の専門家や従事者が一堂に会し、人工知能(AI)時代におけるクラウド上のイノベーションを共有し、各業界におけるAI技術の応用の現状や今後のポテンシャルについて語り合った。

未曾有のペースで発展するAI

 統計によると、現在、中国にあるAI企業は4500社以上だ。また、今年8月時点で、中国で登録された一般向けサービスを提供する生成AIサービスの大規模モデルは190以上に達し、ユーザー登録数は6億を超えている。

 AIスタートアップの階躍星辰(StepFun)の創業者である姜大昕最高経営責任者(CEO)は「昨年はOpenAIが開発したマルチモーダル大規模言語モデル『GPT-4』の独壇場だったが、今年は新モデル、新製品、新応用がほぼ毎月発表されており、多くの会社が台頭し、激しい競争を繰り広げている」と説明した。

 姜氏の言う通り、猛烈な勢いで発展している大規模モデルは現在、テキストや音声、視覚といったマルチモーダル能力を備え、複雑な指示を出すことができるようになっている。また、モデルの推理コストが指数関数的に下がり、オープンソースエコシステムが勢いよく発展している。大会の会場では、大規模モデルの通義(Tongyi)や百川(Baichuan AI)、「月之暗面(Moonshot AI)」のAIアシスタント「Kimi」、智譜AI(Zhipu AI)の大規模モデル「GLM-4」、零一万物(01.AI)のシリーズ大規模言語モデル「Yi」などがその能力を披露していた。また、画像生成、3D生成、音声・動画生成、AIコーディングなど10種類以上のマルチモーダルモデルが、没入型のインタラクション体験を演出していた。

 アリババ集団CEOでアリクラウド智能集団の呉泳銘董事長兼CEOは「過去22カ月の間、AIは未曾有のペースで発展した。汎用人工知能(AGI)は依然として変革の初期段階にある」と指摘した。

 そして、「本当の意味でAGIを実現するためには、次世代モデルが、さらに大きな規模で、幅広く、一般的な知識体系や、もっと複雑でマルチレベル化した論理推理能力が必要だ。世界の最先端モデルの競争に参入するためのハードルは、数十億から数百億ドル(1ドル=約151円)にまで上がっている。AIの創造力や、人間をサポートして複雑な問題を解決する能力の未来は明るい。AIの各業界における幅広い応用が今後、可能になるだろう」との見方を示した。

その2 へつづく)


※本稿は、科技日報「AI让"想象力"变成"生产力"」(2024年9月30日付6面)を科技日報の許諾を得て日本語訳/転載したものである。

 

上へ戻る