中国北京市で28日に開かれた中関村フォーラム人工知能(AI)大規模モデル発展サブフォーラムで、中国科学技術情報研究所と科学技術部(省)新世代AI発展研究センターが関連研究機関と共同で作成した「中国AI大規模モデルマップ研究報告」が発表された。湖南日報が伝えた。
報告は、世界の大規模モデル技術の発展経緯を整理し、グーグルが2017年に「Transformer(トランスフォーマー)」ネットワークアーキテクチャを発表してから5年余りの間に、世界で膨大な大規模モデル技術クラスターが形成され、各種技術アーキテクチャやモーダル、シーンをカバーする大規模モデルファミリーが生まれたと指摘した。
報告によると、米グーグルやOpenAIなどが大規模モデル技術の最先端をリードし続けており、欧州やロシア、イスラエル、韓国など、多くの研究開発チームも大規模モデルの研究開発に取り組むようになっている。世界で発表された大規模モデルの分布を見ると、中国と米国が大きくリードしており、世界の総数の80%を占めている。米国は大規模モデル数で常に世界トップを維持している。
中国は2020年に大規模モデルの急成長段階に入り、現在は米国と同程度の成長を維持している。自然言語処理(NLP)やマシンビジョン、マルチモーダルなどの各技術分野で歩調を合わせ、急速に発展している。「盤古」や「悟道」「文心一言」「通義千問」「星火認知」など、業界で影響力を持つ複数のプレトレーニング大規模モデルが誕生し、世界の最先端を追いかける大規模モデル技術クラスターを形成している。
報告は、公開情報に基づき、中国で発表された79の大規模モデルを整理、分析した。その結果、中国では現在、14省・直轄市・自治区で大規模モデルの研究開発が行われている。北京市と広東省が最も多く、地域の集中度が比較的高い。分野別では、自然言語処理が大規模モデル研究開発の最も活発な重点分野で、これにマルチモーダル分野が続いている。マシンビジョンやスマート音声などの大規模モデルはまだ少ない。
モデルの影響力では、清華大学、アリババ(阿里巴巴)、百度が共同開発した「CogView」モデルの論文の被引用数が最も多い。ファーウェイ(華為)の「FILIP」、百度の「ERNIE3.0」、アリババの「M6-OFA」の被引用数も上位で、大規模モデル分野で高い学術的影響力を形成しているが、海外トップの大規模モデルの学術的影響力と比べるとまだ大きな開きがある。