「AI受験生」が上位大学の文系学部に「合格」

2024年07月02日

　2024年の中国大学統一入学試験（通称「高考」）が終了すると、中国内外のさまざまな大規模AIモデルが相次いで試験問題に挑戦した。文系では「GPT-4o」が全体のトップとなり、中国製品では「豆包」がトップだった。中国新聞網が伝えた。

　今回、「大規模AIモデル受験生」として、OpenAIの「GPT-4o」、字節跳動（バイトダンス）の「豆包」、百度（バイドゥ）の「文心4.0」、百川智能（バイチュアンAI）の「百小応」、阿里巴巴（アリババ）の「通義千問2.5」などが試験に挑んだ。試験問題は河南省の受験生に実際に出題されたものが使われた。

　成績を見ると、文系ではGPT-4oが562点で全体のトップとなり、中国製品では豆包が542.5点でトップだった。同省の上位大学の文系合格ラインは521点で、中国製品では豆包、文心4.0、百小応が合格圏内に入った。

　インターネット上に公開された資料を総合すると、文系試験でAIはそろって優れた成績を上げ、特に言語類科目では一定の論理と言語を組み立てる能力の高さを示した。ところが、作文では、大規模AIモデルの文章は構成が明確で筋も通っているものの、理性が勝り感性が劣る傾向が軒並み存在し、感情的な面や訴えかける点でもの足りなかったという。

　理系ではAIモデルの成績はどれも振るわず、大半の総合得点が400点以下で、河南省の合格ラインの511点とは開きがあった。9製品のうち、GTP-4o、文心4.0、豆包が数学の試験で60点以上を取ったが、150点満点なので合格からはほど遠かった。調査・実験・探求能力に重点が置かれる化学と物理の試験では、各AIモデルの平均点は化学（100点満点）が34点、物理（110点満点）が39点だった。

　今回の試験結果を見ると、AIは文系分野で一定の優位性を示し、特に言語処理と知識記憶の面で突出した成績を収めた。河南省の大学受験成績ランク統計データを見ると、GPT-4oは562点で文系受験生の中で8811番目になり、実際の受験生なら上位2.45％に入る。中国製品では豆包が上位の約4.27％に入った。

　理系分野では、深い論理的推論と臨機応変の柔軟な対応力が求められる問題は、AIモデルにとって依然として非常に大きな課題だと言える。これらを総合すると、AIは特定のタイプのタスクで高い能力を発揮するが、知識を総合的に運用して実際の複雑な問題を解決する面では、まだ人類の知的水準には及ばないことがわかった。

2024年05月07日: AIが従来の検索エンジンに取って代わる存在に？（その１）
2024年04月17日: 中国で業界特化型AIモデルが次々と誕生

「AI受験生」が上位大学の文系学部に「合格」

2024年07月02日

関連記事