科学技術
トップ  > コラム&リポート 科学技術 >  File No.24-87

【24-87】AIを使ってAIを検出:「矛」と「盾」はどちらが強い?(その2)

呉葉凡(科技日報記者) 2024年09月13日

AIを検出する方法としては、モデル訓練分類器法(教師あり学習分類器法)、ゼロショット分類器法、テキストウォーターマーク(電子透かし)法の3種類がある。これらは本質的にはすべて「AIを使ってAIを検出する」もので、それぞれ長所と短所があるという。

その1 よりつづき)

 現在、多くの大規模言語モデルは、インターネット上のほぼ全てのデータをカバーしている。そのため、ゼロショット分類器はモデル訓練分類器と比べ、異なる分野や異なる言語のテキストに対しても、ほぼ同じ精度を示すことが多い。

 だが、ゼロショット分類器にも明確な欠点がある。一つは、既存のゼロショット分類器は、生成されたテキストのソース言語のモデルを頼りに検出する。これは、未知のソースのモデルが生成したテキストの場合、分類器が正確に検出することができないことを意味する。また、検出の精度を高めるために、ゼロショット分類器は何度もモデルを呼び出さなければならず、モデルの使用コストが高くなり、計算する時間も長くなってしまう。

 Fast-DetectGPTの開発者の一人である西湖大学テキストインテリジェンスラボの鮑光勝博士課程生は「テキストウォーターマーク法は、能動的な方法の一つと言える。前述した2つの方法とは違い、生成済みのテキストを検出するのではなく、AIがテキストを生成する際にウォーターマークを付ける。人間にはこのウォーターマークは見えないが、技術的手段を駆使して検出することができる。テキストウォーターマーク法の精度は高いが、人為的にウォーターマークが弱められたり、完全に削除される可能性があるという欠点が存在する。また、モデル内部にアクセスできない構造の大規模言語モデルの場合、技術者はコンテンツを生成する際に、ウォーターマークを付けることができない可能性がある」と説明した。

検出技術の継続的な改善が必要

 鮑氏は「今後、既存技術の更新・改善を続け、スピーディーかつ高精度、低コストで検出できるようにする。大規模言語モデルという『矛』を鋭くするのと同時に、検出技術という『盾』をより強固にしていく必要がある」と述べた。

 現在市販されているAI検出ソフトウェアの多くは、検出の精度を高めるべく、複数の技術を組み合わせている。そして、中国内外の研究チームともに、関連技術のさらなる改善に取り組んでいる。

 例えば、西湖大学テキストインテリジェンスラボのチームがDetectGPTをベースに開発したFast-DetectGPTモデルは、AIの検出精度を高めると同時に、検出にかかる時間も短縮した。鮑氏は「Fast-DetectGPTの原理は他のゼロショット分類器と同じだが、条件付き確率曲率指標を通じて検出するのが革新的ポイントの一つだ。DetectGPTと比べると、Fast-DetectGPTのスピードは340倍速くなり、検出精度も約75%高まった」と説明した。

 AIがAIを検出するという方法の今後の見通しについては、2つの全く違った見方がある。一つは、AIGCが今後、人間の創作物と非常に似たものとなり、検出ツールでは判別不可能になっていくという見方だ。もう一つは、技術の進歩に伴い、検出技術が大規模言語モデル技術に追いつき、追い越し、AIGCを効果的に識別できるようになるというものだ。

 鮑氏は「現時点では、AIが生成したテキストや画像、動画はいずれも、技術を駆使すれば識別できる範囲内にある。テキストに比べ、画像や動画は、専門的知識がある人なら肉眼で識別できる場合もある。今後、大規模言語モデルの技術が進歩を重ねることで、検出技術の発展が促進されることを期待している」と語った。


※本稿は、科技日報「AI检测AI:"矛"更利还是"盾"更坚」(2024年8月16日付6面)を科技日報の許諾を得て日本語訳/転載したものである。

 

上へ戻る