顔認証産業の闇　軽視されるリスク（その１）

2021年03月17日　楊智傑／『中国新聞週刊』記者　神部明果／翻訳

「目の前にある顔認証機器は、あなたの顔をスキャンしさえすればあなた自身より正確に銀行口座の残高を把握できる」。顔データが流出し他のデータと関連付けられれば、その後には深刻な結果が待ち受けている。

　2020年3月、集合住宅のマンション棟のエレベーターに貼られたある公告が清華大学法学部の労東燕（ラオ・ドンイエン）教授の目に飛び込んできた。集合住宅の各ユニットの入口にはまもなく顔認証出入管理システムが設置されるというものだ。公告の下部にはQRコードがつけられており、住人自身が利用登録をおこない、顔、身分証および不動産権利書をアップロードするよう要求していた。労教授はこれまで、職業的本能から顔認証の過度な活用については断固として反対してきた。そこで不動産管理会社と住民委員会に法的な書簡を送付し、同意なく個人の生体情報を収集することは現行の法律の規定に違反するとの注意喚起をおこなった。労氏、街道〔行政区分としての居住区〕、家主委員会および不動産管理会社の四者「交渉」の結果、この集合住宅における顔認証出入管理の推進計画は無期延期となり、いまもまだ開始されていない。

　労教授に限らず、顔認証にはっきりと反対の立場を表明する有名大学の法学部教授がますます増えている。彼らの懸念はいまや徐々に現実のものとなりつつある。顔情報取引を中心とした闇の産業チェーンは、実在するだけではなく猛威を振るっているのだ。中国中央テレビの最近のニュース報道によると、あるインターネット取引プラットフォーム上では2元で何千枚もの顔写真が購入でき、写真の本人は振り込め詐欺や財産詐取の被害にあうおそれがあり、顔情報がマネーロンダリングや暴力団などの違法犯罪行為に利用される可能性さえあるという。「目の前にある顔認証機器は、あなたの顔をスキャンしさえすればあなた自身より正確に銀行口座の残高を把握できる」とまでいわれ、顔データが流出し他のデータと関連付けられれば、その後には深刻な被害が待ち受けているのだ。

「顔認証をめぐるリスクは想像を超えるものだ」と労教授はいう。「あなたは誰が顔データを収集しているのか、またどのような情報を収集しているのかを知らない。相手が何を保存したのか、どう利用するかも知らない。すべてが闇に包まれている」

2019年12月6日、第二回浙江省国際スマート交通産業博覧会・未来交通大会にて、模擬道路の上でAI顔認証システムを体験する人々。写真／IC

「顔」が盗まれる

「3万枚にのぼる顔データベース、15万件の記録。メインはエンベデッドシステム業界のディープラーニングアルゴリズム。顔認証の精度は99.97％以上、認証速度は200ミリ秒以下を達成。顔認証端末に高精度体温測定サーモグラフィーモジュールおよび顔認証アルゴリズムを組み合わせることで、顔認証と非接触体温測定の2in1機能を実現」。これはある顔認証・体温測定一体型端末の製品紹介文だ。こうした製品は今年、新型コロナウイルス感染症の拡大により爆発的にヒットし、ショッピングセンター、オフィスビル、各種機関、地下鉄・鉄道の駅入口に大量に出現した。体温測定に加え、こうした製品で忘れられているもう1つの機能は顔情報の収集だ。

　ユーザーの同意を得る少数のソフトウエアまたはシーンを除き、多くのシーンで顔情報収集はこっそりと実施される。「一部のショッピングセンターは顔認証技術を運用し、顧客の動態と購入手段情報を収集している」。「一部の大学は顔認証技術を運用し、学生が顔を上げる割合、わずかな表情、授業中の姿勢を収集している」。「顔画像分析に基づいた顔の入れ替え、バーチャルメイク、性格判断、健康状態予測などのアプリケーション」。南方都市報のAI倫理課題チームとアプリ特別取締業務チームが発表した「顔認証応用公衆調査研究レポート（2020）」は、こうしたシーンを列挙し、そこでおこなわれている「こっそり」とした収集方法に多くの人が拒絶反応を示したと報告している。

「データ収集段階からみると、顔認証は無意識性と非接触性という特徴を備えており、遠距離でも機能する。さらに長期にわたり大規模にデータを蓄積してもユーザーに察知されず、不正アクセスのリスクが非常に高い」と冒頭の労教授は論文の中で分析する。

　データ収集は顔認証産業では最も重要かつ優先される作業といえる。顔認証精度の向上は大量の顔データの「インプット」にかかっているからだ。複数の技術者は本誌に対し、技術開発の初期において、データは主に機関または大学の実験室の公開データセットから入手しており、志望者からの有償での収集も企業にとっての重要な手段だったと語った。

　人工知能を活用するテックカンパニー「雲従科技〔CloudWalk〕」の責任者によれば、同社は顔認証技術の向上のため91のカメラからなるマトリクスを利用し、2年間に1,000人分、1人あたり20万枚、合計2億枚の顔写真を収集したという。収集データはさまざまな表情や身なりをした人々の様子を広範囲に捉えており、逆光や陰になって顔が暗くよく見えない写真なども収集されていた。

　しかしこうしてオフラインで収集したデータでもはるかに不十分であったため、同社はさらにインターネット上で1,000万人分のおよそ10億枚の顔データを入手したうえで、機械学習のデータベースに入力している。こうした膨大なデータをもとに、同社の顔認証精度は68％から99％にまで向上した。

　クローラーツール〔ネット上を巡回しデータを自動収集・整理するプログラム〕でインターネット上に公開されている写真を入手する手法は業界全体で一般的となっている。コンピュータービジョンと機械学習の研究に取り組む中国科学院コンピューティング技術研究所の山世光（シャン・シーグアン）研究員は、顔認証技術関連企業の中科視拓〔Seetatech〕の創業メンバーの一人でもある。山氏は以前、人々がネット上にアップロードした2、3枚もしくは十数枚の写真を入手できれば、その人物のデータをアルゴリズムの能力向上に用いることが可能と述べている。

　過去にマイクロソフト・リサーチ〔MSR〕に勤務していた黄昊（ホアン・ハオ）氏（仮名）は取材に対し、現在の顔認証モデルが最も必要としているのはクオリティの低いデータであると述べた。例えば画角の広い写真、暗い写真、撮影時からかなり年数がたった写真などだ。こうした企業はSNSサイトにあるような人々がポーズを取ったクオリティの高い写真を入手することはほとんどなく、ダイレクトに生活シーンの中にカメラを設置し撮影・顔認証を実施するという。予定調和から外れたデータが最も優れた効果を発揮するというのだ。

　多くの顔認証業界関係者は、中国が顔認証技術で世界のトップを走る理由について、インターネット上の膨大なデータの存在および相対的に緩やかなインターネット環境の恩恵をある程度受けているためと述べる。ネット上の写真は「主体的に公開」されているものであり、こうしたデータを利用してアルゴリズムを訓練することは「プライバシーの侵害に該当せず」、企業は顔以外の個人情報を入手できないというのが彼らの考えだ。

　中国科学院自動化研究所の研究員、北京智源人工智能研究院AI倫理センター主任、国家次世代人工智能管理専門委員会委員を務める曾毅（ツォン・イー）氏は、こうしたクローラーツールによるデータ収集方法には正当性がなく、かつ合法的でもないとの見方を示す。「それ以上に信じがたいのは、テック企業が単に写真のみを収集し、ネット上の他の個人情報を入手していないということだ」。曾氏によれば、ネット上で収集されたデータはまず整理しタグ付けされた後、アルゴリズムの訓練に利用されるという。1枚の写真には例えば女性、成人、アジア人といった複数のタグが付けられる。SNSサイト上にある生年月日、卒業校、職業などを含む一部データ情報はすべて写真の解釈のために用いられ、データのタグ付けに役立てられる。

　2020年1月には、米国の顔認証ソフトウエア企業Clearview AIが同社の開発した顔認証アプリケーションをめぐり業界の批判の的となった。同アプリの利用者は1人の人物の写真をアップロードするだけで、ネット上に公開されている同人物の写真およびサイトのリンクを発見できるというものだ。さらに恐るべき点として、このアプリは30億枚以上の写真から構成されるデータベースをもとに、同人物の名前、住所、これまでの活動内容や人脈をも識別できた。

　同社によれば、こうした写真はフェイスブック、ユーチューブ、ツイッター、インスタグラムおよびその他の数百万にのぼるウェブサイト上から収集したという。この1年前には600以上の法的機関がClearview AI社のソフトウエアの使用をすでに禁じている。上述の大手ＩＴ企業も同社アプリからのアクセスをブロックした。