アーバンコンピューティング概論(その1)
2016年 6月21日
鄭宇:マイクロソフトリサーチアジア(MSRA)、
上海交通大学致遠学院、西南交通大学情報科学・技術学院
博士、マイクロソフトリサーチアジア(MSRA)主管研究員。主な研究テーマはアーバンコンピューティング、時空間データマイニング及びユビキタス・コンピューティング。『MIT Technology Review』のMIT TR35に選出、イノベーターの代表としてアメリカTime誌に掲載。2014年、主導的な役割を果たしたアーバンコンピューティングは、ビジネス的将来性と業界構成変革の潜在力が高いとして、フォーチュン誌の「40歳以下の中国ビジネス界のトップスター40人」に選出。
概要
アーバンコンピューティングとは、コンピューター科学の中でも都市を背景として、都市計画や交通、エネルギー、環境、社会学、経済学等の分野を融合した学際的な新興分野である。アーバンコンピューティングとは、都市に関するビッグデータの中から様々な異種データを取得・統合・解析し続けることで、都市が直面する課題の解決を試みるものである。本稿では、アーバンコンピューティングの定義、フレームワークと主な研究課題を紹介し、アーバンコンピューティングの典型的な実用例と必要とされる技術について概括する。
[キーワード]
アーバンコンピューティング、ビッグデータ、時空間データ解析、異種データ融合、アーバンセンシング
都市化によって生活の近代化が進んだが、大気汚染や交通渋滞、エネルギー消費の増加や都市整備の遅れ等、多くの問題や課題ももたらされた。都市環境は非常に複雑であるため、これらの問題の解決は、かつてはほとんど不可能と考えられていた。しかし、近年のセンシング技術とコンピューター環境の成熟に伴い、交通流や気象データ、道路網、関心地点(POI)、移動軌跡、ソーシャルメディア等の様々な種類のビッグデータが誕生した。このようなビッグデータを適切に利用すれば、都市の課題が適時にあぶり出されるだけでなく、問題解決も図ることができる。アーバンコンピューティングとは、都市のビッグデータを利用してその都市自身が直面する課題を解決し、様々な異種データの統合、解析及びマイニングによって知識やインテリジェンスを抽出し、かつ、抽出したインテリジェンスを利用して、「人間-環境-都市」のwin-win-winの関係を創造しようとするものである。
1 アーバンコンピューティングの概念とフレームワーク
1.1 アーバンコンピューティングの定義
アーバンコンピューティングとは、コンピューター科学の中でも都市を背景として、都市計画や交通、エネルギー、環境、社会学、経済学等の分野を融合した学際的な新興分野である。具体的に言うなら、アーバンコンピューティングとは、都市に関するビッグデータの中から様々な異種データを取得・統合・解析し続けることで、都市が直面する課題(例えば、環境問題の悪化、交通渋滞、エネルギー消費の増加、都市整備の遅れ等)の解決を試みるものである。アーバンコンピューティングでは、ユビキタスによるセンシング技術、効率的なデータ管理や解析アルゴリズム、新鋭の可視化技術を融合させ、QOLや環境保護、都市運営効率の向上に注力する。アーバンコンピューティングは、我々が様々な都市現象の本質を理解する上で助けとなり、ひいては都市の未来予測にも資するだろう[1]。
1.2 アーバンコンピューティングのフレームワーク
図1にアーバンコンピューティングの基本的なフレームワークを示した。これには、アーバンセンシング及びデータの取得、アーバンデータの管理、アーバンデータの解析及びサービス提供という4つの段階が含まれる。自然言語処理や画像処理等の「単一データ、単一ミッション」システムと異なり、アーバンコンピューティングは「複数データ、複数ミッション」によるシステムである。アーバンコンピューティングのミッションには都市計画の改善、交通渋滞の緩和、自然環境の保護、エネルギー消費の削減等が含まれ、一つのミッションで同時に複数のデータを用いる。例えば、都市計画の設計プロセスにおいては、道路網の構造やPOIの分布、交通流等の様々なデータソースを同時に参照する必要がある。
図1 アーバンコンピューティングの基本的なフレームワーク
Fig. 1 Framework of Urban Computing
1.3 アーバンコンピューティングの中核となる問題
アーバンコンピューティングは学際的な新興分野であり、関連領域は広範である。コンピューター科学の立場から見ると、中核となる問題は主に以下の4つの分野に跨っている。
1) アーバンセンシング(コンピューティング):人々の生活に干渉しないことを前提として、都市の既存資源(例えば携帯電話、センサー、車両及び人等)を如何に利用して都市の生活リズムを自動的に感知し続けるか、というのは重要な研究テーマである。大量のセンサーや設備から信頼できるデータを如何に効率的に収集し、そのデータをチャレンジとして既存のセンシング・ネットワーク技術に如何に送信するか、も重要である。また、人をセンサーとしてアーバンセンシングに関与させるプロセスも新たな概念である(一般的に、集団センシングという)。例えば、何か事件が発生して一部のユーザーがソーシャルネットワークに情報や写真をアップした場合には、これらのユーザーは彼らの身近で発生していることを人々が知るための支援をしていると言える。ユーザーが地下鉄を利用する際に自動改札にカードを通す行為も、地下鉄システムの混雑度や乗客利用の規則性を知る助けとなっている。携帯電話の発する信号も、都市の異常や緊急的事件の発生を知る材料となる。人間は既存のセンサーに莫大なセンシング能力とこれまでにないフレキシビリティをもたらしたが、これらの集団センシング技術も以下の課題に直面している。①データの無秩序化、間接化・あいまい化。例えば、ユーザーの自動車走行軌跡データを集めても、専門のセンサーのように各道路上の交通流量や自動車のガソリン消費、排ガス量を直接知ることはできない。②データの発生時間も予測がより難しく、かつ、制御不能になっており、データの空間分布も人の移動に伴い不均一になっている。このため、データの欠失やスパース性が生じるのは必然となっており、すなわち、ある時間帯やある地点においては使用可能なデータがなくなってしまう。③全てのユーザーがセンシングプロセスに関与してデータを提供できるわけでない。このため、入手可能なデータはデータ集合の中の一つのサンプルに過ぎず、当該サンプルは、データ集合との間に偏差がある可能性もある。例えば、タクシーの走行軌跡データは都市全体の全ての車両の走行軌跡と偏差がある可能性がある。また、ある道路でたくさんのタクシーが観測できたとしても、この道路には他の車両も多く走っているとは限らない。従って、タクシーの台数からその他の車両数を直接推算することはできない。このように、以上の3つの問題は、データの収集と解析に新たな課題をもたらしている。アーバンセンシングはもはや単なるセンシングプロセスではなく、複雑かつ曖昧で、欠失データや不均一な分布のあるデータから有効な知識を獲得するためのコンピューティングプロセスも含んでいる。
2) 大量の異種データの管理:都市から発生するデータの属性差は非常に大きい。例えば、気象データは時系列であるが、POIは空間における点データであり、道路は空間図のデータで、人の移動は軌跡データ(時間+空間)、交通流量はデータ流、ソーシャルネットワークのユーザーが発する情報は文書又は画像データである。このような大規模な異種データを如何に管理し、統合するかというのは新たな課題である。特に、1つの実用例で多種のデータを使用する際は、異なるデータ間の関連付けを事前に構築して初めて、後続の解析及びマイニングのプロセスが実行可能となり、効率的となる。
3) 異種データの協調コンピューティング:①異なるデータソースから、如何に互いを強化する知識を取得するかというのは新たな課題である。既存の機械学習では問題は往々にして単一データしかベースにしておらず、例えば自然言語処理は主に文書データのみの解析で、イメージセンサは主に画像データのみをベースとした。異なる性質のデータを同等に扱っても、アーバンコンピューティングの実用例の多くで理想的な結果は得られなかった。②知識抽出の深さを保証すると同時に、ビッグデータの解析効率の向上によって、アーバンコンピューティングでリアルタイム性が要求される多くの実用例(大気質予測や異常事件のモニタリング等)を如何に満足させることができるかも難しい課題である。③データ次元の増加によってデータのスパース性が生じやすくなっているため、これに如何に対応するかも非常に重要である。データ規模がある程度に達すると、単純な行列分解アルゴリズムはいずれも実行しづらくなる。強調すべきは、ビッグデータとデータのスパース性は矛盾するわけではないことだ(詳しくは後述する)。
4) 虚実融合と混合式システム:アーバンコンピューティングによって往々にして混合式システムが誕生する。例えば、クラウドプラスモデルでは、現実世界で発生した情報が端末装置によってクラウド(バ―チャル世界)に収集されて解析・処理され、最終的には抽出された知識がサービスとなって現実世界の端末ユーザーに提供される。データは現実世界とバーチャル世界の間を行ったり来たりして、分散から集中を経て、再度分散する。設計されるシステムは何百万ものユーザーに対応し、おびただしい数のセンサーと通信しなければならない。異なるデータソースに対する同期・保存・更新はシステムの設計と構築にさらなる課題を突きつけている。後述するフローティングカーデータに基づく高速道路設計[6]や都市異常事件のモニタリング[48]は、いずれも混合式システムである。
1.4 アーバンコンピューティングの実用例
図2にアーバンコンピューティングが関与する主な7つの実用例を示す。すなわち、都市計画、スマート交通、都市環境、都市のエネルギー消費、都市経済、ソーシャルメディアとレジャー、都市の安全性である。そして、それぞれの大分類について、さらに小分類に細分化する。例えば、スマート交通には自家用車、公共交通及びタクシーシステムの改善が含まれる。これら7つの実用例は以前から存在したが、ビッグデータを利用したアーバンコンピューティングの手法による再検討を試みる。
図2 アーバンコンピューティングの実用例の分類
Fig. 2 Categories of Applications in Urban Computing
(その2へつづく)
参考文献
[1] Zheng Y, Capra L, Wolfson O, et al. Urban Computing: Concepts, Methodologies, and Applications[J]. ACM Transactionson Intelligent Systems and Technology, 2014,3(5),DOI:10.1145/1290002.1290003
[6] Yuan J, Zheng Y, Xie X, et al. Driving with Knowledge from the Physical World[C]. KDD,San Diego, California, 2011
[48] Zheng V W, Cao B, Zheng Y, et al. Collaborative Filtering Meets Mobile Recommendation: A User-Centered Approach[C]. IAAAI,Atlanta, Georgia, USA, 2010
※本稿は鄭宇「城市計算概述」『武漢大学学報(信息科学版)』第40巻 第1期、2015年1月,pp.1-13)を『武漢大学学報(信息科学版)』編集部の許可を得て日本語訳・転載したものである。
記事提供:同方知網(北京)技術有限公司