第117号
トップ  > 科学技術トピック>  第117号 >  アーバンコンピューティング概論(その2)

アーバンコンピューティング概論(その2)

2016年 6月22日

鄭宇:マイクロソフトリサーチアジア(MSRA)、
上海交通大学致遠学院、西南交通大学情報科学・技術学院

博士、マイクロソフトリサーチアジア(MSRA)主管研究員。主な研究テーマはアーバンコンピューティング、時空間データマイニング及びユビキタス・コンピューティング。『MIT Technology Review』のMIT TR35に選出、イノベーターの代表としてアメリカTime誌に掲載。2014年、主導的な役割を果たしたアーバンコンピューティングは、ビジネス的将来性と業界構成変革の潜在力が高いとして、フォーチュン誌の「40歳以下の中国ビジネス界のトップスター40人」に選出。

その1よりつづき)

2. アーバンコンピューティングの典型的な実用例

2.1 都市計画

 都市渋滞の顕在化は、既存の道路網の設計では膨張を続ける都市の交通流ニーズを満たすことができなくなっていることによる。図3(a)で示すように、高速道路や環状道路等の幹線道路を利用して都市を地区ごとに分割した後に、様々な地区間の自動車の走行軌跡データ流に関するビッグデータを解析して特徴を把握すれば、道路網の連携の悪い地区を探し出すことができるため、既存の都市道路網の不足点を発掘できる[2]。図3(b)に北京市の3万台余りのタクシーの3ヶ月間の走行軌跡データに関する解析結果を示す。これらの結果は、今後の計画策定の参考となる提案と見なすことができる。また、2年間の観測結果を比較することで、実施済みの計画(例えば、道路や地下鉄の新設)の有効性を検証することもできる。

図3

図3 都市道路網における非合理的な計画の探索

Fig. 3 Glean Problematic Design from Urban Road Networks

 都市の拡大によって文教地区や商業地区、住宅区といった様々な機能を持つ地区が誕生した。これら地区の分布を正確に把握することは、合理的な都市計画の策定に重要な意味がある。しかし、地区の持つ機能は一つとは限らず、例えば、文教地区であっても依然としてレストランや商業施設は存在する。このため、各地区についてそれぞれの機能分布を描写する必要がある(例えば、70%は商業、20%は住宅で、残りは文教である、というように)。しかし、一つの地区には異なる種類のPOIが多数存在する上に、それぞれのPOIの役割の大きさや来客頻度は予測しがたい。例えば、一つの狭い地区内にある小さなレストランと全聚徳(訳注:北京ダックの老舗レストラン)のような大きいレストランが持つ機能は全く異なるため、この点も都市計画関係者にとって大きな課題となっている。

 POIデータと人々の移動モデルを結びつけることで、文献[3]は都市で異なる機能を持つ地区を解析した。図4(a)で示すように、同じ色の地区は同じ機能分布を有する(例えば、赤の地域は主に文教地区である)。ここでは、人の移動データはタクシーの走行軌跡データから抽出されている(これら走行軌跡データには、乗客の乗車・下車地点の情報が含まれている)。人の移動データによって、同じタイプのPOIの人気が非常に良く表現されており、一つの地区の機能も顕著に示されている。例えば、ある地区では、ほとんどの人が朝8時頃に出発し、夜7時頃に帰宅するなら、この地区は住宅区である可能性が高い。また、ある地区の主な機能は文教地区だとしても、この地区内のいずれの地点も全て文教サービスを提供するとは限らない。このため、ある機能を割り当てた場合には、我々はその中心地区の所在を知る必要がある。図4(b)に、成熟した商業地区における中心地区を示す。色が濃い地区ほど成熟した商業地区である確率が高い。

図3

図4 都市機能の識別

Fig. 4 Identify Functional Regions of a City

2.2 スマート交通

 道路網のある路線の通行時間を推定することは、交通に関する多くの実用例で往々にして直面する問題である。全ての道路にセンサーが設置されているわけではないため、フローティングカー(例えばタクシー)のGPS走行軌跡データを利用して道路の通行時間を計算することは、ますます注目を集めている。この方法は、シンプルかつフレキシブル(車両のGPS走行軌跡データの2点間の距離と時間に基づいて速度を計算できる)だが、以下の課題がある。①データのスパース性。全ての車両がGPSデータを提供できるわけではない。例えば、ある時間帯ではデータを提供できる車両(例えばタクシー)が通行する道路はわずかしかない。GPSデータのない道路の通行時間を如何に推定するかが難しい問題となっている。②データの結合。GPS走行軌跡データのある区間においては、様々な車両によって提供される走行軌跡データを如何に結合させるかも問題となっている。

 例えば、図5で示すように、路線r1→r2→r3→r4の通行時間を推算することとする。まず、r4では何のデータも存在せず(デ―タのスパース性)、次に、r1→r2→r3の通行時間には複数の選択が存在する場合は、最初に走行軌跡Tr1とTr2を利用してr1→r2の時間を推算してから、走行軌跡Tr2、Tr3及びTr4を利用してr3の通過時間を推算した後に、最終的に和を求めるが、対応する走行軌跡を利用してr1、r2及びr3の時間を別々に推算してから最後に和を求めることもできる。1本の路線を通過する走行軌跡のデータ量は当該路線の距離と反比例の関係にある一方で、通行時間の推算精度は走行軌跡の利用可能データ量と正比例の関係にあるため、走行軌跡の利用可能データ量と被推算路線の距離とのバランスをとる最善の組み合わせを探し出す必要がある。

図5

図5 GPS走行軌跡に基づく路線通行時間の推算

Fig. 5 Estimate Travel Time of a Path Based on GPS Trajectories

 文献[4]はタクシーの軌跡データとリアルタイムデータに基づく走行軌跡データであり、POIと道路網構造等の地理的特徴を結合させ、マトリックスの連合分解と協調フィルタリングを利用して任意の道路区間の通行時間をリアルタイムで計算し、欠失データの補填を試みている。それから、動的計画法アルゴリズムを利用して異なる走行軌跡の最良の組合せ方式を模索し、最善の時間推算を得ている。

T-Driveシステム[5]では、GPSセンサーを搭載したタクシーを利用して交通流量を感知し、一般ユーザー向けに本当の意味で最速の自動車走行路線を設計する。図6で示すように、T-Driveはランドマークに基づく経路選択アルゴリズムを提案している。このうち、タクシー運転手が最も頻繁に通行した道路区間の1つが、赤い点によって表示されている(ランドマークという)。赤い点同志を結ぶ線は、2つのランドマークを結ぶバーチャルの辺を示しており、これら2つのランドマークを相次いで通行したタクシーの走行軌跡の集合を表現している。タクシーの走行軌跡データに基づいて、任意のバーチャルの辺における通行時間が学習される。T-Driveの修正バージョン[6-7]では、天気や個人の運転習慣、技能、道路の習熟度等の要素をさらに考慮に入れて、個人別にカスタマイズした最速の路線設計を提案した。このシステムでは30minの運転ごとに5minの時間が節約されるとともに、ユーザーごとに異なる道路を選択させることによって、生じ得る道路渋滞を緩和することもできる。

図6

図6 T-Drive: ランドマークを利用したシステム

Fig. 6 T-Drive: A Landmark-Graph-Based System

 タクシーの乗車難は多くの大都市が直面する問題である。タクシー乗客の乗下車記録の分析を通じて、T-Finder[8,9]はタクシー運転手と乗客に対する双方向の推奨サービスを提供している。例えば、このシステムではタクシー運転手に乗客待ちの場所をアドバイスするため、運転手はこの場所に向かって車を走らせさえすれば、最短時間内に(この場所に向かう途中又は推奨された場所において)乗客を見つけることができ、収入を最大化することができる。一方、図7(a)で示すように、このシステムは乗客に対しても乗車率の高い道路区間を推奨するため、この区間で待っていればより高い確率で空車を探し当てることができる(確率ごとに色分けされている。青色が最高で、赤色が最低である)。また、T-Finderは周辺のタクシー停車場所で今後30分間に乗り入れられるタクシー空車台数を予測することもできる。T-Finderは、推奨サービスによってピーク時以外のタクシーの乗車難を緩和することができるが、ピーク時についてはこのシステムによって本当の意味で問題を解決することはできない。

図7

図7 アーバンコンピューティングによるタクシーサービス解決策

Fig. 7 Solutions for Improving Urban Taxi Services

 一方、T-Share[10,11]はタクシーのリアルタイム動態情報による相乗り推奨によって、この難題を解決しようとしている。T-Shareシステムでは、ユーザーは携帯から乗車要請を送信し、乗下車地点や乗客人数、目的地の到着希望時間を表明する。バックオフィスシステムでは全てのタクシーの状態をリアルタイムで把握しているため、新規ユーザーからの要請を受信すると、ユーザーの条件とタクシーの乗客条件を満たす最良の車両を探し出すことができる。最良の車両とは、当該タクシーが新規ユーザーの迎車のために走行する行程が最少のものを指す。例えば、図7(b)で示すように、このタクシーは、u1を乗車させた後にu2を乗車させ、それからu1を下車させ、u3を乗車させ、さらにu2を下車させた後にu3を下車させるように計画されているとする(+は乗車、-は下車を表す)。シミュレーションの結果、T-Shareシステムは1年間で北京市のガソリン消費を8億リットル節約(車両100万台の10ヶ月分のガソリンに相当。人民元で10億元の価値。CO2排出を16億kg削減)することができ、乗客のタクシー乗車率を3倍向上させ、タクシー料金を7%削減し、タクシー運転手の収入を10%増やすことができた。

 また、地下鉄システムにおける乗客のカード利用データによって、ある地下鉄駅における混雑度と複数駅間の通行時間を推算し、これによって人々の利用路線や利用時間、切符購入方法の選択を最適化する事業もある[12,13]。このほか、タクシーの走行軌跡データの解析を通じて公共交通の路線をアドバイスする研究もある[14]。例えば、大勢の人々がタクシーを使ってある地点からもう1つの地点に移動するとするなら、これら2つの地点は公共交通路線を運行する必要があることを物語っている。

その3へつづく)

参考文献

[2] Zheng Y, Liu Y, Yuan J, et al.Urban Computing with Taxicabs[C]. UbiComp,Beijing, 2011

[3] Yuan J, Zheng Y, Xie X. Discovering Regions of Different Functions in a City Using Human Mobility and POIs[C]. KDD, Beijing,2012

[4] Wang Y, Zheng Y, Xue Y. Travel Time Estimation of a Path Using Sparse Trajectories[C]. KDD, New York, 2014

[5] Yuan J, Zheng Y, Zhang C, et al.T-Drive: Driving Directions Based on Taxi Trajectories[C]. SIGSPATIAL GIS,San Jose, California, 2010

[6] Yuan J, Zheng Y, Xie X, et al. Driving with Knowledge from the Physical World[C]. KDD,San Diego, California, 2011

[7] Yuan J, Zheng Y, Xie X, et al.T-Drive: Enhancing Driving Directions with Taxi Drivers' Intelligence[J]. IEEE Transactions on Knowledge and Data Engineering, 2013,25(1):220-232

[8] Yuan J, Zheng Y, Zhang L, et al.Where to Find My Next Passenger?[C]. UbiComp,Beijing ,2011

[9] Yuan J, Zheng Y, Zhang L, et al. T-Finder: A Recommender System for Finding Passengers and Vacant Taxis[J]. IEEE Transactions on Knowledge and Data Engineering,2013,25(10):2 390-2 403

[10] Ma S, Zheng Y, Wolfson O. T-Share: A Large-Scale Dynamic Taxi Ridesharing Service[C]. ICDE,Brisbane, Australia,2013

[11] Ma S, Zheng Y, Wolfson O. Real-Time City-Scale Taxi Ridesharing[J]. IEEE Transactions on Knowledge and Data Engineering, 2014,DOI:10.1109/TKDE.2014.2334313

[12] Lathia N,Capra L. Mining Mobility Data to Minimise Travellers' Spending on Public Transport[C]. KDD,San Diego, California,2011

[13] Ceapa I, Capra C S L. Avoiding the Crowds: Understanding Tube Station Congestion Patterns from Trip Data[C]. UrbComp,Beijing,2012

[14] Bastani F, Huang Y, Xie X, et al.A Greener Transportation Mode: Flexible Routes Discovery from GPS Trajectory Data[C]. ACM SIGSPATIAL GIS,Beijing, 2011

 ※本稿は鄭宇「城市計算概述」『武漢大学学報(信息科学版)』第40巻 第1期、2015年1月,pp.1-13)を『武漢大学学報(信息科学版)』編集部の許可を得て日本語訳・転載したものである。
記事提供:同方知網(北京)技術有限公司