第117号
トップ  > 科学技術トピック>  第117号 >  アーバンコンピューティング概論(その3)

アーバンコンピューティング概論(その3)

2016年 6月27日

鄭宇:マイクロソフトリサーチアジア(MSRA)、
上海交通大学致遠学院、西南交通大学情報科学・技術学院

博士、マイクロソフトリサーチアジア(MSRA)主管研究員。主な研究テーマはアーバンコンピューティング、時空間データマイニング及びユビキタス・コンピューティング。『MIT Technology Review』のMIT TR35に選出、イノベーターの代表としてアメリカTime誌に掲載。2014年、主導的な役割を果たしたアーバンコンピューティングは、ビジネス的将来性と業界構成変革の潜在力が高いとして、フォーチュン誌の「40歳以下の中国ビジネス界のトップスター40人」に選出。

その2よりつづき)

2.3 環境

2.3.1 都市の空気

 大気質情報は、大気汚染のコントロールと人の健康に重要な意味を持つ。地表の大気質のリアルタイム・センシングを行うために、多くの都市で地表大気モニタリングステーションの設置が始まっている。しかし、モニタリングステーションの建設コストは非常に高く、一都市が持つことのできるステーション数は一般に限りがあるため、都市全体の範囲を網羅できるわけではない。図8(a)に示すように。北京の市街地にはわずか22ステーションしか存在しない(約100km2ごとにステーション1ヶ所)。不幸なのは、大気質は様々な要素(例えば、地表の植生、交通流量、ビル建設密度等)の影響を受ける上に、地域ごとに不均一に変化することだ。ある地区にモニタリングステーションが存在しない場合は、我々は当該地区の大気質を知り得ないだけでなく、いい加減なデータでは都市全体の大気の状況を概括することもできない。

図8

図8 ビッグデータに基づく粒度の細かい大気質予測

Fig. 8 When Urban Air Quality Meets Big Data

 集団センシングの利用は問題解決の一つの方法である。例えば、「コペンハーゲン・ホイール」プロジェクトでは自転車の車輪にセンサーを設置して、ユーザーの携帯電話を通じて収集したデータをバックオフィスサーバーに送信する。こうして集団の力に頼ることで都市全体の様々な場所の温度、湿度及びCO2濃度を知ることができる。センサーの大きさによって感知時間に制約を受けることができるため、この方法はCOやCO2のような一部の気体にしか用いることができない。PM2.5のような浮遊物については、センサーの体積が大きいために携帯に適さない上に、比較的正確な観測データを得るためには2~4hの測定時間が要求される。

 U-Air[15,16]は、わずかな数の地上モニタリングステーションからのリアルタイム及び過去の大気質データを利用し、交通流、道路の構造、POI分布、気象条件及び人の流行規則等のビッグデータを結合させ、機械学習アルゴリズムを利用してデータと大気質のマッピング関係を構築することで、都市全体の粒度の細かい大気質予測が可能にした。図8(b)に北京のある時間における粒度の細かい大気質情報を示す(汚染指数ごとに色分けされている。緑色が最良である)。

2.3.2 都市騒音

 都市の発展によって、自動車のサイレンや酒場、建築工事等の様々な騒音源が生まれた。これらの騒音は人の睡眠の質や仕事の効率に影響するだけでなく、心や体の健康にも被害を及ぼす。都市騒音に対応するには、まず都市全体の騒音の状況や騒音の構造を理解する必要があるが、都市全体の騒音をモデリングするのは非常に難しいことである。何故なら、第一に、騒音は時間変化のスピードが速く(瞬間的に消え去り)、空間変化も激しい(100m離れた場所の騒音状況は現在の地点と大きく異なるかもしれない)。このため、粒度の細かい都市騒音のモニタリングのためには、数百万もの音響学的センサーを設置する必要がある。しかし、センサーの設置及びメンテナンスコストは莫大なため、この方法は非現実的である。このほか、騒音汚染の評価は騒音の強弱(デシベル)のみによって決まるわけではなく、騒音に対する人の許容度によっても決まるが、後者は時間経過に伴い変化する。例えば、夜間の騒音許容度は昼間に比べてはるかに低く、騒音のデシベルが昼間より低い場合でも、深刻な騒音被害と認識されるかもしれない。そして、第二に、騒音は一般的に様々な種類の音源の混合体である。単純なセンサーでは音声の強弱しかデータに示されず、騒音の構造を教えてくれることはない。例えば、ある場所の昼間の時間帯の騒音の40%は交通流から、20%は酒場から、さらに別の20%は建築現場に由来する。このため、数え切れないほどのセンサーを設置できたとしても、騒音汚染の問題を本当の意味で解決するのは不可能である。

 現在はビッグデータの時代であるため、他のデータによって都市の騒音汚染を間接的に通報することもできる。例えば、アメリカ政府は2010年から「311」苦情受付電話サービスを開設し、電話またはスマートフォンのアプリを利用して、都市に対する市民のクレームを受け付け始めた。各クレームには時間、場所と分類情報が含まれ、過去の4aデータの統計に基づけば、騒音はクレーム件数で見ると第3位であった。図9は2012年~2013年におけるニューヨーク市の311苦情データの分布である。ここでは、騒音のタイプごとに色分けされており、棒グラフの高さはクレーム回数を表している。

図9

図9 ニューヨーク市民の騒音に対するクレームのデータ

Fig. 9 311 Complaint Data in New York City

 このデータは、実際には、人がセンサーとなった場合及び集団センシングの結果である。具体的には、ある場所の騒音に対するクレーム件数はその場所の騒音汚染の程度を間接的に反映したものと言える。騒音タイプごとの311クレームデータの分布は、その場所の騒音構造を反映している。しかし、場所や時間帯に関わらず、必ずクレームが提供されるよう確保できるわけではないので、このデータはスパース性が高い。データのスパース性問題を解決するため、CityNoise[17-19]では道路網データ、POIデータ及びソーシャルメディアにおけるサインアップデータを結合させて、各地区における時間帯ごとの騒音タイプ及び汚染指数を協調解析した。このように粒度の細かい騒音指数が得られれば、各地区において時間帯ごとに異なる指標を用いて順位付けすることができる。

 図10(a)において、平日夜間0~5時(又は週末夜間7~11時)の都市全体の騒音状況を示した(色が濃い程、騒音が深刻である)。また、あるタイプ(例えば、建築工事)の騒音に基づいて、都市の様々な地区の汚染状況を見ることも可能である(図10(b)を参照)。これらの結果によって、ある地点(例えば図10(c)で示されるタイムズスクエア)の時間帯ごとの騒音構造を分析する助けにもなる。このような情報があって初めて、政府は都市騒音の緩和に向けた適切な方針を決めることができる。

図10

図10 都市における地区ごとの騒音状況及び騒音構造の分析

Fig. 10 Diagnose Urban Noises

2.4 エネルギー消費関連の実用例

 文献[20,24では、GPSを搭載したタクシーのガソリンスタンドにおける待機時間から、ガソリンスタンドの行列の長さを推算し、それによってその時間帯にガソリンスタンドに停車している車両台数及び給油量を推算している。都市全体のガソリンスタンドデータをとりまとめると、任意の時間にガソリンがどれだけ消費されたか(自動車のガソリンタンクへの給油量)が計算できる。図11に示すように、これらのデータによって以下3つの分野への応用が実現できる。①給油が必要なユーザーにアドバイスを送り、行列時間の最も短いガソリンスタンドの情報を提供する。②ガソリンスタンド運営会社に各地区のガソリン需要を知らせることで、ガソリンスタンドの新設や、来客数に応じた既存店舗の営業時間の調整について検討させる。③政府がリアルタイムで都市のガソリン消費を把握できるため、合理的なエネルギー戦略を策定できる。

図11

図11 ガソリンスタンドの行列時間とガソリン消費のリアルタイム推算

Fig. 11 Infer the Queuing Time and Gas Consumption of a Gas Station

 図12で示すように、文献[22]では都市の一部の車両(例えば、タクシー)のGPS走行軌跡データを用いて道路網全体を走る自動車のリアルタイムのガソリン消費と排気ガス状況を分析した。この研究によって、ユーザーにガソリン消費効率の最も高い行程をアドバイスできるだけでなく、粒度の細かい大気汚染警報を発信することもできる。長期データを分析すれば、都市におけるガソリン消費の高い道路区間を識別できる上に(都市計画改善の提案)、自動車の排気ガスに由来するPM2.5の大気総量における割合を分析する助けにもなる。このため、交通流量の制限によって汚染状況を本当に減らせるか否か等、政府の方針決定の参考となるアドバイスを提供することもできる。

図12

図12 フローティングカーデータに基づくガソリン消費と排気ガス量の計算

Fig. 12 Estimate Gas Consumption and Vehicle Emissions on Roads

 この研究プロジェクトでは、まず、タクシーの走行軌跡データによって、すでにデータのある道路区間の車両通行速度を計算し、それからPOIと道路ネットワーク等の他のデータソースを結合させ、協調フィルタリングを利用することで、限られた速度情報を道路ネットワーク全体に伝達する。そして、図のモデルを利用し、各道路の速度情報を自動車の流量情報に転換し、最終的に環境学の理論に従って、通行速度と流量に基づいてエネルギー消費と排気ガス量の状況を計算する。

 文献[23]では、人口データ、車両の走行軌跡データ、各地区のエネルギー消費状況及びPOIの分布を分析することで、新エネルギー自動車の充電ステーションを将来的にどこに建設するのが最善かを研究している。また、自動車内部のセンサーによるデータ(アクセルやブレーキを踏む回数や時間等)の分析により、経済的かつガソリン消費を節約できる運転方式をアドバイスする研究も少なくない[24]

2.5 ソーシャルメディアとレジャー

 ソーシャルネットワークの流行、特に位置情報に基づくソーシャルネットワーク[25,26]が一世を風靡したため、ユーザー関係図や位置情報(サインアップや履歴)、写真や動画等[27-30]の多様なメディアデータがもたらされている。これらのデータによって個人の嗜好や習慣[31]が表現されるだけでなく、都市全体の人々の生活様式や移動規則が反映される。そして、これらのデータに基づいて多くの推薦システムが発表されており、これには友達の推薦[32-35]や、コミュニティー、場所の推薦[36-39]、旅行行程の推薦[40-45]、行為・活動の推薦[46-48]が含まれる。位置情報に基づくソーシャルネットワークの様々な推薦システムについては、文献[49]に概説されている。

 アーバンコンピューティングにおけるソーシャルメディアの応用によって、ソーシャルメディアの大量のユーザーデータから如何に集団知を抽出するかがより強調されるようになった。人が重要なセンシング及び計算ユニットとして計算のプロセスに関わることは、都市の持つ重要な特徴の一つである。例えば、あるユーザーがサインアップし、又は位置情報を持った写真データはいずれも不確定な履歴と見なされる。それは、ユーザーはサインアップしたり、写真を撮ったりする際に一つの場所に留まっていることがないからだ。このような履歴データを提供されても、ユーザーが選択した具体的な行程(図13(a))を判断することはできない。しかし、多くのユーザーの不確定な行程を累積すれば、最も可能性の高い行程(図13(b))を推測することができる。つまり、「不確定+不確定→確定」となるのである[43-45]。このような実用例は、旅行行程を計画する一助になり得る。例えば、あるユーザーが北京の后海と天壇、頤和園の3ヵ所を1回で巡りたい場合に、この3つの地点をシステムに入力すると、人々のサインアップデータに基づいて、最も人気ある観光ルートが算出される。

図13

図13 不確定なソーシャルメディアからルートを推測

Fig. 13 Identify the Most-Likely Route from Uncertain Social Media

 ソーシャルメディアからのデータはまた、アーバンコンピューティングのその他の分野にも貢献する。例えば、ネットユーザーがソーシャルネットワークで発表した情報から大統領選挙の結果や感染症の流行、不動産価格の動向を予測したり、事件や災難の発生を知ったり、交通流量を分析したりすることで、公告のリリースや事業拠点の選択を計画することができる。また、ソーシャルメディアを通じて、ある都市の特徴や異なる都市との相似性を分析することもできる。

2.6 経済

 都市経済[50]は比較的成熟した研究分野である。一例として、土地価格を決定する要素や土地の使用制限が経済に与える影響、企業の拠点選択や住宅位置の選択が将来の経済にもたらす影響等の分析が挙げられる。

 文献[51]では、大量のユーザーがサインアップしたデータを分析することにより、事業拠点の選択にアドバイスを提供する。例えば、マクドナルドの店舗位置選択問題がある。文献[52]では道路構造やPOIの分布、人口流動等の多くの要素を結合させることで、不動産価値の格付けを行っている。つまり、市場が強含みの際はどの住宅区の不動産価格が値上がり、逆に市場が弱含みの際はどの住宅区の不動産価格が値下がるかを見る。以上2つの例では、かつての経済学的モデルではなく、機械学習アルゴリズムとデータ駆動型手法を使用している。

2.7 都市の安全と緊急対応

 都市においては、自然災害(地震や洪水等)、大型のスポーツイベントや販促イベント、交通事故や臨時管制、並びに集団的事件等の突発的なできごとが日常的に発生している。このため、これらの情報を適時に感知し、警報を発信することができれば、都市管理を支援し、突発的事件に対する政府の緊急対応能力を向上させ、都市の安全を保障し、悲劇の発生を減らすことができる。

 文献[53-55]では、北京で走るタクシー3万台の走行軌跡を分析することで、都市における異常事件を識別しようとしている。その主な筋道としては、異常な事件が発生した際は、付近の交通流に一定の錯乱が生じることを予測するものである。文献[56]は、具体的な交通路線によって事件発生の原因のさらなる理解を試みるものである。図14で示すように、L1によって結ばれる2つの地区の間で交通流の異常が発生したが、問題そのものはこれら2つの地区に存在しないかもしれない。その原因は、天安門付近のマラソン実施による交通管制であり、これまでに紫色の点線を通って移動した車は、迂回せずに緑色の点線の路線を走ってはならなかったからである。このため、緑色の路線こそが今回の異常をもたらした原因と言える。文献[57]は、タクシー運転手の路線選択方式の変化に基づいて交通の異常を把握するもので、さらに関連のミニブログ(微博)から、ブライダルフェアや道路崩壊等のキーワードを抽出して、以上の原因を解釈しようとしている。

図14

図14 人の移動に基づいた交通異常の分析

Fig. 14 Detect Traffic Anomalies from Human Mobility Data

 文献[58]は、日本人160万人の1年間のGPS移動軌跡データバンクの分析を通じて、東日本大震災や福島第一原子力発電所事故後の被災者の移動、避難行為のモデリング、予測及びシミュレーションを行った。こうすれば、今後また同様の事件が発生した際に、過去の災害経験を吸収し、合理的な避難経路をアドバイスする等の事前準備を行うことができる。

その4へつづく)

参考文献

[15] Zheng Y, Liu F, Hsieh H P. U-Air: When Urban Air Quality Inference Meets Big Data[C]. KDD,Chicago, IL, USA ,2013

[16] Zheng Y, Chen X, Jin Q, et al.A Cloud-Based Knowledge Discovery System for Monitoring Fine-Grained Air Quality[R]. MSR-TR-2014-40, Beijing, 2014

[17] Zheng Y, Liu T, Wang Y, et al. Diagnosing New York City's Noises with Ubiquitous Data[C]. UbiComp,Seattle, WA, USA, 2014

[18] Wang Y, Zheng Y, Liu T. A Noise Map of New York City[C]. UbiComp,Seattle, WA, USA,2014

[19] Liu T, Zheng Y, Liu L, et al. Methods for Sensing Urban Noises[R]. MSR-TR-2014-66,USA, 2014

[20] Zhang F, Wilkie D, Zheng Y, et al. Sensing the Pulse of Urban Refueling Behavior[C]. UbiComp,Zurich, Switzerland ,2013

[21] Zhang F, Yuan N J, Wilkie D, et al. Sensing the Pulse of Urban Refueling Behavior:A Perspective from Taxi Mobility[J]. ACM Transaction on Intelligent Systems and Technology,2013, 9(4): 1-24

[22] Shang J, Zheng Y, Tong W, et al. Inferring Gas Consumption and Pollution Emission of Vehicles throughout a City[C]. KDD, New York, 2014

[23] Momtazpour M, Butler P, Hossain M S, et al. Coordinated Clustering Algorithms to Support Charging Infrastructure Design for Electric Vehicles[C]. UrbComp,Beijing, 2012

[24] Tulusan J, Staake T, Fleisch E. Providing Eco-driving Feedback to Corporate Car Drivers: What Impact does a Smartphone Application have on Their Fuel Efficiency?[C].UbiComp,Pittsburgh, PA, USA , 2012

[25] Zheng Y. Tutorial on Location-Based Social Networks[C].WWW,Pittsburgh, PA, USA , 2012

[26] Zheng Y. Location-Based Social Networks: Users[M]//Zheng Y, Zhou X. In Computing with Spatial Trajectories. New Work: Spring, 2011

[27] Zheng Y, Chen Y, Xie X. GeoLife2.0: A Location-Based Social Networking Service[C].IMDM,Taiwan, 2009

[28] Zheng Y, Wang L, Zhang R, et al. GeoLife: Managing and Understanding Your Past Life over Maps[C]. MDM,Beijing, 2008

[29] Zheng Y, Xie X, Ma W. GeoLife: A Collaborative Social Networking Service Among User, Location and Trajectory[J]. IEEE Data Engineering Bulletin, 2010, 33( 2): 32-40

[30] Zheng Yu, Xie Xing. Enabling Smart Location-Based Services by Mining GPS Traces[J]. CCF,2010(6): 23-30(鄭宇、謝幸:ユーザーの軌跡マイニングに基づくスマート位置サービス[J].中国コンピューター学会通信,2010(6):23-30)

[31] Ye Y, Zheng Y, Chen Y, et al. Mining Individual Life Pattern Based on Location History[C]. IEEE MDM,Taiwan, 2009

[32] Li Q, Zheng Y, Xie X, et al. Mining User Similarity Based on Location History[C]. ACM SIGSPATIAL GIS,Irvine, CA, USA , 2008

[33] Xiao X, Zheng Y, Luo Q, et al. Inferring Social Ties Between Users with Human Location History[J]. Journal of Ambient Intelligence and Humanized Computing, 2014, 5(1): 3-19

[34] Xiao X, Zheng Y, Luo Q, et al. Finding Similar Users Using Category-Based Location History[C]. ACM SIGSPATIAL GIS,San Jose, California, 2010

[35] Zheng Y, Zhang L, Ma Z, et al. Recommending Friends and Locations Based on Individual Location History[J]. ACM Transaction on the Web, 2011, 5(1):1-5

[36] Zheng Y, Zhang L, Xie X, et al. Mining Correlation Between Locations Using Human Location History[C]. ACM SIGSPATIAL GIS,Seattle, Washington , 2009

[37] Zheng Y, Xie X. Learning Location Correlation from GPS Trajectories[C]. MDM,Kansas City, Missouri, USA, 2010

[38] Bao J , Zheng Y, Mokbel M F. Location-Based and Preference-Aware Recommendation Using Sparse Geo-Social Networking Data[C]. SIGSPATIAL GIS,Redondo Beach, California, 2012

[39] Zheng Y, Zhang L, Xie X, et al. Mining Interesting Locations and Travel Sequences from GPS Trajectories[C]. WWW,Madrid, Spain, 2009

[40] Zheng Y, Xie X. Learning Travel Recommendations from User-Generated GPS Traces[J]. ACM Transaction on Intelligent Systems and Technology, 2011, 2(1): 2-19

[41] Yoon H, Zheng Y, Xie X, et al. Smart Itinerary Recommendation Based on User-Generated GPS Trajectories[C]. UIC, Xi'an, 2010

[42] Yoon H, Zheng Y, Xie X, et al. Social Itinerary Recommendation from User-Generated Digital Trails[J]. International Journal on Personal and Ubiquitous Computing,2012, 16: 469-484

[43] Wei L, Zheng Y, Peng W C.Constructing Popular Routes from Uncertain Trajectories[C].KDD,Beijing, 2012

[44] Liu H, We L, Zheng Y, et al. Route Discovery from Mining Uncertain Trajectories[C]. ICDM,Vancouver, Canada, 2011

[45] Zheng K, Zheng Y, Xie X, et al. Reducing Uncertainty of Low-Sampling-Rate Trajectories[C]. ICDE,Brussels, Belgium, 2012

[46] Zheng V W, Zheng Y, Yang Q. Joint Learning User's Activities and Profiles from GPS Data[C]. LBSN,Seattle, WA, USA, 2009

[47] Zheng V W, Zheng Y, Xie X, et al. Collaborative Location and Activity Recommendations with GPS History Data[C]. WWW,Raleigh, NC, USA, 2010

[48] Zheng V W, Cao B, Zheng Y, et al. Collaborative Filtering Meets Mobile Recommendation: A User-Centered Approach[C]. IAAAI,Atlanta, Georgia, USA, 2010

[49] Bao J, Zheng Y, Wilkie D, et al. A Survey on Recommendations in Location-Based Social Networks[J]. GeoInformatica, 2015,DOI:10.1007/S10707-014-0220-8

[50] Arthur O. Urban Economics[M].Boston, Mass: McGraw-Hill/Irwin, 2003

[51] Karamshuk D, Noulas A, Scellato S, et al. Geo-Spotting: Mining Online Location-Based Services for Optimal Retail Store Placement[C]. IKDD,Chicago, IL, USA ,2013

[52] Fu Y, Xiong H, Ge Y, et al. Exploiting Geographic Dependencies for Real Estate Appraisal: A Mutual Perspective of Ranking and Clustering[C]. KDD,New York,2014

[53] Liu W, Zheng Y, Chawla S, et al. Discovering Spatio-Temporal Causal Interactions in Traffic Data Streams[C]. KDD,San Diego, California,2011

[54] Pang L X, Chawla S, Liu W, et al. On Mining Anomalous Patterns in Road Traffic Streams[C].ADMA,Beijing, China,2011

[55] Pang L X, Chawla S, Liu W, et al. On Detection of Emerging Anomalous Traffic Patterns Using GPS Data[J]. Data & Knowledge Engineering, 2013,87: 357-373

[56] Chawla S, Zheng Y, Hu J. Inferring the Root Cause in Road Traffic Anomalies[C].ICDM,Brussels, Belgium, 2012

[57] Pan B, Zheng Y, Wilkie D, et al. Crowd Sensing of Traffic Anomalies based on Human Mobility and Social Media[C]. ACM SIGSPATIAL,GIS,Orlando, Florida, USA , 2013

[58] Song X, Zhang Q, Sekimoto Y, et al. Modeling and Probabilistic Reasoning of Population Evacuation during Large-Scale Disaster[C]. KDD,Chicago, IL, USA, 2013

 ※本稿は鄭宇「城市計算概述」『武漢大学学報(信息科学版)』第40巻 第1期、2015年1月,pp.1-13)を『武漢大学学報(信息科学版)』編集部の許可を得て日本語訳・転載したものである。
記事提供:同方知網(北京)技術有限公司