第105号
トップ  > 科学技術トピック>  第105号 >  中国のビッグデータ発展の現状と趨勢(その4)

中国のビッグデータ発展の現状と趨勢(その4)

2015年 6月30日

程 学旗:中国科学院計算技術研究所

楊 婧:中国科学院ネットワークデータ科学・技術重点実験室

靳 小竜:中国科学院ネットワークデータ科学・技術重点実験室

四、ビッグデータ技術と産業発展の趨勢

 CCFビッグデータ専門家委員会と中関村ビッグデータ産業連盟は2014年末、ビッグデータ技術と産業発展の趨勢に関する共同調査研究を実施した。同調査研究ではまず、CCFビッグデータ専門家委員会の委員と中関村ビッグデータ産業連盟の企業家からビッグデータの発展趨勢に関する見方と判断を募り、その後、計54の候補を、ビッグデータ科学、ビッグデータ技術、ビッグデータシステム・工学、ビッグデータ応用、データ資源、産業生態環境という6つのカテゴリーに分けた。最後に、140人のCCFビッグデータ専門家委員と中関村ビッグデータ産業連盟の企業家による投票を行い、CCFビッグデータ専門家委員会が2015年度ビッグデータ技術・産業発展の十大趨勢を総括した[14]

趨勢一、スマートコンピューティングとビッグデータ分析の結合が焦点に

 ビッグデータと、ニューロコンピューティング、ディープラーニング、セマンティックコンピューティング、人工知能を含むその他の関連技術との結合は、ビッグデータ分析分野の焦点となっている。ビッグデータ分析の核心は、データから価値を得ること、ビッグデータからより正確でより深いレベルの知識を取得することであり、データの単純な統計・分析ではない。この目標を達成するためには、データの認知とコンピューティング能力を高め、コンピューティングシステムにデータを理解、推理、発見し、意思決定する能力を持たせる必要がある。そのコア技術となるのが、人工知能だ。近年、人工知能の研究と応用が再び盛り上がりを見せている。これは、コンピュータ・ハードウェア性能が向上したためであり、クラウドコンピューティング、ビッグデータを代表とするコンピューティング技術の急速な発展により、情報処理のスピードと質が大きく向上し、膨大なデータをすばやく同時に処理できるようになったためでもある。

趨勢二、データ科学が多学科の融合をけん引も、体系化には至っておらず

 データ科学は多学科の融合をけん引する。しかし、データ科学は新興学科であり、その基礎的な体系がまだ明確になっておらず、その発展はまだ体系化に至っていない。ビッグデータの時代、多くの学科の研究の方向性は表面的には大きく異なるが、データという角度から見ると、実は相通じる部分がある。社会のデジタル化が進むにつれ、ますます多くの学科がデータレベルでは一致した方向に向かっており、似たような構想を用いて統一的に研究ができる。データ科学は真の意味でビッグデータの発展をサポートする学科的飛躍はまだ見られていないものの、ビッグデータと関係する新興学科だ。ビッグデータ処理の理論研究面において、新しい確率と統計モデルは主な研究ツールとなる。ただ、学科基礎理論の飛躍を2015年に実現するのは難しい。

趨勢三、業界データとの結合、分野を跨ぐ活用を実現

 学科・分野を跨ぐデータ融合分析と活用は今後のビッグデータ分析・活用の重要な発展趨勢となる。ビッグデータ技術発展の目標は、その活用を根付かせることだ。ゆえに、ビッグデータ研究はコンピューティング技術そのものに留まっていてはならない。既存のビッグデータ・プラットフォームは使いやすさに欠ける一方で、垂直応用業界のデータ分析は、分野の専門知識とモデリングに関わり、ビッグデータの業界分析応用と汎用的なビッグデータ技術には隔たりがあり、相互の係わり合いと融合が不足している。このため、典型的業界・重要業界におけるビッグデータの実際の活用を促すには、学科と分野を跨ぐビッグデータ技術と応用研究が必要となる。

趨勢四、「物ŸクラウドŸモバイルŸSNS」との融合で、総合的価値を創出

 ビッグデータは将来、モノのインターネット、モバイルインターネット、クラウドコンピューティング、ソーシャルコンピューティングなど注目を集める技術と互いに融合し、多くの総合的なアプリケーションを生み出すことになる。近年のコンピュータと情報技術発展の趨勢として、フロントエンドがより一層進展し、バックエンドがより一層強化されている。モノのインターネットとモバイルコンピューティングは、物理世界と人との融合を促進し、ビッグデータとクラウドコンピューティングはバックエンドのデータ保存管理とコンピューティング力を高めた。今後、これらの注目技術が融合し、多くの総合的なアプリケーションが生まれるだろう。

趨勢五、ビッグデータの多様化処理モデルとソフト・ハードウェアインフラ構築の進展

 インメモリコンピューティングはこれからも、ビッグデータ処理性能を高める主な手段となる。リアルタイムの検索と分析は、意思決定に関わる情報を速やかに取得する上で非常に重要だ。今後、大量のビッグデータリアルタイム検索・分析システムが登場し、大容量メモリに基づくコンピューティングモデルが、ビッグデータリアルタイム処理の重要手段となる可能性がある。Sparkを代表とするインメモリコンピューティングが徐々に商用化に向かい、Hadoopと融合・共存することになる。

 ビッグデータ処理の最適化に特化したシステムとハードウェアが出現する。ビッグデータシステムのコンピューティング、メモリ、キャッシュメモリに対するニーズがアンバランスであるため、従来型のサーバーとメモリは、信頼性とコストパフォーマンスの高いビッグデータ処理システムの構築に適さない。ハードウェアメーカーは今後、異なるアプリケーションに適するハードウェアを開発し、ビッグデータサービスプロバイダーは既存のサーバーに基づき、専用の処理設備をカスタマイズし、最終ユーザーはビッグデータシステム中のハードウェア設備をカスタマイズするようになる。ビッグデータ処理の過程において、多くのプロセスが標準化・モジュール化されるため、ハードウェアアクセラレーションモジュール(GPU、MIC 、FPGA/ASIC など)の導入がシステム性能向上の必然的選択となる。

 ビッグデータ処理の多様化モデルが共存融合、一体化融合したビッグデータ処理プラットフォームが徐々に趨勢化している。例えば、電気通信、金融、医療、安全・電力などの重要業界を支えるビッグデータ活用の基礎ソフトウェアプラットフォームは、一体化の特徴を呈する。これらはデータを中心とし、OS、分散ストレージ、データベースなどの商品を融合し、構造化、半構造化、非構造化データなど、全てのデータを効率的に保存・管理し、アプリケーションに統一的なデータサービスのサポートインタフェースを提供する。

趨勢六、ビッグデータの安全とプライバシー

 ビッグデータの安全とプライバシー問題は依然として注目を集めている。ビッグデータの活用に伴うプライバシー問題、ビッグデータシステムと体系に存在するセキュリティ問題の面で、依然として実質的な進展と飛躍が見られていない。ビッグデータの安全が趨勢の1つに選ばれたことは、調査研究に参加した専門家とユーザーの期待、理解、注目の現れであるとする分析もある。専門家は2014 年、ビッグデータおよび関連の重要資源は国家主権に関わるとの見方を示し、ビッグデータの安全に対する注目が新たな高みに到達した。

趨勢七、新たなコンピューティングモデルが飛躍的に進展:ディープラーニング、クラウドソーシング·コンピューティング

 ここ数年、ディープラーニングが高く注目を集め、一部の分野で大きな役割を発揮しているが、ビッグデータの専門家と企業関係者はクラウドソーシング技術により注目しているようだ。分散コンピューティングはビッグデータ分析を支える上で欠かせないものだが、これには2つの形態がある。1つは物理資源集中型(分散コンピューティングの機能を持つクラスター、データセンターなど)、もう1つは物理資源分散型(P2P 技術など)だ。ビッグデータは、物理資源分散型に基づくほうがより多くの応用シーンがある。例えば、典型的な応用である大規模なWEBクローラーの場合、物理資源集中型だとブロックされ易いが、クラウドソーシング•コンピューティングのような物理資源分散型の分散コンピューティングプラットフォームを採用すれば、このような問題を回避できる。

趨勢八、可視化と視覚分析が幅広く導入、ビッグデータ分析効果が大幅に向上

 可視化と視覚分析の研究は急速に発展しており、国内では可視化を専門的に研究する人が急増している。可視化研究のデータ対象は従来の単一のデータソースから、マルチソース、多次元、マルチスケールへと拡張し、ユーザーも専門家から幅広い非特定グループに拡大した。研究ではメソッドの拡張性と開発の簡便性に重きが置かれている。革命的な新手段と、普遍的な可視化技術・ツール、大衆向けの可視化ツールライブラリ、および協調とクラウドソーシングの視覚分析手段は、各種の総合分析ツールとプラットフォームに幅広く導入され、各種ビッグデータ分析の使いやすさと効率を大幅に引き上げることになるだろう。

趨勢九、ビッグデータ技術カリキュラム体系建設と人材育成に注目

 ビッグデータ技術の急速な発展と業界ニーズの急速な増加に伴い、技術市場では現在、ビッグデータ技術を把握した人材が不足している。政府、大学、科学研究機関はビッグデータ技術人材教育・育成体系の構築を急ぎ、データ科学と工学の専攻学科を発展させ、学科と分野を跨ぐビッグデータカリキュラム体系を構築し、コンピュータ、数理解析統計、アプリケーションに関連する学科を融合し、学際的なデータ分析技術の発展および人材育成を推進していく。

趨勢十、オープンソースシステムが、ビッグデータの主流技術・システムの選択肢に

 Hadoopを代表とするオープンソース技術は、ビッグデータ技術の幕を開けた。ビッグデータの発展もまた、オープンソース技術のさらなる発展を後押しした。オープンソース技術の発展はデータ処理のコストを引き下げ、ビッグデータ生態系の発展をリードすると同時に、従来型のデータバンクメーカーに課題をもたらした。統計によると、現在150 種以上のオープンソースビッグデータプラットフォームが存在しており、その数は増加しているという。

五、結語

 ビッグデータは現在、社会各界が注目する問題となっている。本稿ではまず、ビッグデータの背景について紹介し、ビッグデータの国家、政府、科学研究、産業にとっての価値と意義について説明し、中国ビッグデータの発展動向を総括した。ビッグデータがすでに各業界に浸透していることを考慮し、本稿ではビッグデータへの取り組みで他をリードしている4つの代表的業界(インターネット、金融、電気通信、医療・健康)の応用の現状と発展の趨勢について論述した。最後に、ビッグデータ技術と産業の発展趨勢を総括した。

参考文献:

[14]程学旗、 潘柱廷、 靳小竜、 楊婧、 2015年ビッグデータ発展趨勢予測、 中国コンピュータ学会通訊、 第11巻、 第1期、 第48-52ページ、 2015年1月.