第117号
トップ  > 科学技術トピック>  第117号 >  生物医学ビッグデータの現状と展望(その2)

生物医学ビッグデータの現状と展望(その2)

2016年 6月 3日

寧康:中国科学院青島バイオエネルギー・バイオプロセス研究所、
単細胞研究センターバイオインフォマティクスチーム

陳挺:清華大学情報科学・技術国家実験室、バイオインフォマティクス研究部、
清華大学コンピュータ科学・技術学部、
スマート技術・ス マートシステム国家重点実験室

その1よりつづき)

2 生物医学ビッグデータの典型的な応用

 典型的な生物医学データには、がん、オーダーメイド医療などのデータが含まれ、その形式は機能ゲノム、単一細胞、メタゲノムデータなど。これらのデータは全てNCBIあるいはEBIといった大型のユニバーサル・データベースに保存される。ハイスループット・シークエンシング技術の発展・応用およびバイオテクノロジーと情報技術の融合に伴い、NCBIなどの大型のユニバーサル・データベース中にある生物医学データのタイプとデータ規模は絶えず拡大し続けている[15](図2)。

図2

図2 (カラーオンライン版) GenBank SRAデータベースの近年のデータ量増加状況

Figure 2 (Color online) The increase of data sizes for GenBank SRA database

2.1 既存の大型ユニバーサル生物医学データベース

 既存の生物医学大型ユニバーサル・データベースには米NCBIのGenBank、欧州のEBI、日本のDDBJなどがある。ある特定のデータあるいは研究対象に特化したデータベースであるUni-Prot(タンパク質配列のデータベース)、MG-RAST(微生物データベース)なども現在急速に発展している。これらはいずれも生物情報データの管理、集積、分析、発表などに携わる大型データベースだ。近年、ハイスループットシークエンシング技術の発展に伴い、これらの大型データベースのデータ量は激増し続けている(表1)。

表1 既存の生物医学関連の典型的なデータベースのデータ量とプロジェクト数a)
Table 1 Data sizes and project numbers for current typical databases related with biomedical researches a)
a) 2014 年 8 月時点
データベースの名称 データベースの用途 データ量 プロジェクト数(推定) URL
GenBank SRA 自由な閲覧が可能な、注釈付きのDNA配列データベース >3000 TB >25000 www.ncbi.nlm.nih.gov/genbank
Uni-Prot タンパク質配列のデータベース >1000 TB >20000 www.uniprot.org
MG-RAST 微生物データベース 52.49 TB 18500 metagenomics.anl.gov
TCGA がんのオミックスデータベース ~3000 GB ~131000(サンプル数) cancergenome.nih.gov

2.2 個人ゲノムおよびオーダーメイド医療

 2008年11月6日、Nature誌に「初のアジア人ゲノムマップ」に関する論文が掲載され、表紙には「あなたの命はあなたの手中に握られている」という文字が並んだ[16]。「初のアジア人ゲノムマップ」の完成は医学における重要な成果であり、5~10年後には個人が安いコストで自らのゲノムマップを取得できるようになることを意味する。予測できる未来において、医師はこのゲノムマップを基により正確な診断と治療ができるようになり、病気の発症前に必要な介入ができるようになる。さらには、薬品すらも遺伝子マップに基づき個人のために特別に設計することができる。つまりこれは、「あなたの命はあなたの手中に握られている」、「個人ゲノム時代到来」の前触れと言える。ゲノムマップは遺伝子発現調節など医学関連の知識と結びつけることで、疾患の発病プロセスへの認識や疾患の抵抗性研究に新たな方針をもたらすだろう。「ゲノムマップ」は疾患の治療に役立つだけではない。より重要なのは、発病前の介入により疾患を予防できることだ。こうすることで、紋切り型の治療はなくなり、薬品も一人ひとりの特徴に合わせた特別設計のものになる可能性がある。ゆえに、個人ゲノムはオーダーメイド医療の基礎であり、21世紀は「オーダーメイド医療」の時代になる。1万人のゲノムマップが完成すれば、真の意味での個人ゲノム時代が到来する。2014年には、1000ドル以下での個人のゲノム解析が実現している[17]。個人ゲノムマップの作成にかかる費用は今後ますます安価になり、多くの病院で診察前の定例の手続きに組み込まれると予想される。

 スタンフォード大学の著名な生物学者であるSnyder教授などの研究者[18]は2012年、個人のゲノムマップを利用し、複数のハイスループット・バイオテクノロジーを組み合わせて定期的に人体の生理的状態をモニタリングし、オーダーメイド医療の実現可能性を模索した。彼らは統合個別化オミックス(integrative personal omics profile、略称はiPOP)という概念を提起した。iPOPは個人に対して14カ月にわたる医療追跡を行う。ゲノムシークエンシングのほか、血液サンプルを通じてトランスクリプトーム、プロテオーム、メタボローム、微生物メタゲノム、および個体自身の抗体の分布を検査し、2型糖尿病を含む様々な医療リスクを分析する。分析結果は個人の健康・疾患の状態を表す様々な分子成分と、生物学的経路の幅広い動的変化を示す。同研究は、ゲノムマップと各種の動的なオミックス情報を組み合わせることで、個人の健康と疾患の状態を解釈できることを示した。実験の過程において、iPOPは大量のハイスループット・オミックスデータを生成し、20の時間点において計約30億の生物学的特徴をモニタリングし、これらのデータの複雑な計算分析を行った。オーダーメイド医療が普及すれば、一人ひとりのゲノムシークエンシングが必要になる。また各オミックスデータを定期的に検出・計算分析し、分析結果に基づいた個性化された予防・診断・治療を提供していくことになる。大量のハイスループット・オミックスデータが生成されるが、個人情報を含むこれらの生物医学ビッグデータをどのように保存・分析・保護し、データをどうやって医学的に解釈し、診断するかなどは、いずれも今後我々が直面する課題となる。

 オーダーメイド医療の波が押し寄せる中、システム生物学が現代の医療システムを変化させた例としては、以下のものがある。患者の症状を中心とした疾患の診断・治療から、個々の特性に基づく精確な治療への転換[19]。特にハイスループットのDNAシークエンシングと質量分析計技術の進歩により、科学者と医療従事者は人体の細胞と組織、体液、表皮、排泄物などのサンプリングが可能になり、ゲノム、エピゲノム(epigenome)、トランスクリプトーム、プロテオーム、メタボローム(metabolome)、免疫群(autoantibodyome)、微生物群(microbiome)、環境因子(envirome)を含む詳細な各オミックス情報を非常に精確に検出できるようになった。これらの情報を統合することで、個人の健康状態を全面的に理解できるだけでなく、健康状態を個別に検査し、疾患の予防をする新たな手段が生まれた。サンプリングとデータ収集の基準をいかに設定するか[20,21]、これらのデータをいかに効果的に利用し、統合・計算分析していくかは今後の主な課題となる[22]

2.3 人体の微生物群の研究

 人体の微生物群は人の皮膚や口腔、胃、腸、血液などに存在し、人体と共生し、人の生理と栄養に深い影響を及ぼす。微生物群に対する研究の進展に伴い、ますます多くの人体を宿主とする体内外の微生物群、特に腸内微生物群などの幅広い研究が進められるようになった[23]。報道によると、人体の内外には約100兆個の細菌が存在しており、細菌の含有量は体細胞の9倍、細菌が持つ遺伝子数は人類の約1000倍に達するという。一部の細菌は、人体の生理的機能において目立った役割を果たしている。例えば、一部の細菌は人体の免疫システム構築を効果的に助け[24]、一部の細菌は食物の消化促進に不可欠だ[25]。さらには、病原体が病変を誘発するのを防止するものもある[26]。メタゲノム研究は、微生物群の研究と言うよりは、人類「自身」の研究と言ったほうが良いだろう。これまでの研究により、人類の多くの疾患(マラリア、髄膜炎、敗血症など)は病原菌と関係があることが分かっており、一部の粘膜疾患も菌群の失調と関係がある。さらに、うつ病などいくつかの精神疾患の患者の腸内菌群には異変がみられる[27]。人体内外の微生物と健康は密接に関連していると言える。

 炎症性腸疾患、肥満症、2型糖尿病などの患者は、微生物と人体間の動的なバランス関係が崩れていることがこれまでの研究で分かっている。アメリカ国立衛生研究所(NIH)は2008年に1億ドル以上の資金を投じてヒト微生物群ゲノム解析プロジェクト(Human Microbiome Project)[http://hmpdacc.org/]を立ち上げ、ヒト体内の微生物と健康の関係性について研究した[28]。これらの微生物と人体の共生(symbiosis)は、人体の消化システムの働きを助け、人体に必要なビタミンを提供すると同時に、免疫面でも重要な役割を果たし、有害な細菌の攻撃から人体を守っている。多くの疾患は、こうした共生関係の変化によってもたらされる。米ワシントン大学の研究グループは2009年、肥満症患者の腸内微生物の多様性が、健常者に比べて明らかに減少していることを発見した[29]。また、最近の研究では、妊娠中の母体で腸内の微生物群が自発的に適応・変化し、母体がより多くの栄養を得られるよう助ける一方で、妊娠中の体重増加と、耐糖能の低下をもたらす可能性があることが明らかになった[30]。免疫システムにおいて、微生物群は人体のナイーブT細胞に影響をもたらすことが証明されている。これは、微生物と人体の免疫システムは共に進化していることを意味している[31]。人体の発育を見ると、生命の初期の段階で抗生物質に曝露することが、脂肪組織、筋肉、骨格の長期的な発展に影響することが証明されている[32]。臨床医学においては、微生物の移植がクロストリジウム・ディフィシル(clostridium difficile)感染症の主な治療法となっている[33]

 中国のメタゲノム研究はスタートが遅れたものの、急速な進歩を遂げている。華大基因(BGI)は欧州のMetaHIT Consortiumとの協力により、欧州人124人の腸内微生物メタゲノムシークエンシングを行い[34]、300万を超える異なる遺伝子を発見、ほとんどの遺伝子はこれまで研究されたことがないものだった。別の糖尿病患者の腸内メタゲノムの研究では[35]、糖尿病患者の腸内微生物群の多様性が、健常者の腸内の微生物群と比べて明らかに少ないことが明らかになった。

 これらの理由により、遠くない未来、人類の生存環境や健康に関する研究分野において、大量のメタゲノム・シークエンシングデータが生成されることが予想される。人類の生存環境の監視とオーダーメイド医療に情報を提供するため、これらのデータをいかに保存・計算分析し、どう利用していくかは、人類の未来の発展にとって極めて重要である。

その3へつづく)

参考文献

15 Kodama Y, Shumway M, Leinonen R, The sequence read archive: Explosive growth of sequencing data. Nucleic Acids Res, 2012, 40: D54-D56

16 Wang J, Wang W, Li R, et al. The diploid genome sequence of an Asian individual. Nature, 2008, 456: 60-65

17 Hayden E C. Is the $1,000 genome for real. Nature, 2014

18 Chen R, Mias G I, Li-Pook-Than J, et al. Personal omics profiling reveals dynamic molecular and medical phenotypes. Cell, 2012, 148: 1293-1307

19 Chen R, Snyder M. Systems biology: Personalized medicine for the future? Curr Opin Pharmacol, 2012, 12: 623-628

20 Kolker E, Özdemir V, Martens L, et al. Toward more transparent and reproducible omics studies through a common metadata checklist and data publications. OMICS, 2014, 18: 10-14

21 Snyder M. iPOP and its role in participatory medicine. Genome Med, 2014, 6: 6

22 Harvey A, Brand A, Holgate S T, et al. The future of technologies for personalised medicine. N Biotechnol, 2012, 29: 625-633

23 Frank D N, Amand A L S, Feldman R A, et al. Molecular-phylogenetic characterization of microbial community imbalances in human inflammatory bowel diseases. Proc Natl Acad Sci USA, 2007, 104: 13780-13785

24 Costello E K, Lauber C L, Hamady M, et al. Bacterial community variation in human body habitats across space and time. Science, 2009, 326: 1694-1697

25 Frey-Klett P, Burlinson P, Deveau A, et al. Bacterial-fungal interactions: Hyphens between agricultural, clinical, environmental, and food microbiologists. Microbiol Mol Biol Rev, 2011, 75: 583-609

26 Sievert D M, Ricks P, Edwards J R, et al. Antimicrobial-resistant pathogens associated with healthcare-associated infections: summary of data reported to the National Healthcare Safety Network at the Centers for Disease Control and Prevention, 2009-2010. Infect Control Hosp Epidemiol, 2013, 34: 1-14

27 Messaoudi M, Violle N, Bisson J F, et al. Beneficial psychological effects of a probiotic formulation (Lactobacillus helveticus R0052 and Bifidobacterium longum R0175) in healthy human volunteers. Gut Microbes, 2011, 2: 256-261

28 Human Microbiome Jumpstart Reference Strains Consortium, Nelson K E, Weinstock G M. A catalog of reference genomes from the human microbiome. Science, 2010, 328: 994-999

29 Turnbaugh P J, Hamady M, Yatsunenko T, et al. A core gut microbiome in obese and lean twins. Nature, 2008, 457: 480-484

30 Koren O, Goodrich J K, Cullender T C, et al. Host remodeling of the gut microbiome and metabolic changes during pregnancy. Cell, 2012, 150: 470-480

31 Chung H, Pamp S J, Hill J A, et al. Gut immune maturation depends on colonization with a host-specific microbiota. Cell, 2012, 149: 1578-1593

32 Cho I, Yamanishi S, Cox L, et al. Antibiotics in early life alter the murine colonic microbiome and adiposity. Nature, 2012, 488: 621-626

33 Van Nood E, Vrieze A, Nieuwdorp M, et al. Duodenal infusion of donor feces for recurrent Clostridium difficile. N Engl J Med, 2013, 368: 407-415

34 Qin J, Li R, Raes J, et al. A human gut microbial gene catalogue established by metagenomic sequencing. Nature, 2010, 464: 59-65

35 Qin J, Li Y, Cai Z, et al. A metagenome-wide association study of gut microbiota in type 2 diabetes. Nature, 2012, 490: 55-60

※本稿は寧康, 陳挺「生物医学大数拠的現状与展望」(『科学通報』(2015年,第60巻,第5-6期,pp.534-546)を『科学通報』編集部の許可を得て日本語訳・転載したものである。記事提供:同方知網(北京)技術有限公司