第44号:ゲノムおよび機能分子解析の進展
トップ  > 科学技術トピック>  第44号:ゲノムおよび機能分子解析の進展 >  オミックス研究の現状と展望

オミックス研究の現状と展望

2010年 5月20日

林﨑 良英

林﨑 良英(はやしざき よしひで):
独立行政法人理化学研究所 オミックス基盤研究領域領域長

1957年大阪生まれ。1986年大阪大学医学部大学院博士課程修了(医学博士)。1992年より理化学研究所ライフサイエンス筑波研究センタージーンバンク室研究員、1995年ゲノム機能解析研究グループプロジェクトリーダー、1998年ゲノム科学総合研究センター遺伝子構造・機能研究グループプロジェクトディレクターを経て、2008年より理化学研究所オミックス基盤研究領域領域長。生体分子の網羅的データ解析によるトランスクリプトームおよび遺伝子制御ネットワークの解析に取り組んでいる。2004年文部科学大臣賞、2007年紫綬褒章受章。

はじめに

 2003年4月14日、国際ヒトゲノムコンソーシアムにより、ヒトゲノム完全解読宣言がなされた。この日を境に、従来のライフサイエンスの研究スタイルに、想像もできないほどの変革がもたらされた。ゲノムには生命をコントロールする基本情報が刻まれており、ゲノム解析によってその有限ではあるが広大な情報の全体を、人類はやっとスコープの中に入れることができたのである。有限であると分かった対象は、全体をとらえることで、必ずや全体を理解することができるようになるであろう。たとえば、地球の果てがどこだかわからなかったときと、「地球は球である」と認識したあとでは概念が全く変わり、地球規模でものを考えることができるようになる。この対象はゲノムだけではない。生体分子の情報は、そのすべてにおいて有限であると考えられ、それらを網羅的に収集・解析するアプローチがオミックスである。

 ヒトゲノムプロジェクトにより、ゲノム配列はわかったが、生命現象のメカニズムはまだまだ未知である。生命活動とは、ゲノムを基本設計図としつつ、環境との相互作用というダイナミズムの中で営まれている。生命現象における階層、たとえば、ゲノムDNAをもとにRNAが作られ、RNAをもとにタンパク質が作られる、という流れの中で、ゲノム配列は一番下の階層であり、生命現象を理解するには、高次の階層へ向かって、網羅的な解析を進めていく必要がある。このようなオミックス研究における、日本の現状と展望について考える。

世界のポストゲノム研究

 2001年、ヒトゲノムプロジェクトが最初のドラフトシーケンスを発表した際、日本は行政レベルでヒトゲノムに関する研究は終了したと科学技術政策上の誤った一般的解釈がなされたために、日本はヒトゲノム分野のプロジェクト型研究に対する推進力を失った感が否めない。その後、日本独自の機能的な解析に焦点を当てた「ゲノムネットワークプロジェクト」などのプロジェクト研究を推進したものの、全体の規模などを考えると、中国、米国からゲノムプロジェクトそのものの推進から一歩引いた位置にとどまっている。一方、米国ではヒトゲノム研究の在り方が国家レベルで検討され、ヒトゲノム多様性解析研究や、トランスクリプトームやエピゲノミクスなどの研究推進策が決定された。また、それだけでなく、個人のゲノム解析を推進することにより、遺伝的背景をもとにした個人差の解明が期待され、テーラーメード医療への展開が示唆された。しかし、個人のゲノム解析など、これらの研究を推進するためには、当時においては膨大な予算が必要であった。そのため、米国ではコストや労力を抑えることを目指し、国をあげて次世代シーケンサー開発へ乗り出した。このような状況下で、米国はヒトゲノム解析完了宣言を契機として、ゲノムのアノテーション(注釈づけ)をスタートすると同時に、1000ドルゲノムを目指しはじめた。その結果、現在では次世代シーケンサー技術開発は、一部の例外を除いて、すべて米国に中心がある。このような背景を持って、その後、米国主導のポストゲノム研究プロジェクトが次々と立ち上げられている。また、最近では中国の北京ゲノム研究所(BGI)が、多数の次世代シーケンサーを導入し、「1000 plant/animal プロジェクト」など、シーケンシングを積極的に展開している。以下、主要な国際ポストゲノムプロジェクトを挙げる。

  • 1000人ゲノムプロジェクト:異なる民族グループから1000人分の匿名者のゲノム配列を決定することにより、ヒトの遺伝的多様性を解析する。イギリス、米国、中国が中心。
  • がんゲノムコンソーシアム:主要ながんのゲノム変異カタログを作成する。米国、欧州、オーストラリア、インド、中国、日本など、数多くの国々が参加。
  • ゲノム10Kプロジェクト:脊椎動物一万種のゲノム解読を目指す。米国、欧州、シンガポール、カナダ、日本などが参加。
  • ヒト微生物群ゲノムプロジェクト:体内の1000の微生物ゲノムを解読。米国国立衛生研究所(NIH)が主導。
  • ENCODEプロジェクト:遺伝子発現解析。米国NIHが主導。米国、欧州、シンガポール、日本などが参加。
  • パーソナルゲノムプロジェクト:米国ハーバード大学が主導。参加した個人のゲノム情報に加え、顔写真や医療情報をともにウェブ上で公開する。一万人を募集、解析する予定。
  • ヒトエピゲノムコンソーシアム:1000のエピゲノムマップの構築を目指す。米国、欧州が主導。
  • ゲノム疫学プロジェクト「P3G(The Population Project in Genomics)」:数十万人のゲノム解析データとともに、生活習慣などの疫学データをデータベース化する。各国で進行中のプロジェクト間の連携をとり、共同でデータ解析を行う。数多くの国々がメンバーとして参加しているが、日本は参加していない。
  • ヒトヴァリームプロジェクト:人類すべての遺伝子変異を一覧にして、世界中の研究者、医師、患者がアクセスできることを目指す。オーストラリア、米国などが参加。
  • 国際エピゲノムコンソーシアム:あらゆるエピゲノムマーカーを探索し、さまざまな組織細胞で、国際分業で解析を行う。

日本の貢献

 ゲノム配列だけではわからなかった生命活動のメカニズムを理解するため、より高次な分子情報を網羅的に解析するオミックス研究には、以下の3つの要素を欠かすことはできない。

1.次世代シーケンサーの発展

2.新しい戦略に基づくサンプル調整技術

3.情報を知識に変えるバイオインフォマティックス技術

 シーケンス技術の開発や、次世代シーケンサーの導入実績の点において、日本は欧米に比して出遅れたと言わざるを得ないが、日本には独自のサンプル調整技術を活かし、バイオインフォマティックス技術を駆使した、トランスクリプトーム解析を展開してきた実績がある。

 たとえば、2004年度から文部科学省が開始したゲノムネットワークプロジェクトでは、遺伝子の発現調節機能やタンパク質等の生体分子間の相互作用の網羅的な解析を行い、生命活動を成立させているネットワークを明らかにしたので、以下にその概略を紹介する。

 筆者のグループでは、CAGE(Cap Analysis of Gene Expression)法と呼ばれる、ゲノムワイドな転写開始点の同定や遺伝子発現プロファイルを得ることができる独自技術を開発し、トランスクリプトーム解析に活用した。CAGE法では、mRNAのcapサイトを補足し、その5’末端をタグとして回収し、そのシーケンス解読をし、既知のゲノムにマッピングすることにより、ゲノム上のプロモーターを同定することができる。このCAGE法を活用し、マウスの完全長cDNA解析を行った結果、ゲノムの70%が転写されていることを発見した。また、転写産物の半分以上はタンパク質をコードしないノンコーディングRNA(ncRNA)であることがわかり、次々と新規のncRNAが発見され、その機能解明が進んでいる。このCAGE法を次世代シーケンサーと組み合わせることによって、転写開始点の情報に加えて、その定量的情報も得られるようになり、ゲノムワイドなプロモーター活性の解析が可能となった1)。最近では、この技術をもとに、バイオインフォマティックスを駆使し、ヒト白血病由来細胞株をモデルとした、細胞分化に伴う転写因子の制御ネットワークを描出することに成功した2)。このトランスクリプトーム解析は、米国主導のENCODEプロジェクトのトランスクリプトーム解析とは違う。ENCODEプロジェクトでは、ゲノム上のそれぞれの遺伝子がどのような役割を果たしているかを解析しているが、我々のプロジェクトでは、遺伝子間の相互作用、つまり、どの遺伝子がどの遺伝子を制御しているか、というネットワークの解析を行っている。転写因子間のネットワークを解明することにより、細胞の状態、たとえば分化などのメカニズムを理解することにつながる。

 米国が開発してきた次世代シーケンサーがライフサイエンス研究に与えたインパクトは2つある。ひとつ目は、驚くべきシーケンシングのスループット(処理能力)の進化である。これにより、大規模なデータ生産が短時間で可能となり、網羅的解析の速度が向上された。そしてふたつ目は、用途の多様化である。次世代シーケンサーでは、ゲノムのシーケンス解析はもちろんのこと、前述したように、それ以外にも、サンプル調整技術のデザインなどにより、以下のような分子情報のゲノムワイド解析が可能である。

  1. トランスクリプトーム解析:mRNAやタンパク質をコードしないncRNAを含む、転写物(トランスクリプト)の総合的な解析
  2. 転写開始点の同定や、ゲノムワイドな遺伝子発現パターンの解析、転写制御ネットワークの解析(CAGE法の適用)
  3. DNA-タンパク質の相互作用の解明(Chip-seq)
  4. ゲノムDNAの修飾やヒストンのメチル化・アセチル化などのエピゲノム解析
  5. タンパク質間相互作用の解明(2-ハイブリッドシステムの適用)
  6. ゲノムが細胞内で折りたたまれた際の、3次元的な配置の解析(3C/5C 3C:chromosome conformation capture, 5C: chromosome conformation capture carbon copy)3)

 このように、次世代シーケンサーの多様性を活用することにより、工夫次第でより高次の生体分子情報を抽出するための技術を開発することができるのである。

今後の展望

 ゲノム科学の発展により、ライフサイエンスの研究分野にはパラダイムシフトが起こった。研究スタイルは「仮説駆動型」から、大規模データ解析のような「データ駆動型」へ移行しはじめた。この大規模なゲノムデータは、たとえば発生生物学や免疫学など、様々な研究分野で使われることとなり、今後ますますライフサイエンス分野の研究スタイルは横断的になっていくであろう。その場合、一極集中型で大規模解析ができるシーケンス拠点を整備することは、スケールメリットへとつながる。世界各国の主要なゲノムセンターでは、シーケンス拠点が設置されているが、わが国においても2009年度より、シーケンス拠点の構築が開始された。現在のわが国の研究予算規模などを考慮すると、シーケンス拠点の整備は、国際競争力を強化するためにも重要である。

 最近、中国は、2000億塩基/台/ランという驚異的な容量をもつイルミナ社のHiSeq2000を128台導入すると発表し、世界を驚かせた。まさに、世界のシ―ケンシングの生産を一極集中型で中国が担う様になりつつある。わが国は、次世代シーケンサーの開発には出遅れたが、一方で、シーケンサーの技術以上に研究の質を左右するものは、サンプル調整技術と情報処理技術で、これらの点では、様々な利用方法をあみ出してきた。これらのシーケンサーを利用する技術は、研究の独創性と質そのものに影響するため、今後ますます日本として力をいれていく必要がある。

 一方で、従来の分子生物学的アプローチをとり、個々の生命現象を研究しているグループにとっては、次世代シーケンサーを用いたアプローチを取らないとその分野の競争に生き残れなくなってきている。しかし、一旦これらの技術を使おうとすると、情報処理技術などのスキルと経験が必要な大規模な解析であるだけに、一般の個人ユーザーである研究者にはこれらのシステムを使いこなすのが難しい。シーケンス拠点の大きな意義の一つとして、技術と経験のあるエキスパートたちが、一般の個人ユーザーである研究者のサポートをして、日本の研究コミュニティーの基礎体力を上げる役割が、最近クローズアップしてきた。常に新しい原理に基づく新型のシーケンサーが次々とめまぐるしく発売されている環境下で価格も高額なシーケンサーに対応するのは、一般の個人ユーザーである研究者には、極めて難しい実態がある。これらの次世代シーケンス技術を研究者がサービスという形で利用できるということも、拠点の重要な役割である。わが国のシーケンス拠点では、最新のシーケンサーを多数導入するだけではなく、独自のサンプル調整技術とバイオインフォマティックス技術を対応させ、シーケンス情報からより高次の情報を引き出すことができる解析パイプラインとして機能することが期待されている。シーケンス拠点がオミックス研究を向上させる基盤として機能するには、こうしたユーザーである研究者との連携を密に取りながら、サンプル調整からデータ解析まで一貫したプロセスを効率的に運用し、ユーザーが最も効率の良い研究戦略をとれるように配慮する必要がある。また、目の前の競争に負けない研究成果を出していくことと同時に、これからの発展を考えた上での、より革新的で基本的な原理に基づく技術開発と、その技術を育てていく努力が大切である。

文献:

  1. De Hoon, M. & Hayashizaki, Y., Biotechniques, 44: 627 (2008)
  2. Suzuki, H. et al. Net. Genet., 41: 553-562 (2009)
  3. Dekker, J. et al., Science, 295: 1306-1311 (2002)