ナビゲーションをスキップ

GSCの歩み

参加登録・名簿について

情報交換、共同研究などを活性化するためにメンバーを募っております。

ご登録は事務局まで

成果と今後

ゲノム構造情報研究グループ(1998.10〜2004.3)
ヒトゲノム計画を成功に導き、培った技術を多様な生物のゲノム解析に生かす

榊 佳之

国立大学法人 豊橋技術科学大学
学長

ゲノム構造情報研究グループプロジェクトディレクターを務めたのち、2005年4月から2008年3月までGSCセンター長、システム情報生物学研究グループのプロジェクトディレクターおよびゲノム基盤施設の施設長を併任。ヒトゲノム計画の日本の代表、 HUGO(国際ヒトゲノム機構)会長を務める。和田前センター所長が提唱した「オミックスペース」を基本コンセプトに、日本のゲノム科学のさらなる発展に 寄与している。

DNA二重らせん構造の解明以降、そこに書き込まれた情報(ゲノム)の解読は、生命科学の中心的なテーマになった。研究の過程では分子生物学を駆使した技術が登場し、とくに遺伝子組換え技術とDNAシーケンス技術は、ゲノム解読に革命的な変化をもたらした。この流れは「和田プロジェクト」に代表されるDNAの自動シーケンサーの開発へとつながり、ヒトゲノム計画を生み出すに至った。ヒトゲノムの全解読には強力かつ高精度な配列決定能が必要とされ、アメリカとイギリスは1990年代に相次いで大型のシーケンスセンターを設立した。一方、日本は1995年に始まったJICST(日本科学技術情報センター)によるヒトゲノム情報整備プログラムで解読が始まったものの、米英よりもはるかに小規模で、ゲノム科学における国際的な発言力を維持するためにも大型シーケンスセンターが必要だった。このような背景の下、理研GSCが開設され、旧ゲノム構造情報研究グループの活動がスタートした。

10年を振り返って

 旧ゲノム構造情報研究グループの10年間の最大の成果は、いうまでもなく、ヒトゲノムの全解読である。GSCは日米英仏独中からなる6カ国の国際チームにおいて日本を代表し、21番および11番染色体解読の中核機関、さらに18番染色体のサブ機関として、その存在を世界に示した。
ヒトゲノムの解読は人類が自らの遺伝設計図を手にしたという歴史的意義だけでなく、疾病の研究や、ヒトの進化・多様性の研究を一変させた。それまでの生命科学は、個々の遺伝子のはたらきを調べ、部分的な成果から全体を推し量る帰納的方法論しかとれなかったが、そこに、全遺伝子や全SNPsなどの全体情報をベースにして部分や細部を解明する演繹的方法論を確立した。
さらに、ヒトとチンパンジーの比較ゲノム解析は、ヒトの進化だけでなく、ヒトらしさの遺伝的背景を解明するために必須のステップだが、GSCは2000年に国立遺伝学研究所とともに国際ワークショップを開催し、その活動を軸に、世界初のヒトとチンパンジーの比較ゲノム地図(2002年Science)や、ヒト21番染色体ゲノムとの詳細な比較解析(2004年Nature)などを世界に先がけておこなってきた。こうした動きは、アメリカのチンパンンジーゲノムドラフト配列決定プロジェクトを開始させる動機にもつながった。現在もヒトの遺伝的特性の解明をめざす研究は、ゲノムをベースに着実に進みつつある。
2004年、旧ゲノム構造情報研究グループは、ゲノム基盤施設とシステム情報生物学研究グループの一部に分かれたが、これらの2つのグループに分れた後の活動も含め、この10年の軌跡を振り返りたい。

ヒトゲノム計画は、アメリカを中心に、イギリス、日本、フランス、ドイツの協力と連携のもとに1990年から開始された。最初の段階であるヒトゲノム地図が完成すると、1990年代半ばから配列決定のフェーズに入った。1996年のバミューダ会議では、各国が領域を分担して全解読をめざすことになり、日本は、榊佳之プロジェクトリーダーを中心に組織された「21番染色体解読国際コンソーシアム」を核に、21番染色体を担当することになった(後の会議で11番染色体の主担当、18番染色体の副担当ともなった)。右の表紙は21番染色体の解読成果を発表した2000年5月18日刊行のNatureの表紙である。

1. 世界トップクラスのシーケンスデータ生産ラインの構築

 グループ最初の、そして最重要の課題は、ゲノム解析のパイプラインを構築することだった。単にシーケンサーを並べるだけでなく、「ヒトゲノム解析に必要なリソース(BACライブラリー、BACクローン整列地図など)の整備」、「配列データ生産ラインの整備」、「産出されたデータを編集・統合して配列データとして完成させるとともに、基礎的な情報づけ(アノテーション)をおこなうインフォマティクス基盤」の3つの部門を一体化して整備することが必要であった。
幸い、JICSTプロジェクト時代からの実績をもとに、藤山秋佐夫(現 国立情報学研究所教授)、服部正平(現 東京大学教授)、矢田哲士(現 京都大学助教授)という3人の優れたチームリーダーと、意欲ある40名ほどのスタッフを得ることができ、1999年の夏には年間1億塩基を読める世界トップクラスのパイプラインが整った。
ヒトゲノム解読終了後は、このラインは林崎グループのcDNA配列決定ラインと統合し、ゲノム基盤施設のシーケンス技術チームとして、豊田敦上級研究員を中心に、センター内外からの要望に応えてさまざまな生物種のゲノムやcDNA配列解析をおこなっている。

2. 21番染色体の全解読

 21番染色体の解読は、理研GSCのプレゼンスを世界に示した最初の大きな成果である。1994年の榊とデビッド・パターソン(アメリカ)の呼びかけでできた21番染色体解読国際コンソーシアムは、1996年のバミューダ会議の後、日独を中心に本格的な活動を開始した。ところが、日独ともにシーケンス解析ラインのパワーに限界があり、その歩みはゆっくりとしたものであった。
そこへGSCが設立され、理研グループのパワーが飛躍的に上昇したことにより、GSC主導で大きく進展し、1999年末にはほぼデータ生産を完了。2000年5月8日には完成論文としてNature誌に発表した。イギリスのサンガーセンターを中心とした22番染色体につぐ染色体の全解読となったが、21番染色体は、新生児の病気としてもっとも頻度の高いダウン症の原因染色体やアルツハイマー病原因遺伝子の存在する染色体として、社会的にも大きな関心が示された。
論文では98個の新規遺伝子を含む225個のタンパク質をコードする遺伝子の存在を明らかにし、さらに、遺伝子分布には大きな偏りがあり、タンパク質をコードする遺伝子がほとんど存在しない「遺伝子砂漠」の存在も明らかにした。また、22番染色体のデータと合わせて、ヒトゲノムの全遺伝子数がそれまでにいわれていた10万ではなく、4万かそれ以下であるとの推定を初めて示し、学界に大きな議論を引き起こした。

Nature(2000年5月18日号)で発表されたヒト21番染色体のダウン症必須領域およびそれに対応するマウスゲノムのゲノム地図

ヒト21番染色体は新生児の疾患としてはもっとも頻度の高いダウン症の原因染色体である。21番染色体の解読により、ダウン症必須領域に11個の遺伝子の存在が明らかとなった(上段)。これらの遺伝子の過剰発現が精神遅滞などのダウン症の症状と関係していると考えられる。またマウスゲノムの対応領域の配列(下段)を決定し比較検討したところ、10個の遺伝子はマウスゲノムでもよく保存されていたが、1つの遺伝子DSCR9はヒトにのみ存在していた。

3. ヒトゲノムドラフト配列の決定

 ヒトゲノムのドラフト配列の決定は、ヒトゲノムの全体像を初めて明らかにした生命科学史上の重要な成果である。ヒトゲノム解読の国際チームは、医学、生命科学研究の最重要基盤となるヒトゲノムの配列を最高精度で決定し、誰にでも無償で制約なく提供することを基本としてきた。新しい研究基盤を構築することで、医学、生命科学の飛躍的な発展を促すことに力点をおいたのである。
しかし、1998年にマルチキャピラリー型シーケンサーが市場投入されたことを受けて設立されたセレラジェノミクス社は、全ゲノムショットガン方式で粗い精度でもヒトゲノム全体をとりあえず読んでドラフト配列を得て、創薬などに結びつく遺伝子の権利化を図る戦略を取ったために、国際チームと競合することになった。1999年5月、国際チームは高精度解読を一時的に停止し、ドラフト配列の決定を中間目標に据えて進めることにした。以来一年余り、GSCも国際チームの一員としてドラフト配列決定に大きな力を割いた。
その結果、国際チームは2000年6月にドラフト配列決定を終了し、2001年に2月に成果を論文にまとめ、Nature誌に発表した。データの精度の上では問題が残ったが、この論文はヒトゲノムの全体像を初めて明らかにした論文であり、X線の発見などと並んでNature誌が選んだ25の歴史的論文の1つとなった。GSCのゲノム解読チームはヒトゲノム計画に参画した20のセンターのうち、イギリスのサンガーセンター、アメリカの4つのセンターにつぐ6番目に貢献度の高いセンターとなった。論文では、3万〜4万の遺伝子を予測し、ヒト遺伝子の全体構成を初めて明らかにするとともに、ヒトゲノムの45%がAlu配列やL1配列などの繰り返し配列であることなどを初めて示した。

* ゲノムDNAを適当な長さに断片化し、各断片を直接、装置で解読し、コンピューターを使ってパズルのようにつなぎあわせる手法。

4. ヒトゲノムの全解読

 ヒトゲノムの全解読はヒトゲノムの全解読をめざした国際ヒトゲノム計画の最終的成果として、科学史に記されるものである。国際チームは、ドラフト配列決定の後も当初の目標である最高の精度でヒトゲノム配列を決定する努力をつづけ、2003年4月に解読完了を宣言した。プロジェクトに参加した6カ国首脳による国際共同宣言では、以下のように述べられた。「……今日、われわれは、地球上のすべての人々がより健康でいられる未来を建設するための重要な一歩を踏み出した。そのためにヒトゲノムは人類共通の財産として役立つこととなる。われわれは、創造力と献身をもってこのプロジェクトに参加したすべての人々を祝福する。彼らの卓越した業績は、科学技術のみならず、人類の歴史においても画期的な偉業として刻まれることだろう……」
日本では、解読完了宣言をおこなった2003年4月14日に、GSCの榊が慶應大の清水信義、東海大の猪子英俊、国立遺伝学研究所の菅原秀明の各氏とともに、小泉純一郎首相(当時)を訪ね、完了を報告し、全データを収録した24枚のCD-ROMセットを贈った。全解読の科学的成果は2004年10月刊行のNature誌において、全体の総括論文、および、各染色体ごとに中心となったセンターによってめとめられたものが発表された。
全体論文では、ヒトのタンパク質をコードする遺伝子が全部で2万2000個あまりであったことを述べたほか、多数の部分重複領域をみつけたことなど、ドラフト論文での解析が不十分な部分を明確にした。一方、染色体ごとの解読では、GSCは全24本の染色体のうち、先に述べた21番染色体についで、11番染色体の全解読の中核センターを、さらに18番染色体全解読のサブセンターを務めた。11番染色体の論文はチームリーダーのトッド・テイラーが中心になって2006年3月のNature誌で発表した。

5. チンパンジーとの比較ゲノム解析

 ヒトゲノム解読後の重要課題は、そこに書き込まれた情報の意味付けである。ヒトゲノムにはヒトを特色付ける遺伝情報が書き込まれている。それを読み解くのは容易ではないが、われわれは、他の生物のゲノムとの比較解析から、ヒトゲノムの特質を明らかにできると考え、多様な生物ゲノムの解析を進めている。
とくに、ヒトともっとも近縁のチンパンジーとのゲノムの比較解析から対象にすべき配列を絞り込めると考え、2000年にチンパンジーゲノムの配列決定に着手した。まず、チンパンジーゲノムDNAの断片を人工染色体BACに導入してクローン化したライブラリーを作成。つづいて、各断片の末端配列を決定し、ヒトゲノムの相同領域に対応させ、比較地図を作成した。その結果、チンパンジーゲノムDNA断片を、ヒトゲノムの全体において70%以上の領域で正確にマップすることができた。こうした領域では、繰り返し配列などによる技術的に対応不能のケースを想定すると、90%以上の領域で高い相同性を示すと推定された。こうして、ヒトとチンパンジーゲノムの世界初の比較DNA地図が完成し、正確に対応させることのできた領域での両者の配列のちがいが1.23%であることを突き止めた。論文は2002年1月のScienceに発表した。
さらに、ヒト21番染色体に対応するチンパンジー22番染色体について高精度のシーケンスによる比較もおこなった。GSCはヒト21番線染色体解読で協力したドイツのグループのほか、韓国、中国、台湾のグループを招待し、国際コンソーシアムとして解析を進め、渡邊日出海(現 北海道大学教授)を中心にまとめた論文を、2004年5月のNatureに発表した。ここでは、両者には予想をこえる高精度の欠失・挿入があること、レトロトランスポゾンの活発な転移がおこっていたこと、2〜3%の遺伝子は進化速度が著しく速いことなどを明らかにした。
さらに、黒木陽子研究員を中心に、男性(オス)にだけ伝わるY染色体についてチンパンジーの配列を決定した。Y染色体は、生物の進化を知る上で他の染色体にない情報を提供するユニークな染色体だが、ヒトとチンパンジーのY染色体の比較によって、両者の共通の祖先型Y染色体の構造の推定に成功した(Nature Genetics 2006)。

ヒトとチンパンジーY染色体の比較

(a) 祖先型性染色体(ヒトX染色体)

(b) 祖先型Y染色体

(c) ヒトY染色体

(d) チンパンジーY染色体

哺乳類のX染色体とY染色体は、かつて一対の相同染色体であったと考えられている。ゲノム構造がY染色体より保存されている現在のヒトX染色体(a)をもとに、ヒトとチンパンジーの分岐前の祖先型Y染色体(b)を再構築し、ヒトとチンパンジーのY染色体(c,d)それぞれについて比較解析をおこなった。解析の結果、チンパンジーのY染色体は、ヒトに比べて進化速度が早いことを明らかにした。図中で同一の数字と色で示した三角は、それぞれの染色体で相同な領域を示している。

6. メタゲノム解析、 新しい挑戦

 ゲノム解析では一定量のDNAを必要とするため、十分な量のDNAが得られない培養のむずかしい微生物のゲノム解析は困難と考えられてきた。ところが、2000年、私たちは東京大学理学部の重信秀治、石川統両名と協力し、「アブラムシ(昆虫)の腸内のみに生息し、実験室内で培養不能の共生細菌ブフネラ」を、アブラムシの腸内から顕微鏡下で単離・収集し、ゲノム解析することに成功した(Nature 2000)。
最近は、DNAシーケンサーの技術の進歩が著しく、またゲノム情報処理技術が進歩していることもあり、自然界の細菌(集団)のゲノムDNAを、培養せずに直接抽出・解析する「メタゲノム解析」が可能となりつつある。私たちは、ヒト腸内細菌を対象にこの手法を用いて、ヒト腸内から多数の新種を含む600種近い菌を同定した。今後は、免疫応答や肥満との関係など、腸内細菌群と健康との関連について研究を展開したいと考えている。またこの研究の発展の鍵は、情報解析にある。今後は計算生物学との融合のもとで、 発展を期したい。

GSCで比較解析を進めている多様な生物