ナビゲーションをスキップ

GSCの歩み

参加登録・名簿について

情報交換、共同研究などを活性化するためにメンバーを募っております。

ご登録は事務局まで

成果と今後

タンパク質基盤研究グループ
タンパク質の構造と機能の解明から、生命システムの解明へ

横山茂之

理研横浜研究所生命分子システム基盤研究領域 領域長

2008年3月までタンパク質基盤研究グループプロジェクトディレクターと理研構造プロテオミクス研究推進本部(RSGI)研究者代表、副本部長を併任。2008年4月より現職。いち早く構造プロテオミクスの概念を提唱し、その重要性を訴え、構造プロテオミクスの新境地を切り拓いてきた。

ヒトゲノムは、遺伝子が作り出す何万種類ものタンパク質を中心に構成される高度なネットワーク・システムによって機能している。それぞれのタンパク質は、他のタンパク質や核酸、糖といった分子や、イオン、電子などと相互作用することで機能を発揮する。このとき、どのような相互作用をもつかは、タンパク質の三次元構造に委ねられている。一方、病気の解明と克服はライフサイエンスに与えられた重要な課題の1つだが、治療薬の大半はタンパク質を標的としている。そこで現在、病気に関与するタンパク質のネットワークを調べて標的タンパク質を定め、その三次元構造から医薬品の開発を進めることが期待されている。今や、タンパク質の構造と機能の研究(構造生物学・構造プロテオミクス)は、生命システムのみならず、病気のメカニズムを解明するためにも必要不可欠なのである。

基本構造をすべて調べるための組織づくり

 この10年、私たちのタンパク質基盤研究グループでは、「タンパク質の構造・機能の研究に基づいて生命システムを解明すること」および、「それらの研究成果を産業利用に役立てること」を長期的な目標として研究をおこなってきた。1998年のGSC設立当時、「タンパク質基本構造解明計画」を世界に先がけて提唱し、いち早くその準備を進めてきた。ヒトゲノムの解読完了が秒読みに入り、その遺伝子の産物であるタンパク質の研究が一気に始まることが予想されたからである。
  私たちはまず、膨大な種類のタンパク質(ヒトで約10万種類と想定される)をいかにして体系的にとらえるかを考えた。そして、多くのタンパク質が複数の機能ドメインから構成されていることに注目し、たがいに似通っているドメイン同士をまとめて「ファミリー」として分類し、その代表的な構造を探ることで、機能(分子機能)と対応させる戦略を立てた。これこそが「タンパク質基本構造解明計画」であった。

GSCが世界に誇るNMR施設

高性能NMR約40台という世界最大の集積台数を誇るGSCの大型NMR施設を駆使して、タンパク質の立体構造と機能を調べる。

その際、タンパク質の構造解析には、X線結晶構造解析とNMR解析を組み合わせることにした。X線結晶構造解析には、1997年に運転を開始した世界最高エネルギーを誇る大型放射光施設SPring-8を用い、それと対応するべく、世界初で最大のNMR施設(写真参照)を作る計画を進めた。1999年度には、理研播磨研究所において、倉光成紀教授をリーダーに私たちのグループも参加し、高度好熱菌をモデルに、そのタンパク質を体系的に構造解析する「高度好熱菌丸ごと一匹プロジェクト」をスタートさせた。
  同じころ、アメリカでも体系的なタンパク質の構造解析の必要性が提案され、国際的に協力して取り組む機運が一気に盛り上がった。結局アメリカは2000年に独自の「Protein Structure Initiative (PSI)」をスタートさせ、私たちは2001年度に、播磨研究所とともに理化学研究所構造プロテオミクス研究推進本部(RIKEN Structural Genomics/Proteomics Initiative, RSGI)を組織し、日本における構造解析の基盤組織を整えた。

国家プロジェクト「タンパク3000プロジェクト」を牽引

 国家規模のタンパク質構造解析の重要性は、結晶学会や誕生したばかりの蛋白質科学会などで真剣に議論され、2002年度に、文部科学省主導のもとで、「タンパク3000プロジェクト(2007年3月までの5年間)」が進められることになった。医学・生物学的に重要なタンパク質を大規模に解析するのが目的である。私たちもRSGIとして参加し、そのうちの「網羅的解析プログラム」を担当することになった。
  このプログラムでは、ヒト、マウス、バクテリアなどを対象に、生物学的重要性、医学的重要性、重要な疾患との関連性、産業応用上の有用性などの点で必要性の高いタンパク質を網羅的に探索し、約1万種のドメインの中から候補を幅広くとらえ、解析を進める中で絞り込むことが最優先課題とされた。その際、構造的あるいは機能的に関連するタンパク質の比較をおこなうことで、研究の効率化を図ることにした。
  はじめにモデルとした高度好熱菌は、ゲノムがコードするタンパク質の種類が約2000と少なく、生命の維持に必須な遺伝子が凝縮されて存在しているため、ヒトにまで保存された基本的な生命プロセスのメカニズム解明に役立つとともに、抗菌薬の開発などにも関連する情報が得られると思われた。さらに、高度好熱菌のタンパク質は熱に安定で、精製や結晶化が比較的容易であるなどのメリットもあった。
  RSGIでは、理研播磨研究所の倉光グループを中心にして、高度好熱菌の大半の遺伝子クローニングに成功し、つづいて、タンパク質の発現・精製・結晶化・構造解析に取り組んだ。その結果、現在までに300種類を超えるタンパク質の三次元構造を決定できた。世界の他のグループの成果とあわせると、高度好熱菌のゲノムにコードされたタンパク質の約20%の構造が明らかにされたことになる。今や原核生物の高度好熱菌は、もっともタンパク質構造研究が進んだ生物種となった。この他、私たちは、真核生物の原型ともいえる古細菌についても取り組んだ。

タンパク3000で構築した立体構造解析パイプラインと、それを支えた技術
タンパク質試料調製から構造解析までの一連の流れを高度化・自動化・高速化したパイプラインで、さらなる技術開発を継続的におこなっている。

つづいて、ヒトとマウスのタンパク質も

X線結晶構造解析装置とタンパク質結晶

結晶化したタンパク質のX線回折データを解析装置で測定し、タンパク質の立体構造を導き出す。

 ヒトとマウスについては、完全長cDNAライブラリーを用いる体制を作り、疾病関連タンパク質の機能ドメインや、創薬ターゲットなどを含めて、多種類のタンパク質について解析を進め、約1500種のドメイン構造を決定した。同時に、そのための試料調製から三次元構造決定の計算まで、各ステップの半自動化と全体のパイプライン化を進めた(上図)。解析のための試料調製には、生細胞を用いた発現系に加えて、無細胞タンパク質合成系を用いることで、ハイスループットな試料調製を可能にした。つづいて、得られた試料のなかから発現レベルや性質の良好なものを高効率でスクリーニングし、NMR解析用には安定同位体標識試料*1を作製し、結晶解析用にはMAD法*2のためのセレノメチオニンを導入した試料を作製した。
  こうしてプロジェクト終了までの5年間で、X線結晶構造解析によって1333種のドメイン構造を、NMR解析によって1342種の構造を決定し、合計で2675構造となり、RSGIの目標である2500構造を超えることができた。中でも無細胞系タンパク質合成とNMR解析の併用によって、1300を超える構造解析に成功したことは、構造解析の新たなスタンダードを打ち立てたともいえる快挙で、特筆に値するものであろう。具体例をあげると、ヒト細胞のシグナル伝達、転写制御などの重要な機能を担う機能ドメインのファミリーについて、体系的な構造情報を構築できた(下図)。
  さらにX線結晶構造解析により、複数の機能ドメインが協力して機能を発現するしくみについても多くの知見を得ることができた。とくに、ヒトやマウスの細胞におけるシグナル伝達のパスウェイを担うタンパク質群や、遺伝情報の伝達の流れを支えるRNAポリメラーゼ、リボソーム、さまざまなタンパク質因子、 酵素などの構造と機能について、大きな成果が得られた(ページ最後の図)。
  今後は、基本的な生命現象や、さまざまな病気にかかわるタンパク質のシステムについても、これまでのような体系的な戦略を基盤としつつ、複数のドメインをもつタンパク質(マルチドメインタンパク質)の相互作用ネットワークを視野に入れた解析をおこない、システム全体の作用機序を立体構造に基づいて解明する方向に進んでいきたい。

*1 安定同位体標識試料
タンパク質をNMR法で解析する場合、天然の存在比が多い12C,14Nの代わりに、NMR法で観測が可能な安定同位体である13C、15Nを取り込ませた試料を作製する。

*2 MAD法
多波長異常分散(MAD)法とは波長変更可能な放射光を利用してセレンなどでラベルしたタンパク質の結晶構造解析をおこなう手法である。

構造を解明したドメインの数々
細胞内外のさまざまな機能を持つドメインについて解析した。

同時並行して、多くの画期的技術を開発

 「研究の壁」を克服するための技術開発・高度化も非常に重要である。私たちは、タンパク質発現・精製の自動化、高難度タンパク質(とくに創薬ターゲットとして重要な膜タンパク質など)の調製への対応、X線結晶構造解析の技術開発(結晶作製とその観察の自動操作システムロボット開発など)、NMR技術開発(高磁場化、高感度化、測定・構造計算の自動化のためのソフトウエアの開発)などにおいて、多くの画期的な技術を開発した。
  これらの技術開発においては、実際の構造解析中に検証を進め、さらなる開発にフィードバックされることを重要なポイントとした。高度な技術を最適化して組み込んだ解析パイプラインを作り上げることで、構造に基づくタンパク質の体系的な研究において爆発的に増大すると思われる構造解析のニーズに対応することが可能になり、将来は、必ずしも構造解析の専門家でなくとも構造情報を得ることができるようにもなると思われる。こうして、ライフサイエンス研究における新たなスタンダードが確立していくことになるが、実際に私たちはNMRによる構造解析パイプラインを大型共用施設として外部研究者に提供することにし、2007年度から運用を始めている。
  さらに、解析したタンパク質構造の産業への成果移転もめざしてきた。構造を用いてバーチャル・スクリーニング(計算機の中で低分子化合物をあてはめ、タンパク質の働きを制御する化合物をみつけだす)をおこない、相互作用しうるリード化合物を探し、その効果を実験によって確認するプロセスである。私たちのグループは、とくに抗ウイルス剤や抗がん剤としての応用をめざし、ウイルスやがん細胞の増殖に必須のタンパク質を対象にしてきた。
  GSCがスタートした当初は、このような構造ベースの薬剤開発は、夢物語でしかなかったが、この10年の間に現実のものとなろうとしている。薬剤としての最適化や実用化のためには、製薬企業など産業界との緊密な連携体制が必須で、企業のニーズに基づく共同研究に加えて、タンパク3000の成果を活用するための新たなプログラム「新規プロテオーム創薬共同研究制度(パートナー制度)」も立ち上げられている。
  創薬への応用を進める一方で、得られたリード化合物を阻害剤として用いることでタンパク質ネットワークの解析(ケミカル・プロテオミクス)もおこない、その成果を創薬にもフィードバックして活用したいと考えている。

タンパク質のライフサイクルにかかわるタンパク質群

ゲノムにコードされたタンパク質の構造や機能の網羅的解明の推進は、タンパク質によって構成されるネットワークシステム(たとえば遺伝子の情報発現システム)としての生物機能のさらなる理解へとつながる。

【図中のPDB ID】
  • 1J1V → DnaA
  • 1UFI → CENP-B
  • 1HLV → CENP-B/DNA複合体
  • 1IU3 → SeqA/DNA複合体
  • 1V5W → Dmc1
  • 1KN0 → Rad52
  • 1UI0 → ウラシルDNAグリコシラーゼ/ウラシル複合体
  • 1IW7 → RNAポリメラーゼホロ酵素
  • 1H38 → T7 RNAポリメラーゼ
  • 1SMY → RNAポリメラーゼ/ppGpp複合体
  • 1TJL → DksA
  • 1VS3 → tRNA シュードウリジン合成酵素
  • 1UDN → RNasePH
  • 1VDX → 2,-5,RNAリガーゼ
  • 1UEU → CCA付加酵素
  • 1J2B → ArcTGT
  • 1V2X → SpoU
  • 1WW1 → tRNase Z
  • 1WWR → TadA
  • 2CX5 → 転写調節因子
  • 1UDZ → IleRS CP1ドメイン
  • 1WKA → ValRS CP1ドメイン
  • 1ULH → TrpRS
  • 2CXI → PheRS
  • 1V4P → AlaRS
  • 1X56 → AsnRS
  • 1WWT → ThrRS TGSドメイン
  • 1X59 → HisRS WHEP-TRSドメイン
  • 2CYA → yrRS
  • 2CYC → TyrRS
  • 1VBM → TyrRS/Tyr-AMS複合体
  • 1J1U → TyrRS/tRNATyr/L-Tyr複合体
  • 1VBQ → CysRS
  • 1WZ2 → LeuRS/tRNALeu複合体
  • 2BTE → LeuRS/tRNALeu複合体
  • 1IYW → ValRS
  • 1IVS → ValRS/tRNAVal/Val-AMS複合体
  • 1A8H → MetRS
  • 2CSX → MetRS/tRNAMet複合体
  • 2CT8 → MetRS/tRNAMet/MetSA複合体
  • 2CV0 → GluRS/tRNAGlu/ATP/L-Glu複合体
  • 2DB3 → Vasa/RNA/ATPアナログ複合体
  • 2DYI → RimM 1WF3:ERA
  • 1V8Q → L27
  • 1UEB → EF-P
  • 1UFK → PrmA
  • 1WDT → EF-G-2
  • 1HZD → AUH
  • 2CSL → YabJ
  • 2CWJ → エンドリボヌクレアーゼ
  • 2CZJ → smpB/RNA複合体