第30回日本マイクロソフト賞採択者「ユーザビリティの高いツール開発で、 分野を超えた研究者の協働を実現する」大上 雅史さん
ヒトタンパク質の相互作用ネットワークを網羅的に予測し活用するクラウドシステム開発
【採択者】
大上 雅史 氏(東京工業大学情報理工学院情報工学系 助教)
【研究費情報】
募集テーマの詳細はこちら
がんや自己免疫疾患の治療薬としてタンパク質間相互作用を阻害する薬剤が注目されているが、創薬ターゲットとなるタンパク質やタンパク質間相互作用の探索は容易ではない。例えば、遺伝子発現解析などで疾患に関連が深いタンパク質が500種示唆されたとき、相互作用の有無を網羅的に解析するには125,250ペアの検証が必要だ。東京工業大学の大上雅史助教は、10万種あるヒトタンパク質の立体構造データを効率的に利用して相互作用を予測する新しいクラウドシステムの開発に取り組んでいる。
タンパク質間相互作用予測ソフトウェアMEGADOCK
タンパク質間相互作用を予測するため、詳細な分子シミュレーションを行う方法や、既知のタンパク質複合体構造との類似性を利用する方法などが開発されてきた。これに対して大上氏が開発した“MEGADOCK”は、タンパク質をボクセルという立体ドット絵のようなラフな構造に変換することを特徴とする。この状態で形状や物理化学的性質を関数化し、相手となるタンパク質も同様にボクセルから関数に変換する。2 つの関数どうしを平行移動して重ね合わせを行うことで、立体構造どうしがカチッとはまるかどうかを評価するのだが、このときに高速フーリエ変換を施すことで大幅に演算を削減できる。この方式により、東工大 TSUBAME スパコンの計算ノードを420基利用した計算で、100万ペアの相互作用予測を約半日で完了することができた。
誰もが使えるツールへ昇華する
実際にMEGADOCKを利用して非小細胞肺がんに関係する未知のタンパク質間相互作用を探索した結果、約370万件の計算から新たな相互作用が複数予測され,うち6ペアは実験でも相互作用が認められるという成果に繋がった。しかし、大上氏は満足していない。現状のMEGADOCKはコマンドライン(CUI)上での操作が必要であり、CUI に慣れていない生物学者にはハードルが高いのだ。これをパブリッククラウド上で直感的に動かせるフリーソフトウェアの形にして多くのユーザーに使ってもらえれば、大学のスパコンを使うよりも気軽に予測計算を進められるし、生物学者の専門的知見をもとにしたシステムへのフィードバックもかけられるはず。本当に役立つ技術とは、ユーザーが必要だと思ったとき即座に使えるものだというのが、同氏の考えだ。「誰でも、気軽に、ひらめいた瞬間にすぐに試してみることができる。そんな予測ツールを目指したい」。そう考え、今後Microsoft Azure上にシステムを構築する予定だ。
情報科学と生命科学の橋渡し役に
ユーザー視点に立ったツール開発の背景には、異分野の研究者が協働することの重要性を実感した経験がある。「例えば、予測計算でどんなに高い相互作用スコアをマークしても、細胞内局在が違っていて、実際にそのタンパク質どうしが出会わないのであれば相互作用が起きることはない。でも、そういったことは生物学の知識がないと気づけないんですね」。開発側とユーザー側両方の視点が混ざり合うことで、より深い考察が可能になる。生物学者と情報学者が専門用語や知識の垣根を超えて、真の協働を実現できるシステムを大上氏は新たに生み出そうとしている。(文・中嶋香織)