「生物情報ネットワーク構造の数理モデルと情報解析」
(Mathematical models and computational analyses of biological information networks)

京都大学化学研究所
バイオインフォマティクスセンター
生物情報ネットワーク
阿久津 達也

1. 目的と背景
   タンパク質相互作用ネットワークや代謝ネットワークを始めとして様々なタイプの生物情報ネットワークがスケールフリーという共通の構造的な性質を持つと報告されている。スケールフリーネットワークとは、頂点の次数(一つの頂点に接続する辺の個数)分布がべき乗則に近似的に従うネットワークのことである。即ち、次数k の頂点の頻度をP (k )とすると、P (k )∝k となるネットワークのことである(γ はネットワークごとに定まる正定数)。しかしながら、特に生物情報ネットワークにおいて、ネットワークがスケールフリー性を持つ理由が十分に解明されていない。そこで、我々は各種の生物情報ネットワークの生成メカニズムに関する数理モデルについて研究を行い、また、KEGGデータベースなどから取得したデータを解析することにより、その妥当性の検証を行った。

2. 主要な研究成果
代謝ネットワークの二種類の表現法の変換則 [1] : 代謝ネットワークには化合物を頂点に対応させる化合物ネットワーク、酵素(化学反応)を頂点に対応させる反応ネットワークの二種類の表現法がある。この二種類のネットワークの間の関係をグラフ理論における線グラフ変換という概念を用いてモデル化し、化合物ネットワークがP (k )∝k というスケールフリー性を持つ場合に、反応ネットワークがP (k )∝k -γ+1というスケールフリー性を持つことを示した。また、KEGGデータベースから得たデータを解析することにより、定性的には同様の性質が成立することを確認した。

図1 : 化合物ネットワーク(A) から反応ネットワーク(B) へのスケールフリー性の変換規則を導いた。

タンパク質ドメインの進化モデル [2] : タンパク質配列の進化を単純化したモデルを開発した。具体的には、各タンパク質は1種類のドメインから成るものとし、以下のプロセスを繰り返すにより(同じドメインを持つものも含め)新たなタンパク質が生成されていくものとする。
 ・確率1-a で大幅な突然変異が生じ、既存のドメインと異なる全く新たなドメインからなる1種類のタンパク質が  生成される。
 ・確率a で、選ばれたタンパク質の重複が生じ、同じドメインからなる新たな1種類のタンパク質が生成される。
そして、同じドメイン構成を持つタンパク質(コピー数とよぶことにする)がk 種類であるようなドメインの頻度をPD(k )とすると、PD(k ) がPD(k ) ∝ k [-1-1/a] というスケールフリー性を持つことを示した。さらに、このドメイン進化モデルに、以下の仮定を組み合わせることにより、タンパク質相互作用ネットワークのスケールフリー性を示すことができた。
 ・2種類のドメインが相互作用するかしないかは、ランダムに等確率で定まる。
 ・含まれるドメインどうしが相互作用すれば、それらを含むタンパク質どうしも相互作用する。
さらに計算機シミュレーションを行い、次数分布をプロットした結果、理論にほぼ合致する結果を得ることができた。また、データベース中のタンパク質相互データをもとに次数分布をプロットした結果も定性的な一致を見ることができた。

バクテリアの生育温度と代謝ネットワーク構造の関係 [3] : 環境の違いによる代謝ネットワーク構造の違いを調べるために、バクテリアの生育温度により代謝ネットワーク構造のスケールフリー性などがどのように変化するかを、KEGGデータベースから取得したデータを解析することにより調べた。その結果、生育温度が下がるにつれネットワーク構造の不均一性が高まることがわかった。すなわち、生育温度が低くなるにつれ、ネットワークの構造化が進むことが判明した。

3. 考察
 一連の研究により、生物情報ネットワークの構造上の特徴に関する新たな知見を得ることができた。しかしながら、ネットワーク構造のみを対象とする研究自体は飽和しつつあり、今後はネットワークの動的挙動解析や制御が重要になってくると考えられる。そこで我々は遺伝子ネットワークを単純化したブーリアンネットワークをモデルとして、ネットワークの制御法[4]や定常状態の計算法[5]について研究を行っている。しかしながら、これらはかなり単純化された数理モデルを用いているため、実際の生体内ネットワークとのギャップが大きい。そこで今後は実際により近い数理モデルを開発し、そのモデル上での制御や動的挙動解析を行っていく必要がある。


発表論文
[1] J.C. Nacher, T. Yamada, S. Goto, M. Kanehisa and T. Akutsu,Two complementary representations of a scale-free network. Physica A , 349:349-363 (2005).
[2] J.C. Nacher, M. Hayashida and T. Akutsu, Protein domain networks: Scale-free mixing of positive and negative exponents. Physica A, 367:538-552 (2006).
[3] K. Takemoto, J.C. Nacher and T. Akutsu, Correlation between structure and temperature in prokaryotic metabolic networks. BMC Bioinformatics, in press.
[4] T. Akutsu, M. Hayashida, W-K. Ching and M.K. Ng, Control of Boolean networks: Hardness results and algorithms for tree structured networks. Journal of Theoretical Biology, 244:670-679 (2007).
[5] W-K. Ching, S-Q. Zhang, M. K. Ng and T. Akutsu, An approximation method for solving the steady-state probability distribution of probabilistic Boolean networks. Bioinformatics, 23:1511-1518 (2007).