Kyoto University 21st Century COE Program Genome Science 21世紀COEプログラム「ゲノム科学の知的情報基盤・研究拠点形成」
   ホーム   概要   組織   研究   教育   活動   アーカイブ


藤井 信孝
富岡 清
竹本 佳司
阿久津 達也
馬見塚 拓
京都大学 化学研究所
バイオインフォマティクスセンター
特任助教授

馬見塚 拓

 プロテオーム(proteome)とは、複数のタンパク質(protein)が共同で機能を発揮するような、タンパク質による生体活動の全体像を指し、ここ数年急速に浸透してきた用語である。この背景には、ポストゲノム研究において、遺伝子産物であるタンパク質さらにはタンパク質間相互作用等の全体像の研究が重要であるという認識がある。同時に、分子生物学実験の自動化により蓄積されるデータ量は増大し続けており、大量に蓄積されるデータから全体像を知るために有効な知識や情報を抽出・解析する 技術の適用と発展が待たれている。我々の目的は、このような現状に対応するための情報科学技術を提案・開発するとともに、培われた技術を 特にプロテオームデータに対して適用した生物学的知識発見から、生物学ひいては薬学・医学をはじめとする多くの関連分野に貢献することにある。 さらに強調すべき我々の特徴は、既存の情報科学技術の応用ではなく、個々の問題に即した独自技術を開発することにより、より効率の良い成果を 挙げることである。現在の研究テーマを以下3つほど取り上げる。特に、プロテオームの中でもタンパク質間相互作用やタンパク質基質間の 相互作用の解析手法の開発に注力を注いでいる。

1. 類似化合物の高速探索手法の開発
機能タンパク質は、低分子化合物(基質)と結合し化学反応を触媒する。2つの基質が類似の構造を持てば、同じタンパク質に結合する可能性等、 類似の機能を持つと類推でき、類似化合物の高速な検索は重要である。そこで、化合物を分子グラフとみなし、2つのグラフを入力し最大共通部分を 発見する、最大共通部分グラフ問題に対し、低分子化合物の特徴を利用した高速なアルゴリズムを開発している。現提案手法は、計算機科学の 観点から最も広いクラスの入力に対し高速である。

2. タンパク質間相互作用の高精度予測
 近年のハイスループット技術の進展により大量のタンパク質間相互作用データが蓄積されているが、実験誤差が多いこれらのデータに対する 高精度の予測が待たれている。この問題は、情報科学一般に共起データの問題と考えることができ、分子生物学のようなタンパク質に対する 背景知識が豊富な分野では、それら知識の活用が精度向上の重要なキーとなる。この問題に対し、背景知識を利用可能な確率モデルと そのパラメータの学習アルゴリズムを提案し、実際のデータからモデルの有効性を実証し、高精度の予測を可能にしている。

3. 糖鎖構造の高速な検索と多重アラインメント
 糖鎖は、単糖が枝分かれを持ち連結した木構造であり、タンパク質間の認識にしばしば使用される重要な分子である。木構造に対する高速な ペアワイズアライメント手法の構築とともに、共通パターンの発見や複数の木構造をアラインメントするための確率モデルおよびそのパラメータの 効率的な学習アルゴリズムを提案・実装している。本手法は、あるクラスの木に対する情報科学の観点からの新規性・一般性があり、また今後、 糖鎖生物学での知識発見への大きな寄与が期待できる。


 Fig. 1. Graphical models of (a) AM and (b) HAM,
 and (c) an example of co-occurrence events
 and their classes.


 Table 1: Common monosaccharide names,
 their abbreviations, and their symbols.

平成19年度平成18年度平成17年度平成16年度|平成15年度|
※平成17年度より「環境ゲノミクス」へ移動