Kyoto University 21st Century COE Program Genome Science 21世紀COEプログラム「ゲノム科学の知的情報基盤・研究拠点形成」
   ホーム   概要   組織   研究   教育   活動   アーカイブ


辻本 豪三
乾 賢一
金子 周司
五斗 進
京都大学 化学研究所
バイオインフォマティクスセンター
助教授

五斗  進

薬理ゲノミクスのための化合物データベースの開発
 ゲノムプロジェクトおよびポストゲノムプロジェクトの進展により、配列データ、発現データ、相互作用データなどが大量に蓄積されてきている。また、化合物の情報も データベース化されているが、これらをゲノム情報と組み合わせて統合的に解析するためのデータベース開発はこれからの課題で あり、生命理解とともに創薬に向けた解析にも 有効利用できるものとして期待されている。
 我々は、ゲノム情報と組み合わせて解析できる化合物情報データベースの開発を目指して、京都大学化学研究所で進めているKEGGプロジェクトにおいて、LIGANDデータベースを 構築している。LIGANDデータベースはCOMPOUND, GLYCAN, REACTION, ENZYMEの4つのセクションからなり、それぞれ化合物、糖鎖構造、化学反応、酵素の情報をデータベース化 したものである。本研究では、COEプロジェクト関係者を中心にGlycoinformaticsグループを立ち上げ、GLYCANデータベースの設計からデータの入力まで進めている。 従来の糖鎖構造データベースとしてCarbBankがあるが、現在は更新されていない。我々はCarbBankの活動を引き継ぐ形でGLYCANを立ち上げたが、CarbBankとGLYCANにはいくつかの 大きな違いがある。その一つは、CarbBankが文献ベースのデータベースであるのに対して、GLYCANが構造ベースのデータベースであることである。これにより、構造検索など構造に 基づく解析が容易になる。また、構造入力用のツールも作成している(図1)。もう一つの特徴は、図2に示すGLYCANエントリーのように、ゲノム情報に関するデータへのリンクを 充実させていることである。特に、KEGGのデータベース群に組み込むことにより、KEGGとゲノムネットでサービスされているデータベースに含まれる様々な情報と組み合わせて 解析できるようになる。例えば、類似した酵素反応やタンパク質の基質となるような糖鎖構造を集めてきてそれらが認識する共通部分構造を抽出するといったことが考えられる。 本研究では、COMPOUNDも含めて化合物、糖鎖構造のデータベースを充実化させるとともに、創薬に向けた解析へと応用することを目的とする。

図1:糖鎖構造入力ツール

図2: GLYCANデータベースのエントリーの例