Kyoto University 21st Century COE Program Genome Science 21世紀COEプログラム「ゲノム科学の知的情報基盤・研究拠点形成」
   ホーム   概要   組織   研究   教育   活動   アーカイブ
 

「ゲノムと化合物のデータベース開発とその応用」

京都大学化学研究所
バイオインフォマティクスセンター
五斗 進

 ゲノムプロジェクトおよびポストゲノムプロジェクトの進展により、配列データ、発現データ、相互作用データなどが大量に蓄積されてきている。これらを統合的に解析するためのデータベース開発は、生命理解とともに創薬に向けた解析にも有効利用できるものとして期待されている。
 京都大学化学研究所では KEGGプロジェクトにおいて、生命システムを理解するためのデータベースを構築している。KEGGでは、ゲノム・ポストゲノムプロジェクトに関する様々な情報を統合的に扱えるようにしており、それらは大きく2種類の情報に分けることができる。一つは生命を構成する要素の情報であり、もう一つは要素間の関係である。前者の代表的なものがゲノムを始めとする遺伝子、タンパク質の情報である。KEGGでは全ゲノムが決定された生物種の遺伝子の情報をGENESデータベースとして蓄積している。また、低分子化合物や糖鎖なども生命の構成要素であり、これらの情報はそれぞれLIGANDデータベースのCOMPOUNDやGLYCANとしてデータベース化されている。後者の要素間の関係の代用的なものがタンパク質間相互作用であり、KEGGではPATHWAYデータベースでダイアグラムとして表現されている。また、配列の類似性や発現の類似性なども要素間の関係としてデータベース化できる。さらに、代謝反応は基質と生成物の関係として表現できるが、これらは糖鎖などの化合物間の関連としてLIGANDのREACTIONにデータベース化されている。
 データベースの構築それ自体重要なことであるが、さらにデータの解析をサポートするアルゴリズムを開発し、そこから新しい知見を導き出すことも重要な課題である。 KEGGではデータの統合とともにネットワークで表現されたデータを検索したり、比較したりするためのアルゴリズム開発も同時に行っており、遺伝子の機能予測などに応用している。創薬という観点からも遺伝子やタンパク質の情報と相互作用や化合物の情報を組み合わせて解析できることは重要であり、例えば、病原性細菌やヒトのゲノム情報からそれらがもつ代謝経路を再構築して比較するシステムは有用であると考えられる。現在は、このようなシステムを新規化合物の予測や新規パスウェイの予測へと拡張するために、反応の分類システムも開発している。また、糖鎖構造のデータベースであるGLYCANはGlycoinformaticsという新しい分野の情報解析技術の開発および創薬への応用に利用できると考えている。
 発表では、 KEGGの全体像を概観し、比較的最近の成果である糖鎖情報データベースや反応経路予測について紹介する予定である。