English version
研究室紹介
本研究室では、計算生物学(バイオインフォマティクス)におけるアルゴリズムの研究を行っています。
分子生物学や医学、薬学、といった分野では、近年様々な実験技術の発達により、非常に多岐にわたる様々なデータが指数関数的な速度で蓄積されています。特にDNA解析技術、タンパク質立体構造解析技術の発達などは特筆するべきものがあります。一般的にバイオインフォマティクスあるいは計算生物学とよばれている分野は、そういった膨大なデータを計算機を用いて解析する研究分野のことをいいます。本研究室では、それらのデータをただ解析する、というだけでなく、そのための計算アルゴリズムを理論・実践両面から広く・深く(!)研究を行うことによって、この分野に新しいアプローチを提供して革新をもたらすことをめざして研究を行っています。また、当然ながら本研究室では、それらに関連した情報科学技術そのものの研究も行っています。また、本研究室では、ヒトゲノム解析センターの誇るスパコンを駆使した研究も行っています。
本研究室のより具体的な研究テーマとしては以下のようなテーマがあります。
- 計算生物学におけるアルゴリズムの研究
- 塩基配列比較・検索アルゴリズムの研究
- DNAやタンパク質といった生物における重要な分子は、1本鎖であるため、文字列として表現することができ、比較的容易に計算機で扱うことが可能です。それらをいかに比較し、検索するか、という研究を様々な観点から行っています。この分野は古くて新しい分野であり、近年、実験技術(特にSolid,
Solexaといった次世代DNAシーケンサーなど)に非常に大きな進展があり、きわめてホットな話題となっていますが、情報科学的にも著しい発展のある分野で(接尾辞配列の研究など)、情報科学の研究分野としても非常に脚光を浴びています。
- タンパク質立体構造比較・検索アルゴリズムの研究
- 近年、タンパク質の立体構造解析が急速に進んでいます。本研究室では、それら立体構造に対しても比較・類似検索アルゴリズムの研究を行っています。この分野は、文字列の比較・検索と異なり、まだまだ基本的技術すら確立されていない分野であり、チャレンジングな分野です。
- タンパク質機能予測
- 本研究室で開発したタンパク質立体構造比較・検索アルゴリズムをさらに応用し、タンパク質機能解析アルゴリズムの研究を行っています。
- 遺伝子多型解析
- 個人間でゲノムがどのように変わっているか、そしてそれがどのような形質につながっているか、という研究は、ポストゲノム時代のゲノム研究の最も重要な研究分野のひとつです。本研究室では、そのようなデータ(一塩基多型データ)に対する解析アルゴリズムの研究も行っています。
- パスウェイ解析
- パスウェイは、生体分子間の反応経路を表したもので、グラフとして表すことができ、それらを扱うには、さまざまなグラフアルゴリズムが必要とされます。
- RNA二次構造比較・検索アルゴリズム
- RNA干渉など、小さなRNAが注目されています。本研究室では、それらのRNAの構造に関しても、比較・検索アルゴリズムを研究しています。
- 遺伝子予測アルゴリズム
- DNA上のどの領域が遺伝子か、というのは、バイオインフォマティクスにおける重要なテーマです。近年、小さなnon
coding 遺伝子が注目され、再び遺伝子予測の技術が脚光を浴びるようになりました。
- その他、バイオインフォマティクスにおけるアルゴリズムのあらゆる研究
- 関連した情報科学の研究
- 組み合わせパタンマッチング・アルゴリズム
- 塩基配列や立体構造等の比較・検索技術は、情報科学における「組み合わせパタンマッチング」とよばれる分野と密接に関連しています。本研究室では、データ索引構造の研究をはじめとして、さまざまな組み合わせパタンマッチングアルゴリズムの研究をを行っています。
- データ検索アルゴリズム
- 塩基、タンパク質構造に限らず、この分野にはマイクロアレイ、RNA構造、NMRデータ等様々な複雑なデータからなるデータベースがあり、それらにおいても検索アルゴリズムの研究は重要です。
- データ圧縮アルゴリズム
- 生物学・医学分野のデータベースはいずれも膨大なデータを持っており、それらは年々指数関数的に増大しており、それらをコンパクトに管理できる技術が求められています。
- 学習アルゴリズム
- 遺伝子予測や遺伝子多型解析や、その他様々なバイオインフォマティクスに出てくる多くの問題で、学習アルゴリズムが必要になってきています。本研究室では、サポートベクタマシンを用いてのタンパク質機能解析や、SNPからの形質予測などを行っています。
- グラフアルゴリズム
- バイオインフォマティクスでは、グラフ上の問題に帰着される問題が数多くあります。たとえば、配列比較アルゴリズムであるアラインメントのアルゴリズムは、グラフ上の最短路アルゴリズムですし、また、生体分子構造や、分子間の関係など、生物学にはグラフであらわされる対象が非常に多くあるため、それらの解析にはグラフに関する深い知識が必要とされます。
- 計算量理論
- バイオインフォマティクスに限らず、アルゴリズムの研究一般に言えることですが、今開発しているアルゴリズムの計算量などについてはもちろんのこと、扱っている問題がどういったクラスに属するのか、といったことも深く吟味しながら研究を深めていく必要があります。また、当研究室では、特にSMADというアルゴリズム設計パラダイムに関する研究を行っています。
- その他離散数学・アルゴリズムの研究
研究室メンバー
- スタッフ
- 学生
- Sahli Mohammed (D3)
- 橋本 篤志 (D2)
- 大賀 裕之 (M2)
- 小野寺 拓 (M2)
- Chen Jing (M2)
- 大槻 知彦 (M1)
- 卒業生 (在籍年・進路)
- 何 力 (2010-2012・UBS証券)
- 平塚 秀晴 (2009-2012)
- 小貫 律子 (2005-2011・農業生物資源研究所)
- Micheal Wilson (2010-2011・Royal Bank of Scotland)
- 八森 勉 (2007-2009・富士通)
- 末松 宏一 (2005-2008・Google)
- 朱 家漢 (2007・清華大学)
- 坂井 比呂樹 (2004-2006・トーマツコンサルティング)
本研究室で開発しているソフトウェア・プロジェクト
一緒に研究をしたい、という方へ
本研究室は、東京大学 医科学研究所 ヒトゲノム解析センター シークエンスデータ情報処理分野(分野長:宮野悟教授)に属しており、同大学理学部 情報科学科から学部4年(冬学期)の卒業研究配属の方を、同大学大学院情報理工学系研究科 コンピュータ科学専攻から修士課程および博士課程の方を受け入れています。本研究室の研究に興味がありましたら、いつでもお気軽にコンタクトください。また、企業の方などで、社会人博士課程や共同研究等を希望される方もお気軽にご相談ください。
アクセス
研究室は東大白金台キャンパスにあり、六本木ヒルズや東京タワーなどの夜景がとてもきれいです。
- 住所
- 〒108-8639 東京都港区白金台4-6-1 東京大学医科学研究所ヒトゲノム解析センター シークエンスデータ情報処理分野
- アクセス (キャンパスマップ中の[2]の建物(4階建て)の4階に研究室はあります。ご訪問の際は、玄関の内線電話にて内線75791(渋谷)までお電話ください))
- 連絡先
- 03-5449-5791(准教授室)・ 03-5449-5793 (学生室) / 03-5449-5790 (FAX)
- 03-5449-5615(シークエンスデータ情報処理分野・DNA情報解析分野共通秘書室)
Copyright (c) 2008- Shibuya Lab.. All rights reserved.