世界のPDBデータの4分の1相当 5万件に到達!
大阪大学が世界の蛋白質構造データバンク(PDB)を運営して20年
研究成果のポイント
- 世界に一つの蛋白質構造データバンク(PDB)を運営する国際プロジェクト「国際蛋白質構造データバンク(worldwide Protein Data Bank:wwPDB)」が設立20周年を迎える
- wwPDBの設立メンバーである大阪大学蛋白質研究所の日本蛋白質構造データバンク(Protein Data Bank Japan:PDBj)が、23年かけて処理したデータ件数が世界全データの約4分の1に相当する5万件に到達。
- 新薬開発や産業応用に欠かせない基本的な情報基盤である蛋白質構造データベースの拠点が国内にある利点を活かして、信頼性の高い情報を日本語で発信することで中等・高等教育にも貢献。
概要
大阪大学蛋白質研究所(以下、大阪大学)の日本蛋白質構造データバンク(Protein Data Bank Japan :PDBj代表 栗栖源嗣教授)では、アジア地区で解析された全てのタンパク質構造情報をアジアの代表機関として蛋白質構造データバンク(Protein Data Bank: PDB)に登録してきました。国際的なデータ処理基準を共有して、欧米の2拠点で編集したデータと相互にデータを事前交換することで日米欧ともに完全に同じデータとして毎週水曜日(日本時間9:00am)に最新エントリーが更新されます。
大阪大学でのタンパク質構造データの登録活動は2000年に始まりました。欧米拠点と共同で2003年に「国際蛋白質構造データバンク(worldwide Protein Data Bank: wwPDB)」プロジェクトを立ち上げました(図1)。この国際プロジェクトの合意の下で、世界で1つのデータバンクとして共同運営する体制が構築されました。国際プロジェクトwwPDBが設立されて20年の記念の年に大阪大学でデータ登録されたデータ件数の合数が全世界の約4分の1に相当する5万件に到達し、二重の意味で節目の年を迎えました。
図1. wwPDBのホームページ(https://wwpdb.org)
このページに記載のあるRCSB PDB(米国)とPDBe(英国)およびPDBj(日本)の三拠点がwwPDBの設立メンバー。
研究の背景
蛋白質構造データバンク(Protein Data Bank:PDB)は実験的に決定した生体高分子の3次元構造を保存する世界で唯一のデータベースです。世界中で毎日200万件以上がダウンロードされ、基礎研究から創薬などの応用まで幅広い研究に活用されています。大阪大学蛋白質研究所の日本蛋白質構造データバンク(Protein Data Bank Japan: PDBj)を含む日米欧の地域拠点が、国際蛋白質構造データバンク(worldwide Protein Data Bank:wwPDB)という国際プロジェクトを組織して共同で登録・維持・管理しています。PDBjはwwPDBの設立メンバーであり、20年以上にわたりアジア・中東地区からのデータ処理・登録を担当して、全てのPDBデータを大阪大学から世界に発信(https://pdbj.org)しています。
図2. PDBの登録地域分担を示す地図(左)と各拠点による処理件数の推移(右)
米国はラトガース大学とカリフォルニア大学サンディエゴ校の共同研究チーム(RCSB PDB),欧州はイギリスにある欧州生物情報科学研究所(EMBL-EBI)が拠点となっています。アジアは,大阪大学蛋白質研究所 のPDBjが20年以上に渡り登録拠点として活動しています。今年4月に大阪大学での処理件数の累計(橙色)が全体の4分の1に相当する5万件に到達しました。
世界中の研究者が構造解析したタンパク質の構造情報は、研究者の所属する国で自動的に日米欧のいずれかのサイトに割り振られて事前にデータ登録される約束になっています(図2左)。登録されたデータは、PDBの各地域拠点で専門家による編集・検証が行われます。通常、編集・検証済みのPDBデータは、該当の研究論文が発表されるまで非公開とされ、実験のオリジナリティーが担保される仕組みとなっています。タンパク質の構造情報は、創薬研究などに積極的に活用される基盤情報であり、新型コロナウイルス(SARS-CoV-2)が持つタンパク質の構造情報も創薬に活用されました。塩野義製薬が開発したエンシトレルビルフマル酸(商品名ゾコーバ)もタンパク質の構造データを基に開発された薬です。
研究成果の発信と今後の展開
新型コロナウイルス(SARS-CoV-2)のタンパク質構造に限らず、食品加工用の加水分解酵素(https://numon.pdbj.org/mom/074)や化製品の原料を作る酵素(https://numon.pdbj.org/mom/201)などの分子設計にも構造情報が活用されています。我々はPDBjに登録された構造情報データを専門的に評価・検証し、検証レポートと呼ばれる品質情報を付して一般公開する作業に20年以上携わってきました。そしてwwPDB設立20周年の今年、大阪大学で処理されたデータ件数が全体の約4分の1に相当する5万件に到達しました(図2右)。その歴史と背景は、2022年12月に生物物理学の専門誌であるBiophysical Reviews誌に論文報告しています(https://doi.org/10.1007/s12551-022-01021-w)。
この論文で触れていますが、PDBj がデータ登録処理を開始した 2000 年の大阪大学でのデータ登録実績は全世界の5%でした。しかし昨年2022 年には実に全世界の28%を処理する地域拠点に成長しました(図2右)。5年前の2017年にPDBjへ登録されたアジア発の構造の数は2801 件で、PDBe に登録された欧州発の構造は4025 件でした。2022 年の数はそれぞれ4749 件(アジア)と4757 件(欧州)でしたので、アジアからの登録数の伸びが顕著なのは明白です。この登録数の伸びは中国からの登録件数がここ数年で急増していることに起因します。そこで、wwPDBの運営諮問委員会(世界の構造生物学分野の専門家により構成され、アジアからは高エネルギー加速器研究機構・構造生物学研究センターの千田俊哉教授と台湾・中央科学院の蕭傳鐙教授が参加)の助言を受け入れて、2022 年に中国・上海の国立蛋白質研究施設にある研究グループをPDB ChinaとしてwwPDB の准メンバーに迎え入れました。PDBjでは2022 年 8 月に上海から研修に来た2名の編集者に対して、約2ヶ月間のトレーニングを実施して中国で解析された構造データの一部編集処理を分担してもらっています。
日米欧の既存の国際プロジェクトの枠組みの中に急成長する中国の研究グループを緩やかに迎え入れることで、健全な国際連携の展開が期待されます。
本研究成果が社会に与える影響(本研究成果の意義)
PDBjはアジアにあるデータ拠点なので、英語での情報発信だけでなく日本語(韓国語、中国語)での情報発信にも努めています。中高生や一般の方向けに専門的な内容を日本語で平易に解説した入門サイト<https://numon.pdbj.org/>を開設して一般公開しています。高等学校の生物や化学の講義でも積極的にご活用していただいています(出前講義やSuper Science Highschool事業で直接お話をお聞きしました)。特に、特定のタンパク質をカラフルなイラストとともに毎月1つずつ取り上げて解説する「今月の分子」のコーナーは好評を博しています。
図3. 「今月の分子」のコーナーで食品加工に用いられる酵素(アミラーゼ)を解説したページ
本解説ページ https://numon.pdbj.org/mom/74 は,既に一般向けに公開中
特記事項
本データベース関連事業は、科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)の統合化推進プログラムと、医療研究開発機構(AMED)の生命科学・創薬先端支援基盤事業(BINDS)からの競争的研究資金を受けて進められており、文部科学省の共同利用・共同研究拠点活動経費による一部支援を受けています。
用語説明
- 日本蛋白質構造データバンク(Protein Data Bank Japan: PDBj)
日本蛋白質構造データバンク(PDBj: Protein Data Bank Japan)は、2000年に大阪大学蛋白質研究所に共同利用・共同研究拠点活動を担う組織として設置されました。20年にわたりアジア・中東地区からのタンパク質や核酸の立体構造情報を収集・編集・登録し、米国RCSB、BMRBおよび欧州 PDBeと協力して、国際的に統一化された一つの蛋白質構造データベース(PDB)として全データを大阪大学から世界に発信しています。
- 蛋白質構造データベース(Protein Data Bank : PDB)
蛋白質立体構造データベース(Protein Data Bank:PDB)は実験的に決定した生体高分子の3次元構造を保存する世界で唯一のデータベースです。1971年に米国で7つのエントリーからスタートしました。90年代後半になり、登録件数が全世界的に増加したことに伴って、日本には日本蛋白質構造データバンク(PDBj)が、欧州にはProtein Data Bank in Europe(PDBe)が設置されて、国際連携でPDBを維持・管理するようになりました。現在の総登録件数は20万件以上で、毎週250件程度の新規構造が追加されています。
- 国際蛋白質構造データバンク(worldwide Protein Data Bank : wwPDB)
大阪大学蛋白質研究所に加えて、米国ラトガース大学とカリフォルニア大学サンディエゴ校の共同研究チーム(RCSB PDB)とNMRの実験データを収録するコネチカット大学、欧州はイギリスにある欧州生物情報科学研究所(EMBL-EBI)がメンバーとなって共同でPDBデータの登録・維持・管理を行う国際プロジェクト。2003年に正式な協定が結ばれて設立された。日本蛋白質構造データバンク(Protein Data Bank Japan: PDBj)はwwPDBの設立メンバーであり、アジア・中東地区からのデータ処理・登録に責任を負っている。2022年に中国・上海にある国立蛋白質研究施設が准メンバーとして加わり、PDBjの指導の下で編集業務を一部分担している。