NEC・大阪大学、複数機関が保有するゲノム情報をプライバシー侵害リスクを抑えて解析できることを実証

NEC・大阪大学、複数機関が保有するゲノム情報をプライバシー侵害リスクを抑えて解析できることを実証

データを暗号化したまま解析できる秘密計算で実現

2019-7-23

概要

日本電気株式会社(本社:東京都港区、代表取締役執行役員 社長 兼CEO:新野隆、以下、NEC)と国立大学法人大阪大学(総長:西尾章治郎、以下、大阪大学)の大学院医学系研究科中谷明弘特任教授(常勤)らのグループは、同研究科医療情報学松村泰志教授の協力によるゲノム情報学共同研究講座において、データを暗号化したまま解析できる秘密計算※1 をゲノム解析システムへ適用する実証を行い、解析者が自らの解析手法を秘密計算化できるツールが実用レベルにあることと、計算処理自体も実用レベルの高速性を持つことを確認しました。これにより、プライバシー侵害のリスクを抑えてゲノム解析が可能となり、個別化治療の研究の促進に貢献します。

研究の背景

近年、個人のゲノム情報に適した効果的な薬を開発するため、ゲノムと疾病の関係を解析するゲノム解析が活発化しています。しかし、解析で使用するこれらのデータは機微性が極めて高い個人情報であるため、医療機関や研究機関間で共有することは容易ではありませんでした。秘密計算は、データを秘匿したまま様々な演算処理ができるため、複数の医療・研究機関から、ゲノム情報や疾病情報を秘匿した状態で結合解析できる手段として期待されています。しかし、従来の秘密計算は、複雑な処理により計算速度が極度に遅く開発が容易ではないため、ゲノム解析への適用は困難とされていました。

研究の内容

今回NECと大阪大学は、大阪大学が行っているゲノム解析にNECの高速かつ開発が容易になる秘密計算を適用し、安全なゲノム解析が実用的な時間で実行可能であるかについて実証を行いました。

具体的には、大阪大学が開発した、複数の医療・研究機関が保有するゲノム情報や疾病等に関する情報を統合して解析する解析アプリケーション(DSビューア )にNECの秘密計算を適用することで、複数の医療・研究機関が保有するゲノムや疾病等の情報を秘匿したまま収集し、ゲノム変異の頻度を解析しました。さらに、プライバシー侵害が起こらないよう集計値が一定数以上の場合のみ、その集計結果を開示する処理を行いました※3

その結果、年代ごとのゲノム変異頻度の解析について異なる複数の研究機関が有する約8,000人のゲノム情報を約1秒で結合解析できることを確認しました。これにより、ゲノムや疾病等の情報を異なる研究機関間で開示し合うことなく、秘匿したまま結合解析するゲノム解析が実用的な時間で実行可能となります。

また、本実証では、大阪大学独自の解析アルゴリズム※4 に対して、NECが開発した秘密計算の開発支援ツール ※5 を用いることで、専門家が1か月程度かかる秘密計算の適用を一般のシステムエンジニアが数日程度で完了できることも確認しました。これにより、様々なゲノム解析への秘密計算の適用が可能となります。

図1

今後の展開

両者は、引き続き秘密計算をゲノム解析に適用する検証を進めていきます。これにより、各医療機関・研究機関が持つゲノム情報と診療情報を患者のプライバシー情報を保護しつつ互いに活用することが可能になり、個別化治療の研究を含めた先端医療の発展に貢献していきます。

同時に、同技術をより広く活用することにより個人の生活情報や企業の機密情報など様々な情報を、異なる業種や組織間で安全に結合解析できる基盤の提供を通じて、新たな価値の創出によるSociety5.0 の実現に貢献していきます。

特記事項

この研究は国立研究開発法人日本医療研究開発機構(AMED)臨床ゲノム情報統合データベース整備事業「認知症臨床ゲノム情報データベース構築に関する開発研究」(研究代表者:公立大学法人 大阪市立大学大学院医学研究科 森啓特任教授)の支援のもとでおこなわれたものです。

参考URL

大阪大学 大学院医学系研究科 ゲノム情報学共同研究講座
http://www.med.osaka-u.ac.jp/introduction/research/joint/genome

用語説明

※1

NECが2016年に開発した、3台のサーバへの秘密情報の適切な分散配置により、暗号化したまま大幅に処理速度を向上させた手法。 参照:プレスリリース「NEC、機密情報の漏えいを強固に防止する秘密計算の高速化手法を開発」(2016年12月15日)

https://jpn.nec.com/press/201612/20161215_02.html

DSビューア

中谷明弘特任教授(常勤)らのグループが開発したゲノム解析のアプリケーション。国立研究開発法人日本医療研究開発機構(AMED)の「臨床ゲノム情報統合データベース整備事業」の「認知症臨床ゲノム情報データベース構築に関する開発研究」(研究開発代表者:公立大学法人大阪市立大学大学院医学研究科森啓特任教授)において、国立大学法人新潟大学脳研究所、国立研究開発法人国立長寿医療研究センターメディカルゲノムセンター、学校法人慶應義塾慶應義塾大学医学部の3つの研究機関が保有するゲノム情報などを統合し、性別や年代ごとのゲノム変異の集計などの統計量の解析を検証した。

※3

一般に、様々な条件で詳細な集計を行うと集計値が小さくなり、場合によっては個人のプライバシーに係わる情報が推測される恐れがある。例えば、ある母集団の中で、ある年代・性別の人が1名しかいないと分かっている際に、その年代・性別でゲノム変異頻度を集計すると、その1名のゲノム変異情報が推測でき、プライバシーが侵害されてしまう恐れがある。そのため、集計値が一定数以下の場合は、集計を行わないなどの処理をすることが重要となる。

※4

似たようなゲノム変異パターンが連続する領域をブロックとして表現することで効率的なゲノム解析を実現する独自の解析アルゴリズム。

※5

NECが2018年に開発した、一般的なプログラミング言語の使用により、秘密計算の処理内容が記述できる支援ツール。 参照:プレスリリース「NEC、組織・業界を越えた安全なデータ活用を推進する秘密計算のシステム開発を容易にする支援ツールを開発」(2018年11月5日) https://jpn.nec.com/press/201811/20181105_02.html

Society5.0

サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会。第5期科学技術基本計画において、我が国が目指すべき未来社会の姿として初めて提唱された。