広域分散システムの検証が可能な評価基盤を開発

広域分散システムの検証が可能な評価基盤を開発

複雑・同時多発的な災害や障害を想定した訓練が可能に

2015-11-20

本研究成果のポイント

広域分散システム の耐災害・耐障害を検証する評価基盤を構築した。
・様々な災害・障害を想定した検証は、これまで人的コスト等の観点から実施が難しかった。
・人的コストを抑え、広域災害がもたらす複雑で同時多発的な障害を模した訓練が可能になった。
・災害回復システムや事業継続計画の内容の妥当性や投資対効果が評価できると期待できる。

概要

大阪大学情報推進本部・サイバーメディアセンターの柏崎礼生助教、中川郁夫招聘准教授、金沢大学の北口善明助教、奈良先端科学技術大学院大学の市川昊平准教授、広島大学の近堂徹准教授、高知工科大学の菊池豊教授らの研究プロジェクトは、地理的に離れた複数のコンピュータをネットワークで結合して構築する広域分散システムの耐災害性、耐障害性を検証する評価基盤“DESTCloud”(デストクラウド)を開発しました。国内外の複数の研究機関からなる広域分散仮想化環境を利用した本評価基盤は、組織間を相互接続するネットワークに対して意図的に障害を発生させることで、広域分散仮想化環境上で動作するシステムの耐災害性や耐障害性を検証することができます。

東北地方太平洋沖地震以降、国内では大規模災害による情報の喪失から回復するための「災害回復」を実現する情報システムや、災害発生後、すみやかにサービスの継続を計る「事業継続計画」に注目が集まりました。しかし設備の増強や手続きの策定が行われたものの、人的コストなどの観点から、構築された災害回復システムを用いて策定された計画に基づき災害訓練を実施する頻度は低いことが調査により判明しています。

本評価基盤は地震に限らず、広範囲に同時多発的に発生する様々な災害を想定し、通信インフラが被る被害から障害を想定することにより、多様な災害シナリオを用いた訓練を行うことを可能にします。この訓練により、大規模災害時においても広域分散システムが「粘り強く」そのサービスを提供し続けられるかどうか、状況を事前に評価することが可能となります。本評価基盤が提供する機能を用いて、インターネットに代表される広域分散システムの耐障害性・耐災害性を定量的に評価することが期待されます。

本研究成果は、米国オースティンで11月15日から開催された国際会議SC15会場で発表されました。

図1 DESTCloudの模式図

研究の背景

当研究プロジェクトでは、並列分散ストレージ 技術を災害回復手法に応用する研究を推進してきました。この研究で広域分散仮想化環境“distcloud”を構築、現在大阪大学のほか、札幌や沖縄のデータセンターなどに、その拠点を持ちます*。本研究開発はこの環境を用いて広域分散システムが大規模災害発生時に被災する障害状態を模倣することで、災害時の事業継続計画の妥当性を検証し、災害時に生じるシステムの品質の劣化を定量的に評価し、改善に繋げることを目的としています。

一組織内の仮想計算機を喪失させることで耐障害性を検証する取り組みは既に行われてきましたが、大規模災害の発生後には同時多発的に広域に渡り多様な障害が発生します。より現実的な災害訓練を実現するため本研究プロジェクトはプログラマブル にネットワークの設定を変更することを可能にする「Software Defined Network (SDN)」技術に注目し、「ネットワークを破壊する技術」として SDN 技術を応用しました。SDNを用いて組織間を接続するネットワークに障害を発生させ、広域分散システムのネットワークトポロジー 自体を変化させることで、より複雑な障害を模擬することを実現することが評価基盤“DESTCloud”の研究開発の動機付けです。

* distcloudの拠点:大阪大学、札幌データセンター、東北大学、国立情報学研究所、金沢大学、京都大学、奈良先端科学技術大学院大学、広島大学、高知工科大学、沖縄データセンター、およびカリフォルニア大学サンディエゴ校

本研究成果が社会に与える影響(本研究成果の意義)

本研究プロジェクトで開発した評価基盤は、以下の三つの特徴を有します。

● 様々な災害のシミュレーションをベースにした災害シナリオを生成することができる。
● 様々なネットワーク機器に対して災害シナリオをもとにした障害を実装することができる。
● 指定した時刻に障害を発生・解除することができ、その前後のネットワーク情報を収集し観察することができる。

あらゆる自然災害に対して頑強な広域分散システムを構築するためには膨大なコストを要します。限られた予算でシステムを構築する際には必ず「対応できない災害」が存在します。本評価基盤による検証で、どのような災害に対応することができ、どのような災害に対応することができないかを事前に把握することが可能となります。また、本評価基盤が提供する機能によって、災害回復システムや事業継続計画の内容の妥当性や投資対効果を評価できると期待されます。

今後の展開

昨年度、インテック株式会社が開発した並列分散ストレージソフトウェアの耐障害性検証実験を行ったのに続き、今年度は広域分散ストレージソフトウェアを開発するクラウディアン株式会社、スキャリティ・ジャパン株式会社が本評価基盤上での検証実験に参加を表明し、2016 年2月まで多種多様な障害環境化でのベンチマークテストが行われます。本実験の結果は各企業にフィードバックされ、製品の品質向上に寄与することが期待されています。

本プロジェクトでは、今後、本評価基盤のSDN制御方式に関する国際標準化の推進やネットワーク防災に対する社会的な意識向上のためのコンソーシアムの設立、拠点数の拡大などを推進し、より実用的な技術の確立を目指して研究開発を進めます。

特記事項

米国オースティンで11月15日から開催されている国際会議 SC15 会場において、情報通信研究機構 (NICT) が提供する新世代通信網テストベッド JGN-X を用いた“DESTCloud”のデモンストレーションを行いました。

また、本研究開発は総務省による情報通信分野の競争的資金である平成26年度戦略的情報通信研究開発推進事業 (Strategic Information and Communications R&D Promotion Programme: SCOPE) の先進的通信アプリケーション開発推進型研究開発フェーズⅠ、および平成27年度SCOPE重点領域型研究開発 (先進的通信アプリケーション開発型) フェーズⅡの支援を受けて実施しております。

参考URL

DESTCloudプロジェクトweb site
http://ricc.itrc.net/DESTCloud

用語説明

広域分散システム

地理的に離れた多数のコンピュータをネットワークで接続して構築するシステムのこと。分散させることにより、負荷分散や冗長化を行うことが可能となる。

並列分散ストレージ

複数の計算機資源が提供するストレージをまとめて大きな一つのストレージとして扱うストレージのこと。地理的に離れた場所でデータを分散保存する並列分散ストレージを広域分散ストレージと呼ぶ。広域分散ストレージは特に障害・災害時におけるデータの永続化や応答性能の向上などに利点がある。

プログラマブル

利用者がソフトウェアプログラミングにより一連の動作を記述できること。自動化や繰り返し処理などが容易に実現できるようになる。

ネットワークトポロジー

ネットワーク接続における接続形態および構成のこと。