ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. プラットフォームソリューション事例
  3. <クラウド基盤>NEC Cloud IaaS 導入事例:国立大学法人 京都大学 様
ここから本文です。

<クラウド基盤>NEC Cloud IaaS 導入事例
国立大学法人 京都大学 様

インタビューを受けた佐藤先生の写真。キャッチとして、数百億レコード規模のビッグデータ統計解析を研究しています。と入っています。

京都大学 大学院情報学研究科 助教 佐藤 彰洋 博士 に、ビッグデータ統計解析研究のクラウド基盤にNEC Cloud IaaSを採用した経緯とその効果について詳しく聞きました。

目次

概要

課題背景

  • 科学技術振興機構「さきがけ」プロジェクトに研究が採択され、数百億レコード規模のビッグデータ統計解析が可能なシステム基盤が必要になった

  • 研究時間を確保するために、「運用負荷が低い」「安定した」「柔軟に構成変更できる」システム基盤を必要としていた

  • 大学の購買制度の中で、迅速・確実・低価格な予算計画を立てる必要があった

成果

可用性と拡張性を備えたクラウド基盤サービスの採用により、システム構築・運用にかかる時間を低減し、実質的な研究時間を確保

データ通信量、ディスクアクセス数などに依存しない「定額の月額課金制」のクラウド基盤サービスを選定することで、迅速・確実に予算を策定し、更に低コストで導入

導入ソリューション

事例の詳細

佐藤先生の現在の取り組みについて ─ ビッグデータ統計解析を研究対象に ─

現在、私は「グローバル・システムの持続可能性評価基盤に関する研究」に取り組んでいます。これは科学技術振興機構「さきがけ」プロジェクトにより先端研究として採択され、すでに予算化されています。予定研究期間は、2015年10月から2019年3月までの3年半です。

この研究の意義、内容は「従来は莫大な手間、費用、時間をかけて実施していた社会経済データの収集と統計の作成、およびその解析を、ビッグデータ解析基盤を使って短時間かつ自動的に処理し、意思決定支援を行える基盤の構築を目指す」というものです。

ビッグデータの収集は、インターネット上に公開されている経済・社会の一次データを、クローリングにより継続的に自動収集して行います。更に、これに、政府統計ならびに政府統計個票データから再集計される個別統計、ならびに衛星データを独自に開発した世界メッシュコード体系を用いて統合する研究を行っています。データ規模は数十億~数千億レコードを見込んでいます。

一例として、航空機の席数データ解析を説明してみましょう。LCCの増加などにより民間航空機の便数(席数)は飛躍的に増えています。2016年現在、世界全体の航空機の席数は、年間で46億席です。地球の人口を70億人として、その半分以上を輸送できるキャパシティに達しているわけです。また一日当たりの乗客数はざっと1000万人です。つまり東京都の人口に匹敵する数の人間が、一日のうちに飛行機に乗り空に浮かんで、この地球上を移動できるわけです。

ビッグデータ統計解析基盤上に、運行席数、乗客数を含む商用タイムテーブルデータを日次ベースで蓄積しています。これにより、どの国のどの空港に何機・何席が離着陸したかを集計・解析し、図のような形で視覚化できます。

この日次データを一年間収集し続ければ、同様の静止画が365枚揃います。たとえばその365枚の静止画を連続再生して簡易動画化すれば、世界の空港利用の全体トレンドが時系列で容易に理解できます。

近年、航空機の席数は年間1億席のペースで増加しています。2014年における年間の総座席数は44億席程度ですが、2015年は45億席、2016年では46億席でした。 データを継続的に収集分析することにより「人類全体の航空機の利用トレンド」をリアルな実数で認識することが可能になります。

また、クローラー(自動データ収集プログラム)を使い、鉄道、ホテルなど不特定多数の人々が日々利用する社会インフラの活用状況を把握、分析するためのデータをインターネット上の一次データの収集と政府統計を連動させて行っています。これらの分析結果は2020年に開かれる大規模スポーツイベントでの宿泊状況改善やインバウンド観光の活性化にも役立つと考えています。

従来の統計解析では、悉皆(しっかい)調査に代表されるような正確でも手間も人手もかかる調査を数カ月~数年に一回行って、データを取得し、偏りを補正して分析結果を得るというプロセスを経ていました。

こうした調査手法はいまもその意義を失っていませんが、最近ではインターネット上の一次データの自動収集という手法が注目されています。これは調査員、調査票を必要としないという意味で「調査なき統計」とも呼ばれています。

インターネット上の一次データを適切に政府統計の悉皆調査による母集団推定と連動させることにより、正確性が高く、かつ高頻度の統計を作成することができると期待されています。

この手法では、インターネット上のデータを毎日、大量収集し蓄積するので、データ量は必然的に膨大になります。このビッグデータを適切かつ高速に集計・解析するにはそれに応じた高性能のシステム基盤が必要になります。

その基盤にNEC Cloud IaaSを使っているわけです。

NEC Cloud IaaSを使って構築したシステムの概要

NEC Cloud IaaSを基盤に構築したシステムの概要は次のとおりです。

項目 内容
用途 「グローバル・システムの持続可能性評価基盤に関する研究」の実証
(予定研究期間:2015年10月から2019年3月までの3年半)
システム基盤の構成 NEC Cloud IaaS
●仮想サーバ
・ハイアベイラビリティ(高可用性モデル):「データベース」
・スタンダード(標準モデル):「Webサーバ」「クローリングサーバ」「分散データベース兼ファイルサーバ」
●ストレージ
●ネットワーク(ファイアウォール、インターネット接続)
アプリケーション 自作プログラム
可用性のスペック ・ハイアベイラビリティ(高可用性モデル) :99.99%
・スタンダード(標準モデル) :99.95%

課金体系は通信量やディスクアクセス数による従量制ではなく定額制(月額課金)を選びました。予算計画が立てやすく非常に助かっています。

システム基盤にクラウドサービスを選択した理由

オンプレミスではなくクラウドで構成した理由

クラウド構成にした理由は次のとおりです。


  1. サーバ管理に要する人的コスト(運用負荷)を低減し、実質研究時間を増やす
    「グローバル・システムの持続可能性評価基盤に関する研究」は実質的に私一人が行う「個人研究」です。全体構想、論文執筆はもちろん、プログラム構築、予算申請まですべて一人で行います。ということは「研究資源としての私の時間」はなるべく「研究そのもの」に使うべきです。サーバ管理など「研究の本質と無関係な副次作業」には費やしたくありません。
    この前提を考えたときハードウエア、OS、ネットワークなどすべての維持管理の作業を外部委託できるクラウド構成の方が、私にとって望ましいといえました。
  2. オンプレミスのIAサーバではビッグデータ収集分析は不可能
    大学という場所での「オンプレミス」とは早い話、自分の研究室に自分で立てるIAサーバのことです。研究が構想、実験段階にあるときはIAサーバの方が便利です。私も構想時、インターネット上のデータを自動巡回収集するためのクローラーをプログラミングするときは、研究室のIAサーバを使いました。実験段階では少しぐらいサーバが落ちようが不調になろうが実害はないからです。しかし研究が本格実証段階に進むと停止や不調は重大問題になります。したがって、ビッグデータ収集分析には高い可用性を持つシステム基盤が必要となります。
  3. コストを合理的な範囲に抑えられる
    先に述べた高い可用性を持つシステム基盤をオンプレミスで実現しようとすると、同じ性能を実現するためには時間的・人的費用が膨大になり一般的な研究予算の範囲を超えます。しかしクラウドならば費用を合理的な範囲に抑えられます。更にクラウドならば初期導入費用がかからず、研究の進捗状況に合わせてストレージ容量追加やサーバ構成・台数変更などの対応が迅速に行えます。
  4. 期間限定利用に適している
    今回の研究は科学技術振興機構の予算を使って実施しており、予定期間は2019年3月までの3年半です。それ以降もシステム基盤を使い続けるかどうかは現時点では未定です。このように「期間限定利用」が前提となっている場合、いつでも始められていつでもやめられるクラウドの方が適しています。

クラウド基盤に求めた要件 ─ 高い可用性と低コスト

クラウド基盤サービスの選定方法

まず、インターネット検索や友人からの口コミなどを通じて候補サービスをリストアップしました。最終的にNEC Cloud IaaSを含む国内外の主要6サービスを比較検討しました。このときの比較基準、要件は次のとおりです。


  1. 可用性と拡張性:高い可用性を含むハイスペックな基盤が利用できること
    クラウド基盤サービスにも様々あり、月額500円で始められるワンコインクラウドのような簡易メニューもありますが、それとは一線を画した高機能、高可用のクラウド基盤であることを求めました。特に今回の研究は「クローラーが毎日データを自動収集、蓄積する」「その結果はホームページを通じて24時間365日公開する」という形式なので、なおさらシステム基盤には高い可用性が求められます。今回NEC Cloud IaaS導入にあたり、データベース部分に「高可用性モデル」を採用したのもそうした理由からです。更に、大容量ストレージが利用でき、かつその費用対効果が高いことも魅力の一つです。研究の進捗に併せてストレージを段階的に増設できることが重要と今回は考えました。
  2. 価格:データ通信量やディスクアクセス数に依存しない定額課金制であること(従量課金制でないこと)によってコストを抑えたい
    クラウドサービスの中には「従量制」課金のものが多くあります。具体的には「データ通信の単位量あたりいくら」「ディスクアクセス一回当たりいくら」のように小さい費用が少しずつ積み重なっていく課金システムです。これはこれで「使っただけ課金」という意味で明朗会計かもしれません。しかし今回のビッグデータ収集分析は、クローラーが毎日のように一次データをインターネット上から収集してディスクに書き込みを行い、日々それを集計・統計分析するというものです。
    また研究が継続あるいは拡大すれば、データの収集頻度・範囲も拡大し、それに伴い通信量やディスクアクセス数も拡大します。こうした状況で、従量課金制のクラウドサービスを使うと、研究が進むにつれ月々の費用も莫大になります。想定外の課金が発生するリスクもあります。そうした不都合を避けるためにも、いくら通信しても、いくらディスクアクセスしても費用が一定である「定額制」課金であることを求めました。
  3. 明確なサービスメニュー:積算しやすく予算申請書に記述しやすい価格体系であること(コスト算出が容易で迅速に予算計画が立てられること)
    今回のクラウド基盤は、科学技術振興機構より獲得した予算に基づき大学の購買制度に則って調達することになります。提出する購入申請書には「年額ベースで○○円」のように概算見積もりを記述する必要があります。このとき従量課金制のサービスの場合、どれだけ費用がかかるか事前に読み切れません。ある程度、固定費としてみなして予算計画を立てることが可能な、定額課金制の価格体系が望ましいと思われました。
    また、費用についてはある程度メニュー化されていて簡単に見積もれるものが望ましいと考えました。候補となったクラウドサービスの中には、詳細な規定を読み込んで精密に積み上げ算するようなものもありました。その場合、すべての規定・仕様を理解しないと積算ができません。それでは見積もりに時間がかかりすぎて、研究時間の減少につながります。
    申請書作りに時間を費やしたくないのでスピーディに見積もれるサービスが良いと考えました。
  4. 使いやすさ:インタフェースが良いこと(時間の有効活用)
    私の研究活動は「全体を構想すること」「数式を考えること」「それを実現するプログラムを組むこと」となります。システム基盤の構築・運用のようなSE的な業務はなるべく少なくしたいところです。しかし個人研究となるとそうは言っておられず、SE作業も含めすべて作業を自力でこなす必要があります。SE作業の最小化のためにも、ユーザーインタフェースやマニュアルは直感的で分かりやすいものであることを求めました。要は使い方で迷って時間を無駄にするのは避けたかったということです。

以上の要件をもとに候補6サービスに対し、「資料請求による表面仕様の比較」「試用版の活用による実際比較」などを通じて詳細に検討したところ、NEC Cloud IaaSが私の求める理想像に最も近かったので、これを採用することに決めた次第です。NEC Cloud IaaSは特に“可用性”と“定額課金制による低コストの実現”の2点で他サービスと比べて強い優位性がありました。

1年にわたりNEC Cloud IaaSを使い続けた評価

京都大学
大学院情報学研究科 助教
佐藤 彰洋 氏

まず可用性の高さについては期待どおりです。導入当初と比べ、レスポンスが速くなった印象さえあります。おそらくNEC側でシステム基盤を継続的に改善しているのでしょう。こちらが何もしなくても勝手にシステムが改善されていく。これもクラウドの良い点です。

次にインタフェースなど操作性ですが、マニュアルにもポータルにも満足しています。知りたいことがすぐ分かるので、研究時間が無駄に奪われることがありません。数回メールサポートを依頼しましたが、迅速に回答していただけました。

また、物理的に安全なデータセンターから提供されていることによるサービス自体の信頼性はもちろん、万が一、障害が発生した際は迅速な対応を行い、可能な限り情報開示をしていただけるという点に安心感があります。

「グローバル・システムの持続可能性評価基盤に関する研究」のシステム基盤にNEC Cloud IaaSを導入したことは正解であったと、改めて実感しています。

現在クラウド基盤の採用を検討している大学関係者や企業担当者に向けて、先行ユーザーとしての アドバイス

クラウド基盤サービスの場合、月額500円など低額で簡単に始められるものもあります。研究初期の実験段階ではそうしたサービスを活用するのが手軽で良いと思いますが、「最初は低額でスモールスタートして、だんだん拡張していけば良い」と考えると上手くいかない場合があります。というの
も低額サービスには通信速度やディスク容量などに上限(天井)が設けられていることがあるからです。

その場合は本格導入のときは低額メニューから本格メニューへ「システムを引っ越す」ことになりますが、その作業はなかなか面倒ですし、それをやっていると研究時間が減少します。将来の利用拡張が見込まれる場合は、最初からそれに適したメニュー、あるいはスムーズに拡張できるサービスを使
うのが良いかもしれません。

NECへの今後の期待

まずは「グローバル・システムの持続可能性評価基盤に関する研究」を成功させることに全力を注ぎます。その後も社会経済データの統計解析という研究をより推進する所存です。NECにはその研究の取り組みを優れたサービスや技術を通じて後方支援していただくことを希望します。今後ともよろしくお願いします。

お客様のプロフィール

国立大学法人 京都大学

創立 1897年
代表 総長 山極壽一
事業内容 高等教育・教育研究機関

佐藤彰洋氏 プロフール

京都大学 大学院情報学研究科 数理工学専攻 助教 博士(情報科学)。科学技術振興機構 さきがけ研究員。専門はデータ中心科学(経済物理学, 経済情報学)。社会、経済系のビッグデータの統計分析の分野に精力的に取り組む気鋭の研究者。

  • 取材日時 2017年1月
  • この事例に記述した数字・事実はすべて、事例取材当時に発表されていた事実に基づきます。数字の一部は概数、およその数で記述しています。

この事例の製品・ソリューション

ページの先頭へ戻る