ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソリューション・サービス
  3. AI・ビッグデータ
  4. 特集コンテンツ
  5. その他の特集コンテンツ
  6. 予測不可能なデータ量増加への対処法
ここから本文です。

予測不可能なデータ量増加への対処法
~米国オバマケア事例から見たデータベース構築法~

前回のレポートでは、「見過ごされがちなデータの貯め方~先進事例から学ぶデータ蓄積の最新動向~」と題し、増え続ける非構造化データを保管・蓄積する製造業2社の事例から、非構造化データのアーカイブのポイントについて紹介した。

今後、将来のデータ量を正確に予測することは極めて難しい時代になっていくのではないだろうか。その中で求められるのは、将来を予測し予め厳密に準備するのではなく、スモールスタート、つまり今できる事から始めてその時々の状況に合わせて柔軟に変化させていく仕組みだと考えられる。今回は、オバマケアの事例から求められるデータベースのポイントについて紹介したい。

オバマケアで求められたデータベース要件

米国では、5000万人もの国民が医療保険に未加入であり、医療の高度化に伴う診療費負担が大きな社会問題になっていた。その課題解決のために、大統領選挙でバラク・オバマ氏がユニバーサルヘルスケア制度を公約として掲げ、2010年3月にオバマケアとも呼ばれる「医療保険制度改革法」が成立した。この法令は、保険会社のビジネスに留まらず、医療分野におけるIT活用にも影響を与えている。

その一例が「アウトリーチソリューション」である。これは、患者が病気になって初めて治療を開始するのではなく、病気にかかる前にサービスを患者に提供する事で予防医療を促進し、公的な医療費を削減する事を目的としている。

医療に関する情報は、患者ごとの診療・検査・手術・処方箋などの個人履歴、地域で流行している疾病やその治癒方法の情報、医療機器のM2Mデータ、など様々かつ大量である。アウトリーチソリューションは、これらのビッグデータを統合的に分析することで、各々の患者に対して適切なタイミングで病気を未然に防ぐための医療サービスを提供するものである。

ただし、この取り組みはまだ始まったばかりであり試験的な意味合いが強い。しかも、データが今後どのくらい増加するのか予測することはほぼ不可能だ。そのため、初めは最小限の構成からスタートし、日々増加していくデータ量に合わせて柔軟に増強していくことが可能なデータの格納基盤が求められていた。

データ量に合わせた柔軟な拡張を可能にする「InfoFrame Relational Store」

そこで、ある米国の会社が開発するビッグデータを活用した先端医療ソリューションに、データ蓄積・処理基盤として採用されたのが、NECのデータベースソフトウェア「InfoFrame Relational Store(以下IRS)」である。

IRSは、既存のRDBのメリット(使い易さ)とKVS(Key-Value Store)のメリット(スケールアウト性)を併せ持つ、ビッグデータ時代の新たなデータベースソフトウェアだ。データアクセス処理を行なうPartiqleサーバ、トランザクションを管理するトランザクションサーバ、データが格納されるストレージサーバで構成される。そのIRSの特長を以下に紹介したい。

(1)データの参照と更新の同時実行性能を最大化するトランザクション処理
データを複数サーバに分散させスケール性を持たせる事が一般的であるKVSでは、サーバを跨るデータ更新時にトランザクション処理が困難である。しかし、IRSが持つ“マイクロシャーディング”機構では、当該トランザクションの対象データを自動的に分類して、1台のサーバで更新が完結する独自技術を実装している。

加えてインメモリデータベース技術との融合により、耐障害性が担保されたメモリ上に更新履歴が書きこまれた時点でトランザクションは完了するため、トランザクション処理は高速に完了する。その更新履歴のデータ自体は、トランザクション処理とは非同期にストレージのデータに反映され永続化される。これらさまざまな仕組みにより、他のデータベースとは一線を画した高い更新性能を実現している。

(2)サービス無停止での拡張とアクセス負荷の自動平準化
アクセス数増加にはPartiqleサーバ、トランザクション増加にはトランザクションサーバ、データ量増加にはストレージサーバと、目的に応じて“必要となるサーバ”を部分増強することで、無停止でのスケールアウトが可能である。当然データベース容量は数ペタバイトまでリニアに拡張可能である。

また、トランザクションサーバとストレージサーバ上のデータは複数サーバに多重に分散されており、例えばトランザクションサーバのハードウェア故障発生時は、即時にバックアップのサーバが機能を代替し、縮退状態から復旧後にはサービスを中断することなく自動で負荷処理を均等化する。つまり運用監視に必要となる機構も備えており、作業工数の削減と高い信頼性も提供する。

オバマケアの「アウトリーチソリューション」は、本製品の特長を活かした一例であり、想定を超えてデータ量が増加した場合でも、導入時の性能を保持し十分に活用できると期待されている。ビッグデータ活用による新たなサービスの提供やサービスの質の向上のために、今後、想定を超えたデータ量の増加にも対応できるデータベースは、米国のオバマケア事例に限らずあらゆる業種で必要とされるだろう。

例えば、流通サービス業のあるお客様では、日々の物流や購買の中で商品の状態・移動に関する情報や顧客の属性・決済に関する情報など大量のデータが発生するが、これまではデータ量の増加に対応できず一部を破棄せざるを得なかった。そこで、IRSを活用する事でこれまで破棄していたデータも蓄積し、その後の分析により新たな知見を発見する取り組みが始まっている。この顧客からは、「これまでのデータ蓄積に関する課題が解決され、売上や利益に直結する分析作業にリソースを集中できるようになった」といった反応も寄せられている。

将来を見越して大きな初期投資を行う必要があったこれまでの課題を克服し、かつ、高信頼性を備えるスケールアウト型データベースソフトウェアは、ビッグデータの活用において重要な位置づけになっていくだろう。

日経ビッグデータ「パートナーレポート」掲載記事より

関連リンク

ページの先頭へ戻る