ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. O-N通信
  3. コラム
  4. 第4回
ここから本文です。

林エバンジェリストが語る 最新技術動向

林エバンジェリストの顔写真

エバンジェリストの林です。

今回は、ビッグデータに焦点を当ててみたいと思います。センサやネットワークが安価になり、身の回りに多くのセンサが設置されるようになってきました。このセンサとネットワークを利用して、様々なデータを安価に、そして大量に収集できる仕組みができるようになってきました。しかし、収集されたデータの分析はなかなか進んでおらず、一説によると収集されたデータの99%は、利用されることなく捨てられています。このように市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑なデータ集合の集積物をビッグデータと呼んでいます。この大量のデータを分析することにより、役に立つ情報に変換する仕組みがビッグデータビジネスです。

様々なシーンで活用が進むビッグデータの現状をご紹介いたします。

第4回 ビッグデータ

近年、センサ、ネットワークが安価になり、身の回りに様々なセンサが設置されるようになりました。これにより、様々なデータを収集する仕組みができ始めています。建設業界でいえば、構造ヘルスモニタリングと呼ばれる、建造物にセンサを取り付けて、災害時のダメージ状況をリモートで検知するといった仕組みが研究されていることでしょう。このように市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑なデータ集合の集積物をビッグデータと呼んでいます。この大量のデータを分析することにより、役に立つ情報に変換する仕組みがビッグデータビジネスです。

最近のビッグデータ活用事例では、AKB総選挙で選抜メンバ16人中15人を的中させたり、埼玉県道路政策課での交通事故予測マップ作成など、その成果が実証されてきています。

ビッグデータの活用には、4つのVと呼ばれる視点が必要です。多様性・複雑さ(Variety)、量(Volume)、速さ(Velocity)を理解し、これにより、情報を価値に変えるデータの価値創出(Value)が可能となります。

このビッグデータの収集、加工・蓄積、分析・メディア解析という一連の流れのうち、今回は、分析・メディア解析に焦点を当てて紹介いたします。

1.インバリアント分析技術(SIAT)

大量のセンサ(観測点)から得られた計測データのみを網羅的に、人の手を介さずに自動解析し、システム全体の複雑な挙動をモデル化(数式化)します。「センサから得られた計測データ」と「モデルから得られた予想値」を比較し、「いつもと違う」動きを異常として発見し、その異常箇所を特定することが可能となります。この技術は、中国電力島根原発などで採用されており、プラントなどの大規模施設での適用が期待できます。

中国電力株式会社 様 プラント故障予兆監視の関連リンク

2.異種混合学習技術

混ざったままだと正確な規則性を見つけるのが困難なデータを自動分割(たとえば、小売業でいえば、曜日別や、天候別など)し、規則やパターンを抽出します。これにより、解釈性を保ったまま、分析精度を向上させることが可能となります。

センサから収集される数値データは、数値統計解析の技術が進んでおり、それを利用すればある程度分析可能です。しかし、カメラからの映像データやソーシャルメディアの書き込みといった文字データは、非構造化データと呼ばれており、従来の数値を中心とした統計解析の技術が適用できません。これらの非構造化データの分析技術も進み始めています。

3.テキスト含意認識技術

テキストの意味解析を行うエンジンで、表現による「揺らぎ」を補正し、正しく意味を解析することが可能となります。従来は、二つの文中の単語の一致・不一致のみを分析していましたが、文中の重要単語、主語や述語などの文章構造を分析し高精度なテキスト含意認識を実現しています。

このような、NECでは様々な分析エンジンを用意しており、あらゆる分野でのビッグデータ技術の利用を推進しています。

関連リンク

Top of this page