ページの先頭です。

サイト内の現在位置を表示しています。
  1. ホーム
  2. 製品
  3. NEC Solution Platforms
  4. ラインアップ
  5. Data Platform for Hadoop
  6. データレイク・ソリューションとは
  7. 出来ること
  8. データ統合とデータカタログ
ここから本文です。

データ統合とデータカタログ

データの流れの見える化、データのタグ付によるデータの効率的活用

Data Platform for Hadoopは、複数のシステムにあるデータを統合し、そのデータの品質の維持、効率的な活用、運用ガバナンスの強化を実現します。

データを統合しても、求めているデータが何処にあるのか、データがどこでいつ生成されて更新・変更されたデータなのか、どのようなデータがあるのかわからない状態だとデータを効率的に活用できません。
また、データが統合されたデータを適切に管理しないとセキュリティリスクやコンプライアンス違反によって、事業継続が困難に至るケースもあります。

Data Platform for Hadoopでは、データの発生からの流れや加工の履歴、タグ付け機能によって、組織の枠を超え複数システムにまたがって統合されたデータの品質を維持するとともに、必要なデータを見つけやすくし、データを効率的に活用できます。

また、2018年5月25日にEU一般データ保護規則(GDPR)が施行されましたが、そこで義務付けられるによって、企業は侵害された個人データの情報を監査機関に対して72時間以内に通知する義務があり、それに違反した場合は、多額のペナルティが課されますが、そのレポートを速やかに提供することができます。

データの流れの見える化

データがどこで発生しどのような順番でどう加工されてきたかを一覧でき、さらに特定の時点での詳細な処理内容やデータ属性を確認できます。
例えば、もともと個人情報を含んだデータが加工し利用されていた場合でも、タグをつけておくことやどのような加工が行われてきたかの履歴を確認することで、気づかずに不適切な利用をすることを避けることができます。

タグ付けと検索を活用したデータアクセス

データに「オーナー」「作成日時」「データ名」などの基本情報はメタデータとして自動的に付与され蓄積されます。さらに「個人情報含む」「参照のみ可」などといった情報も付与することができます。

ユーザーは、これらの付与れたメタデータで検索し、必要な時に簡単に必要なデータを見つけ、活用することができます。

Status Historyの処理時間の図を挿入

データへのアクセス管理と監査機能

ユーザーのデータへのアクセスを「誰」が「どのデータ」に「どのような処理」を行えるかを設定して、適切なユーザー名のみがデータを加工できるようにコントロールできます。さらに、データへのアクセスの証跡を管理し、監査に活用することができます。

「いつ」「誰」が「どのデータ」を「どう処理」したか「許可」したかを一覧でき、不適切な処理をトレースして、コンプライアンスアセスメントやレポート作成に活用することができます。

  • Hortonworks、Hortonworks Data Platform、Hortonworks DataFlow、Hortonworks Cybersecurity Platform、Hortonworks DataPlane Serviceの名称およびそのロゴは、Hortonworks, Inc.の米国およびその他の国における登録商標または商標です。
    Apache, Hadoop, Falcon, Atlas, Tez, Sqoop, Flume, Kafka, Pig, Hive, HBase, Accumulo, Storm, Solr, Spark, Ranger, Knox, Ambari, ZooKeeper, Oozie, Phoenix, NiFi, Zeppelin, Slider, MapReduce, HDFS, YARN, and Druidの名称およびそのロゴは、Apache Software Foundationの米国およびその他の国における登録商標または商標です。

ページの先頭へ戻る