Japan
サイト内の現在位置
データを集めればデータ活用できるか?
コラムで学ぶデータ活用企業がDXを推進する上で、「データ活用」というものが、いかに重要なのか認識し始めた新見さん。具体的に集めたデータをどのように活用しいけばよいのか、そして活用していくためにIT視点でどのようなことを気にしなくていけないのか、もう少し詳しく古田先輩に聞いてみることにしました。
「データ活用」についての学びポイント!
- データを集めるだけではなく、社内外のバリューチェーン全体でどう活用するかという戦略視点で考えていくことも重要。
- データを情報に変えていくために、データの持ち方や、情報処理(データ処理)に関する知見が必要。
- これからは、IT、業務、アナリティクスに知見を持つ人物が求められる。
データを集めるだけではダメ
前回、データ活用において、7つの要素の視点で整備していくことが必要であり、まずシステムを使って、どのような経営課題・ビジネス課題を解決するのか、「戦略」を明確にしていくことが求められるということをお聞きしました。
今回は、具体的に集めたデータをどのように活用しいけばいいのか教えて頂けませんか。
ドイツのKAESER KOMPRESSOREN(以下、ケーザー)のビジネス変革の事例の文献(「DX推進指標」とそのガイダンス 経済産業省)から紹介しよう。ケーザーはコンプレッサー専業メーカーだが、「コンプレッサーを売らずに、圧縮空気を売る」というビジネスモデル変革を実現した会社なんだ。世界中のコンプレッサーに取り付けられたIoT端末から、圧縮空気の使用状況を始めさまざまな機械の状態を表す計測値をリアルタイムに監視。故障を未然に防ぎ稼働率をアップするという目的だけなく、圧縮空気をユーザーが使った分だけ代金を支払うサービス形態にビジネスモデルを変革することに成功しているんだ。そして注目すべき点は、そのデータから異常が発生するプロセスを分析して、結果を新製品の開発や機能改善にフィードバックするサイクルも確立したりしていること。装置から得たデータから、メンテナンスだけなく、セールス、マーケティング、製品開発といったバリューチェーン全体で活用し、DX変革を起こしている。データを活用して戦略課題を解決しているよい事例だと思っている。
データを集めるだけではなく、社内外のバリューチェーン全体でどう活用するかという戦略視点で考えていくことも重要なんですね。
ITが得意としているところは何なのか
IT視点ではどのようなことを気にしなくていけないのでしょうか。
まずITは万能ではないということに留意する必要があるね。ITが得意としているところは何なのかを、しっかり捉えて活用していくということが重要だね。
ITが得意としているところは主にこの5点が重要だと考えている。
① Visual/Visibility
- 数字の羅列から気づきを得るのは困難。(グラフなど視覚的に捉えて気づくことがある)
- モノゴトが見えるようになって経営やビジネスに活かせることがある。(見えないところに改善や創造はない)
② Expert/Experience
- 熟練したエキスパートが持つノウハウをデータとして蓄積。
また実践するベストプラクティスなオペレーションを、ロジック(プログラム)という形態で蓄積し活用することにより、企業全体のパフォーマンスをあげる。 - 人間が本来持つ本能や欲望に応じるエクスペリエンス向上のしくみを提供する。
③ Network
- 通信を媒介として個々がつながることにより連結の経済性を向上させる。
④ Database
- 人間の脳に蓄積しているデータは曖昧で保持する量にも限界がある。
- 企業内外のあらゆるデータを正確かつ大量に保持し活用することにより、経営やビジネスに活かす。
⑤ Automatic
- 人間は単調な作業を長時間かつ正確に行い続けることは不可能。
- オペレ-ションをロジック(プログラム)という形態で蓄積し自動化することにより、人間の精神的負担削減と効率化を実現する。
なるほど。ITは魔法の箱ではないということですね。ITの強みを課題に対しどう活かせるかという視点でも考慮が必要ということですね。
データの持ち方と情報処理(データ処理)について
データを集めるだけではダメということでは、データを情報に変えていくために、データの持ち方や、手続き、つまり情報処理(データ処理)に関する知見も必要になってくる。
まず、データの持ち方について例をいくつか紹介しておこう。実際にはこのようなこともITに携わっている人たちは考慮しているわけだね。
<例1:在庫データ> -時間とともに変化するデータ-
締め日 | 倉庫 | 品目 | 数量 |
---|---|---|---|
2/3時点 | 東京 | 製品A | 5個 |
埼玉 | 製品B | 7個 | |
埼玉 | 製品B | 10個 | |
合計 | 製品A | 5個 | |
製品B | 17個 |
締め日 | 倉庫 | 品目 | 数量 |
---|---|---|---|
2/7時点 | 東京 | 製品A | 8個 |
埼玉 | 製品B | 4個 | |
埼玉 | 製品B | 10個 | |
合計 | 製品A | 8個 | |
製品B | 14個 |
図1・2
- 在庫や受注残などの残高の類のデータというのは時間とともに変化していく。
- データを見た人がそれぞれ異なる時点で確認した場合に同じとは限らず、この違いで混乱が生じる。
- 個々の目的に応じて、必要な時点ごと(締め)のデータを複製(スナップショット)しデータ活用していく必要がある。
<例2:受注履歴データ> -履歴のデータ-
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品A | 山田 | 5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品A | 山田 | 6 |
合計 | 11 |
図3
- 受注や売上などの履歴のデータについては期間で捉え、データ活用していく必要がある。
<例3:受注履歴データ> -履歴のデータ(項目変更1)-
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品A | 山田 | 5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品A | 山田 | 6 |
3 | 項目修正 | 2/5 | 受注 | 会社1 | 製品A | 山田 →田中 |
6 |
合計 | 17 |
図4
- データ項目が変更された場合の、履歴データの記録のしかたについては注意が必要。
- 例えば担当者が変更になった場合に、その履歴のデータを登録する際、項目が変更になったという事実だけを記録した場合は、項目が変更になったという事実は確認できるが、合計金額は単純に計算しても算出できない。
(項目が変更になっただけで数量が変更になったわけでない) - つまり、どのようにデータ活用するかという目的も考慮して、データの持ち方を決める必要がある。
<例3:受注履歴データ> -履歴のデータ(項目変更2)-
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品A | 山田 | 5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品A | 山田 | 6 |
3 | 項目修正 | 2/5 | 受注 | 会社1 | 製品A | 山田 | -6 |
4 | 項目修正 | 2/5 | 受注 | 会社1 | 製品A | 田中 | 6 |
合計 | 山田 | 5 | |||||
合計 | 田中 | 6 | |||||
総合計 | 11 |
図5
- 例2の解決策としては、集計して合計数が合うようにデータを相殺する形式で登録する方法がある。
- ただし、この場合は変更前と変更後のデータを両方見ないと、何が変更になったのかわからないので注意が必要となる。
<例4:受注履歴データ> -履歴のデータ(項目変更3)-
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品A | 山田 →田中 |
5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品A | 山田 →田中 |
6 |
合計 | 田中 | 11 |
図8
<品目-担当者マスタ>
締め日 | No | 品目 | 担当者 |
---|---|---|---|
2/5時点 | 1 | 製品A | 山田 →田中 |
2 | 製品B | 田中 |
- その他の方法として、データ確認時に最新のマスタを検索し、最新の項目情報を使用するという方法がある。
- ただし、この場合はすべての対象データが変更となるため運用面で注意が必要となる。
(上記例では、受注時の担当者を知りたいときに対応できないため、新旧の項目を両方用意するなどの工夫が必要となる)
続いて、情報処理(データ処理)について基本的な例をいくつか紹介していこう。
これまでデータの持ち方の例を示してきたが、最終的には必要とする情報とするためにデータ加工は必要となる。
☆必要な情報
2/1~2/5に会社1より受注した製品・担当者とそれぞれの受注合計数を把握したい。
☆使用するデータ
「品目-担当者マスタ」と「受注履歴データ」
<品目-担当者マスタ>
締め日 | No | 品目 | 担当者 |
---|---|---|---|
2/5時点 | 1 | 製品A | 山田 |
2 | 製品B | 田中 | |
3 | 製品C | 田中 |
<受注履歴データ>
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 数量 |
---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品B | 5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品C | 6 |
3 | 新規 | 2/3 | 受注 | 会社1 | 製品B | 7 |
4 | 新規 | 2/5 | 受注 | 会社1 | 製品A | 8 |
5 | 新規 | 2/5 | 受注 | 会社2 | 製品A | 8 |
<結果>
注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|
会社1 | 製品A | 山田 | 8 |
会社1 | 製品B | 田中 | 12 |
会社1 | 製品C | 田中 | 6 |
① Project(射影)
<受注履歴データ>
No | 処理 | 日時 | 区分 | 注文主 | 品目 | 数量 |
---|---|---|---|---|---|---|
1 | 新規 | 2/1 | 受注 | 会社1 | 製品B | 5 |
2 | 新規 | 2/3 | 受注 | 会社1 | 製品C | 6 |
3 | 新規 | 2/3 | 受注 | 会社1 | 製品B | 7 |
4 | 新規 | 2/5 | 受注 | 会社1 | 製品A | 8 |
5 | 新規 | 2/5 | 受注 | 会社2 | 製品A | 8 |
② Select(選択)
<受注履歴データ>
注文主 | 品目 | 数量 |
---|---|---|
会社1 | 製品B | 5 |
会社1 | 製品C | 6 |
会社1 | 製品B | 7 |
会社1 | 製品A | 8 |
会社2 | 製品A | 8 |
③ Sort(並び替え)
<受注履歴データ>
注文主 | 品目 | 数量 |
---|---|---|
会社1 | 製品A | 8 |
会社1 | 製品B | 5 |
会社1 | 製品B | 7 |
会社1 | 製品C | 6 |
④ Join(結合)
<品目-担当者マスタ>
締め日 | No | 品目 | 担当者 |
---|---|---|---|
2/5時点 | 1 | 製品A | 山田 |
2 | 製品B | 田中 | |
3 | 製品C | 田中 |
<受注履歴データ>
注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|
会社1 | 製品A | 山田 | 8 |
会社1 | 製品B | 田中 | 5 |
会社1 | 製品B | 田中 | 7 |
会社1 | 製品C | 田中 | 6 |
⑤ Summary(集計)
<受注履歴データ>
注文主 | 品目 | 担当者 | 数量 |
---|---|---|---|
会社1 | 製品A | 山田 | 8 |
会社1 | 製品B | 田中 | 12 |
会社1 | 製品C | 田中 | 6 |
AI活用のために情報処理(データ処理)
以前、AI活用について話をしたが、この情報処理(データ処理)はもう一歩踏み込んだ考慮が必要になるので簡単に紹介しよう。ここでは、高度な統計解析ツールのようなものも含めてAIとして考えて聞いてくれるといいかな。
多変量解析のひとつである重回帰分析の例で示そう。重回帰分析は下記のような計算式から導き出される。いくつかの説明変数(要因)から目的となる数字を導き出す式で、目的となる数字の予測や影響を及ぼす要因を探り出すことに利用される分析の手法。これは以前も話をしたけれど、決して覚える必要はないものの、考え方は理解しておいた方がいいんだ。その考え方を理解せず、とんでもないデータを作成してとんでもない結果が出てしまい、混乱してしまうケースはよくあるので注意が必要だ。
いくつかポイントを説明しよう。
まず下記は、顧客データからそれぞれ顧客の年間購入金額を予想してみようというもの。この場合、各顧客の年間購入金額が目的変数となり、それぞれ性別・所在地を説明変数と考えてほしい。厳密にいうと、変数は文字を扱えないので数量化という技術が必要なのだけれど、昨今のAIは自動的に内部で処理するので、ここでは便宜上、文字も説明変数ということで説明しよう。
下記の例では、性別と所在地だけで年間購入金額を予測しようとしているが、いかほどの精度が上げられるだろうか。以前話をしたように、既存のデータだけでは十分な分析ができることは少ない。
そこで、年間購入金額に影響するのはないかと想定される要因をビジネス視点で仮説として置き、付加してあげることがポイント。ここでは各顧客が勤務している企業の特性、業種や年商、企業のグレードを付加して分析を試みているね。以前より精度の高い予測が期待できないだろうか。
あと、ポイントとしては、データの単位を意識することが重要なんだ。2)の例を見てみよう。元の顧客データから購買履歴を付加して分析をしようと試みているのだけれど、顧客一人単位の目的変数を算出するのに2つのデータで分析するのはおかしいよね。こういうケースでは、購買履歴を顧客単位に1件のデータにして分析してあげる必要がある。計算式を覚える必要はないけど、この分析手法はどういう考え方なのかを理解していないと、こういうことが起こりうるから注意が必要だね。
また、既存のデータにある項目だけでなく、目的変数に影響するだろう説明変数を新たに定義し計算して、項目を設定するということも必要になる。3)の例は、来店回数や来店間隔も年間購入金額に影響するのではないかと仮説を置き、計算により項目を設定したケース。このように、既にあるデータからただ付加するだけなく、新たに必要な項目を作るということもポイントになる。ここまでやろうとすると、さすがに1件のデータの計算からは求められず、複数のデータから作成する必要がありプログラミングが必要になるね。
また、データを4)のようにパターン別に分類し、そのパターンごとに予測するということも有効な手段だね。
実際の分析ではこのようにデータを加工しながら進めていくのですね。これからは、IT、業務、アナリティクスに知見を持つ人物が求められるというのがわかった気がします。
参考文献
ケーザー・コンプレッサー社(ドイツ)× SAPジャパン
機器の企画から導入、保守、修理までをトータルサービスとして提供
製造業のビジネスモデルを180度転換した「エア売り」とは?
関連ページ
「データ活用のポイント」コラム
コラム制作者:
日本電気株式会社 エンタープライズ・トランスフォーメーション事業統括部
中西英介・土屋直之
本コラムの設定は架空のものであり実在の人物や団体などとは関係ありません。