データ分析とインテリジェンス

「データ」は何を提供しているのか

依頼を出す側にこそ意識して欲しい

「データ分析」とはよく言われるがその実態を詳しく見てみると「データ」「インテリジェンス」「提案」「実行」と様々な形式をとりえる。

その中でも「データ」にはまたいくつかの用途がある。区別がついていないと、今必要としているプロセスのためには必要ないのに「あればそのうち使えるかも」と余計なデータを欲しがったり、投資として収集しておくデータを取らずにおいてしまう。

そこで、「データ」の中にはどういった種類があるのかをまとめてみた。

抽出する「データ」の種類

データの使われ方を考えると、さらに3つの種類に分けることができるだろう。

  • 特定のプロセスの収集フェーズへの対応
  • いつか使えるようにしておくための準備
  • 行動のトリガー

特定のプロセスの収集フェーズへの対応

意思決定者が自ら処理、洞察してデータをインテリジェンスにする場合であっても意思決定と分析のプロセスは何か知りたいことがあってプロセスが始まり、収集フェーズで必要なデータを入手する。

この際、技術的な問題、範囲が広すぎて追いつかないなどの問題で自分ではできない場合に別の誰かが収集フェーズのみを担う場合がある。この場合に「データ」をアウトプットとする仕事が発生する。

料理で言えば「作ろうとしている料理のために必要な食材」と言える。一般的によく使われる食材は近所のスーパー(データマートが対応)に自分で買いに出かければ手に入る。しかし希少品や高級品など特殊な食材は個別に手配しなければならないのと比べることができそうだ。

しかし「データ」と「インフォメーション」と「インテリジェンス」の違いを認識していないと「データ」を受け取ったらそのまま意思決定ができると勘違いしてしまう。

「意思決定のために必要な情報」とは「特定の意思決定のために洞察して得られた予測や推論」であるので「データがあれば意思決定ができる」は勘違いであり、データをインテリジェンスにしなければならない。この部分を怠るとデータは単なる事実のままで「データなんていくら集めても使えない」とデータを提供した側の責任にもされてしまうのは悩ましい。

いつか使えるようにしておくための事前の準備

誰かの特定のプロセスに対してのデータを提供するのではなく、いつかどこかの「収集」フェーズで使うための事前の準備をしておくことも必要だ。市場、競合、基礎統計、人材、技術、画像や音声の認識などたくさんのデータが考えられる。

目的が「特定の問題の意思決定のため」ではなく「データ」になり、プロセスの途中までは同じで「洞察」フェーズで終わって結果がデータ基盤に格納される、というところか。いわば「収集」フェーズのための子プロセスとでも表現できる。

特定の利用を意識せずに汎用的に作るため誰にも使われないこともある。単にデータを集めても役に立たない、になってしまうのはこのケースを意識していないからではないだろうか。

場合によっては同じデータがインテリジェンスにもなりうる。ただしそれは偶然インテリジェンスとして使えるというだけで分類としてはデータにしておく方がいい。

主体の範囲を広げてみると、天気予報、学術研究資料、政府の発行する統計などもここに入る。

料理で言えば「精肉や食品加工」に例えるのがいいだろう。食材そのものではなく、いろいろな料理に使えるように事前に加工しておくことで何かの料理に必要になったらすぐ使えるようにしておく。パスタを食べようとしてからベーコンを生肉から作り始めても間に合わない。

ここで生み出されたデータが基盤が無ければ集約できず、集約するだけでなくその後に整備する必要もでてくる。なので「データ」を抽出するだけでなくそれ以外のコストを生み出す。やらないと使いたい時に使えずかといって無尽蔵にリソースを費やすこともできない。

投資なので、集めるデータの種類や量を決めるには十分な検討を要する。

行動のトリガー

意思決定がすでにされており、設定した閾値を超えた、特定のデータが発生したなどその行動のトリガーとして使われるデータがある。

こちらは「意思決定と実行」フェーズの子プロセスと表現できるだろう。

ダッシュボードは基礎統計を表示して共有するために作られることもあるが、より有効的な使い方としては「〇〇を超えたら誰が何を対応する」まで決めておき、その閾値の監視だろう。

「カップラーメンを食べるのに時間を測るためのタイマー」に当てはまるだろうか。他に言い例えがあれば教えて欲しい。

「データ」は「データ分析」が提供するものの1つ

実のところ区別をしてもデータ整備のタスクの1つである抽出としてはやることはかわらない。なので整備する人よりも依頼者になる人に伝えるべきなのでそれは今後の課題。

今回の話は、「データ分析」が提供するものには「データ」「インテリジェンス」「提案」「実行」とあるが全然違うものなので説明をしようとしていたところ「データ」の話が長くなったので切り出した。

普段から「データ分析をする」とか「データを抽出する」とか言っているが、自分で整理してみると全然違うものを区別せずに同じ言葉で表現していたりすることに改めて気が付く。

カテゴリー:データ分析とは何か