データ分析とは何か

「データ」と「インフォメーション」と「インテリジェンス」の違い

世の中のほとんどの「情報」は「データ」であるが「情報=データではない」

「データ」と「インテリジェンス」を混同していると、「データによる意思決定」と「情報による意思決定」を同一視してしまうようだが、それは誤りだ。

さらに「情報による意思決定」と「データを集める」が直結して「データをとにかく集めれば意思決定ができる」になってしまうらしい。この勘違いが日本でデータ分析が進まない原因の1つにデータとインテリジェンスの区別がされていないことが大きく影響しているのではないか、と疑っている。

データ分析をするにあたりデータとインテリジェンスの違いは最初に知っておくべき重要なことだと思うので、まとめておく。

重要なのは「集めただけのデータと、意思決定のためのデータは明確に違うものである」ということだ。それが伝わりさえすればいいので、どのような言葉に置き換えて読んでもらってもかまわない。

データとは「知りえるあらゆる事柄」

データとは形式も内容も関係なく「知りえるあらゆる事柄」とでも表現することができるだろう。

多くの人はデータと聞いたらデータベースに入っている、特に数値のことを思い浮かべるのではないか。しかし「意思決定のための分析の材料」と捉えるとそれではあまりに狭すぎる。データには以下のことも含む。

  • 数値だけでなく文章、属性、画像、音声、電波など
  • データベースに入っていないスプレッドシート、Excel、csvファイルなど
  • デジタルではない紙、写真など
  • 事実だけでなくフェイクニュース、デマ、真偽不明の噂など
  • データという名称には関係なくニュース、レポート、記事、観測など

データと「インテリジェンス」の違い

インテリジェンスとは「特定の意思決定のために洞察して得られた予測や推論」である。より正確に書けば「データのうち特定の意思決定のために洞察して得られた予測や推論」となる。つまり、インテリジェンスとはデータの一部である。

情報はインテリジェンスでなければ全てデータである。その違いは、以下の特徴を持っているかどうかで決まる。

  • 特定の意思決定のため
  • 洞察して得られた
  • 予測や推論

なおインテリジェンスについては「意思決定のために必要な情報」とは「特定の意思決定のために洞察して得られた予測や推論」であるで詳しく紹介した。

インテリジェンスはデータから作られる

「歩いて3分の店に買い物に行くのに傘を持って行くか」を決めたいとしよう。「空を見上げたら雲一つない晴れ」はデータでしかない。「空を見上げたら雲一つない晴れだから、出かけて買い物をして戻ってくる10分程度の間に雨が降ることは無いだろう」と予測になればインテリジェンスだ。

同じ情報がデータになったりインテリジェンスになったりする

ある情報に対して「データかインテリジェンスか」を問うことに意味は無い。同じ情報でも捉える状況や立場によって違う。

「夜には大雨の予報」という情報は、「これから夜まで出かけるのに洗濯物を干していくか」を決めるにはインテリジェンスとなる。一方、どこにも出かけず雨が降ったところで何もかわらない人にとってはデータである。

情報にはインテリジェンスとデータの両方の意味がある

情報はデータ全体を指している場合とデータの一部であるインテリジェンスを指している場合があるからややこしい。

インテリジェンスを意識せずに「情報に基づく」を「データに基づく」や「データドリブン」と同一視してしまうのは危険だ。これでは「データを集めれば意思決定ができる」と勘違いしてしまう。必要なのは情報の中でもインテリジェンスである。

このサイトで「情報」と言う場合はデータなのかインテリジェンスなのかを明確にできない場合にのみ使う。

データとインフォメーションの違いは考えない

実は情報にはもう1つ「インフォメーション」がある。データとインフォメーションの議論には「インフォメーションが整理されているデータ、データは整理されていない生の状態」のように区別している場合もある。当サイトにおいては、データとインフォメーションについては区別せずにデータで統一してインフォメーションは使わない。

理由は、インテリジェンスとなっているかそうなっていないかが最重要であると考えているためだ。インテリジェンスへの理解が広まればより詳しい説明として区別されていくかもしれない。

また、インフォメーションではなくデータを使うのはデータの方が一般的に使われているため伝わりやすいと考えるからである。

データとインテリジェンスは「食材と料理」の関係

(自分の説明が悪いかもしれないことはさておき)データとインテリジェンスの区別がまだしっくりこないのであれば、データを食材に、インテリジェンスを料理に例えるのがいいだろう。

食材は生のままでも食べられることはあるが、食材=料理ではない。提供するのが料理なのか食材なのかでまったく違う。

職種で考えるなら分析者は「分析」という商品を提供するのが役割であり、つまり「データ」を提供するのではなく「インテリジェンス」を提供しなければならない。もし「データ」を提供するのであればデータエンジニア、データアーキテクト(データ整備人)、データスチュワードなど他に名前がある。

同じ様に、料理人ならば食材から調理を行って料理を作ることで対価を得る。食材を販売するなら料理人とは名乗らないだろう。

データとインテリジェンスの区別は最初にしよう

いろいろ書いてみたが言いたいことは「意思決定のために必要なのはインテリジェンス。データを集めるだけではデータのまま」ということだ。これだけ伝わっていればあとは全部補足でしかない。

おもしろい話をいくら集めても雑学にしかならないのはそれがデータだからだ。自分が解決したい課題に結びついていなければインテリジェンスにはならない。データを事前に多く集めて整備しておくことは重要であるが、それはインテリジェンスを作るための準備である。

人気のある記事

HOME > データ分析とは何か > 「データ」と「インフォメーション」と「インテリジェンス」の違い