「分析」ではなく「処理」と呼ぶのががいいのではないかという提案

「分析」の意味するところが混乱している

以前から気になっていることの1つとして「分析」という言葉が人によって意味が違っている、ということがある。

この「同じ言葉をみんな独自の定義で使っているからわけがからないよ問題」はデータサイエンティストとかも含めてあちこちで見かけるので言い出したらきりがないのだけれども、最も中心となるべき話題である「分析」がこうもぶれているのはやはりよろしくないのでは、と以前から考えている。

なので、なぜ混乱が起きるかについて考えた上で、混乱を避けたりやっていることをより明確に伝えられるような別の名前で表現することを提案してみようと思う。

「データ分析」はプロセス全体で「分析」はその1フェーズ、をどう説明するか

何を問題視しているかというと、「データ分析」とは、意思決定の質を向上させるための一連の行為であり分析だけでは成立しないはずだが、これがデータ分析プロセスの1フェーズである「分析」とかなり混同している人が多いらしいことだ。

1フェーズとしての「分析」とは「すでにあるデータを何らかの方法で処理すること」なのだが、人によってはこの「分析」フェーズが「データ分析」と同じであり、つまりデータをどうにかすることがすべてである、のように捉えているらしい。

プロセスであることを考えないと意思決定に使われないとか、目的がないとただデータをいじくって終わって無駄になるわけだが、それは「分析する人の仕事ではない」と(それが正しい場合も多々あるだろうが)それ以外のことに目もくれないということにもなりかねない。

これだけだと何が悪いのかと思うかもしれないのでサッカーを例に出してみよう。

「サッカー」=「セットプレー」ではない

サッカーに例えてみると、いわば「分析」フェーズは「ゴール前でパスを受け取ってシュートを打つ体制をとる」だろう(細かく言うとパスを受け取るためのポジション取りは前処理で、シュートするのは「洞察」フェーズだと思う)。傍目に見ればたしかに目立つがこれだけを見てサッカーのすべてだと言ったらそれは違うだろう。

実際のゲームでは誰かがパスをしているし、それ以前にゲームの大半はボールに触れることなく走ったり、ポジション取りをしたり、あるいはディフェンスをしているだろう。

ゲームに勝つためにはこれらすべてが必要なのであるが、もしパスを受け取ってシュートすることだけをサッカーと捉えていたら、いくらそこがうまくても選手としては一流どころかゲームに出ることすらかなわないだろう。

自分はそれをやりたいからゲームに出られなくても構わないというのであればそれは当人の考えなのでこれ以上何も言わないが、大半の人にとってはそうではあるまい。

与えられたデータをどうにかすることに偏りすぎ

きれいなデータが与えられ、それを何かの手法でどうにかするかに話題が偏りすぎ、その手前で必要な「どのように収集して選別するか」についてがないがしろにされるのは実は今に始まったことではない。

『大本営参謀の情報戦記』にも「いつどこからどれぐらいの敵がどう攻めてくるか」まで与えられた上で「どう対応するか」の教育が中心だったとの話が出てくる。そのような情報が手に入ることなど現実的にはありえないにも関わらずだ。

また書籍も「データをどう扱う」「どんなアイデアを考える」かについてはたくさん書かれているが、ではどうやってそのデータを集めるかについてはあまり書かれていない。これは統計学に限らず戦略もマーケティングもあらゆるところで感じるところであり、つまり最近の「分析」、つまりデータサイエンスにおいても同じことが起きているだけなのではないかとは思う。

さらに言えば情報・データの収集への意識の低さはデータ分析による意思決定の文化が育たなかった結果でてくる様々な弊害の1つなのだがその話はまた別にしよう。

「分析」を止めて「処理」と呼ぶのはどうか

そこでだが、「分析」という呼び方がよくないのであればわかりやすい別の名前を付けるのはどうだろう。ともやっと思っていたらそういえば日本では伝統的(?)に情報といえば「情報処理」が主流だったことを思い出した。

なるほど、「収集」されたデータをどう扱うかがこのフェーズなのだから「処理」であればデータをどうするか、についてのフェーズであると表現できそうだ。

この区別が付けば「処理」が得意/できる/興味があると、「データ分析」が得意/できる/興味があるで違いがわかるようになるのではないだろうか。

にわかな人にあまり厳しくするのも考え物

ただこれからサッカーを始めようとしている人にボールを触る前から詳細なルールを教え込んでも頭に入るわけもなければ興味を失わせてしまうのと同じように、分析についてもあれこれうるさいと始めようと気もなくしてしまうだろう。

すそ野を広げようとするのにあまり事細かに言うのはしない方がいいとは思っている一方で、最初からある程度は広い認識を持っておいた方が後で修正するよりも近道だろうとも思う。

どちらがよいのかはまだ答えが出ていないので、ひとまずは主にデータ分析界隈で働く人たち向けには「処理が良いのでは」というこの記事を書いておく。

もし「分析」を「処理」と言い換えてみたら

別の名前で呼んだ方がいいのではというのは本当に最近思いついたのだが、わりと実態を反映できていて、「処理」と呼ぶことで「何のためにデータ分析しようとしているんだっけ?」をより意識しやすくなった気がしている(気のせいかもしれない)。

もしデータアナリストとデータアーキテクト(データ整備人)の役割を分けたらアナリストを名乗りつつも実態はデータアーキテクトである人が多くいるように、「データ分析」をしているつもりがその実は部分である「処理」であったという人もそれなりにいそうなのだが、感想を聞かせてもらいたい。