「データサイエンティストブームを総括する」を検証する

2018年10月25日

「データサイエンティストブームを総括する」の振り返り

前にこんな話を書いた。

2015年7月だから約3年前(更新日時が2018年になっているのは移転の影響)になるが、データサイエンティストという言葉は消えるどころか人工知能の話題と一緒にいまだよく聞かれる言葉となっている。しかし、このエントリーがひどく間違っていたのかといえばそうでもない。矛盾しているのではなく、同じ「データサイエンティスト」であってもその内容が違うのだ。

反省点:「データサイエンティスト」という言葉の定義があいまいだった

「データ分析をする人」には「アナリスト」と「エンジニア」がいる。

当時あまり意識していなかったのだが、「アナリスト」と「エンジニア」を区別していなかった、というよりは「アナリスト」についてしか考えていなかった、という方が正しいのだが、これが間違いであり大いに反省すべき点だ。「アナリストとしてのデータサイエンティスト」であることははっきりしておかないと、「(主に機械学習の)エンジニアとしてのデータサイエンティスト」と話が混同してしまう。しかも「アナリストとしてのデータサイエンティスト」と「エンジニアとしてのデータサイエンティスト」では様子がまったく違っており、2018年時点で生き残ったのは「エンジニアとしてのデータサイエンティスト」だ。

検証:「データサイエンティストブームを総括する」を振り返る

これを踏まえて、改めてその主語を「アナリストとしてのデータサイエンティスト」として読み直すとどうなるか。

データサイエンティストという言葉が聞かれるようになってそろそろ3年になるが、いまだに定義は確立されず、何をする人なのかもよくわからない

「アナリストとしてのデータサイエンティスト」に限定しても、その定義がよくわからないことには変わりない。データアナリストとは何が違うのか?高度な技術や手法を使うのだとしたら、高度とはどの程度のことを言っているのか?と、やはりひどく曖昧なままだ。

名乗ったもの勝ちになってしまい、単なるハッタリになっているケースも散見される。データサイエンティストと名乗ってはいるが、実は統計学を多少かじっただけで数理的知識はほとんど持ち合わせていないなどいう場合すらある。それでもまったく知識の無い人には違いがわからず、結局は知識ではなく営業力勝負となっている。

定義があいまいなのだから当然だが言ったもの勝ちなのも変わりないし、知識も実務ではさほど高度なことが要求されることが少なければデータサイエンティストを使おうとする企業側はもっと無知なので、やはり営業力次第であることも当然だろう。

主にツールを導入するシステムベンダーと、そのベンダーのパートナーであるコンサルティング会社がブームで稼ぐ一方で、ブームが来てから人材を雇ったりツールを導入して、大きく業績に貢献したという企業がはたしてどれだけあるのか疑問である。

ここはもう1つ、「データサイエンティストを養成するためのセミナーやオンライン講座」が足りなかった。それが加わればこれもそのままでよいのではないか。「ゴールドラッシュで一番儲けたのは、バケツとスコップを売った人だ」という話があるが、データサイエンティストも同様ということか。その中から本物だけがいずれ残っていくだろうが、結果が出るにはまだ時間がかかるであろう。また、後半については「ブームが来てから」がポイントなのだが、やはりあまり目立った結果は出ていないように見える。とはいえ本当にうまくいっている企業はなかなかその情報を表には出さないので本当のところはよくわからないのだが。

もう1・2年もすればデータサイエンティストという言葉は聞かれなくなるだろうが

「アナリストとしてのデータサイエンティスト」ということであればこれはもうほとんど聞かれない。もともと文化がないところに高々数年でできるような話でもないので、当然と言えば当然か。

総じて若い人の方がデータ分析に関する感度が高いと思われ、今後経営者の世代が変わっていけば、よりデータ分析への需要は増えるだろう。

多分合っている気がするのだがここ数年で目立つのは「アナリスト」とではなく「エンジニア」なので、世代が変わったところで「アナリスト」への需要が大きく増えるか、というと微妙なところ。

ただし要求されるのは基本的な集計とコミュニケーションが主であり、今回のデータサイエンティストブームで話が出た高度な統計学や機械学習が要求されるレベルになるまでにはまだまだ時間がかかると予想される。

需要がほとんどないのだから高度なことが求められることもなく、そもそも営業以外でデータサイエンティストと呼ぶ必要性もないぐらいなのでこれも正しいだろう。

今後の展望:「アナリストとしてのデータサイエンティスト」はやはり厳しい

以上を考えると、前回のエントリーから3年経っても状況はさほど変わっておらず概ね合っており、あえて書き換えなくても済みそうだ。嬉しくはないが。

今後の展望であるが、「アナリスト」には引き続き厳しい。そもそも日本に情報を集めて意思決定するという文化そのものがほとんどないのだからそんな簡単に変わるわけもなく、となると「アナリストとしてのデータサイエンティスト」となれば部分的にはともかくこれを中心に仕事をするというのはよほどの例外でなければ難しいという状況には変わりないだろう。

とはいえ厳しいということだけ言ってもしょうがない。靴の話ではないが、文化がないということは裏返せばできることはたくさんある、ということなのかもしれないので自分にできることをやっていこう。ちょっとでも「アナリスト」に関心がある企業で実績を積み、高度な内容を増やしていくというのが最も現実的な方法ではないかと思うのだが実際にやってみるとこれもなかなか難しい。その話はまた次の機会に。