意思決定と分析のプロセス

データサイエンティストには社内調整が必要なのか

データサイエンティスト
データアナリスト
役割分担

主語を「データサイエンティスト」にするのをやめよう

「データサイエンティストに社内調整スキルは必要か」と盛り上がっていたので思うところをまとめる。

さて、この手の話がややこしくなるのは多くの人が「データサイエンティスト」がどのような役割を担っているかをあいまいにしたままで話を進めるからだ。そこでいったん「データサイエンティスト」という言葉を使わないようにする。

その代わりに主語に「データ分析をする人」を使う。「データサイエンティスト」や「データアナリスト」はもちろん「リサーチャー」も該当する。さらに「マーケター」や「マネージャー」など分析する人も全部含む。つまり「データ分析で意思決定の質を向上させる人」のことを指す(なので実は大半の人が当てはまる)。

それでは社内調整が必要かを考えるにあたり、先にデータを使うにあたり必要な役割には何があるかを考えよう。

データの「集約」と「整備」は誰かがやらなければならない

さて、データを使って何かしたいのであれば、必要になってから集め始めるだけでは間に合わないこともある。例えば特定のイベントのクリックログは後になってから取り直そうとしても無理だ。そのためどうしても事前にデータ基盤を作ってデータを「集約」しておく必要がある。基盤を作るのは主にエンジニアリングの領域であり、テクノロジーを使って社内外に存在するデータを集める。

集約したら「整備」もしておかなければならない。単にどこかに集めただけでは大量のデータも使い物にならない。整備はエンジニアリングと分析の間でデータを使いやすくするのが役割であり、技術よりも段取りとコミュニケーションが中心になる。

集約や整備の話はちゃんと説明しようとするとそれだけで大変だ。整備について詳しく知りたい方はスライドを参照のこと。基盤を作るエンジニアリングの話は専門外なので触れない。

社内調整は「収集」フェーズの中のほんの一部でしかない

データは種類も存在する場所も状態も様々だ。主に社内のデータを集約して整備する際に起きるコミュニケーションが社内調整と呼ばれる。その内容はデータの場所を突き止める、入手方法を決める、担当者に依頼する、時には動いてもらうためになぜ必要なのかを上司や関係各所に説明する。実にめんどくさいが誰もやらないとデータが手に入らない。

データ基盤作りは集約と整備に加えて適切に保管することまでがセットである。そして、社内調整はこれらを実現するための方法の1つである。なので社内調整だけ個別に考えることにあまり意味はない。

さらにデータ基盤はセキュリティ、法務や倫理、人的情報収集(アンケートの設計やコネクションの獲得など)、入手したデータの評価も含めた「収集」フェーズの一部でもある。非常に手間と時間がかかる役割であり、本格的に取り組むのであればとても片手間にできる仕事ではない。

「分析」もまたとんでもなく広い領域

データの「分析」(データ分析プロセスでいう「処理」と「洞察」のフェーズのこと。今回はまとめて「分析」と表現する)もまた非常に広い領域だ。

手法も様々であり、数理モデル、機械学習、最適化、時系列解析などは全てここに含まれる。定性的な分析はまた別にある。これだけでもその膨大さは理解できるだろう。

加えてさらに基礎知識としての数学や統計学、各分野における専門知識、データを処理するためのプログラミングスキル、問題を洞察して予測する能力も必要だ。

「収集」フェーズと同様にこの中の1つでもきちんと身に着けて実務に使っていくためには多くの経験が必要になる。

集約と整備と分析は別の役割

ここまで簡単に見ただけでも集約と整備と分析はスキルも責任もまったく違った役割であることがわかる。

だからこそ集約を担う人には「データエンジニア」とか整備を担う人には「データアキテクト(データ整備人)」という名称がある(後者を名付けたのは自分だが)。分析を担う人である「データサイエンティスト」や「データアナリスト」とは別なのだ。

なお集約と整備を担う人をひとまとめにしてデータエンジニアと呼ぶ人もいる。しかし、呼び方は異なってもこの収集と分析はまったく違う役割である、ということに認識に違いは無いだろう。

「データサイエンティストは社内調整を行うべきか」は問いが正しくない

当初「データサイエンティストは社内調整を行うべきか」から始まった話題だが、これは問いが正しくない。それぞれの範囲が狭いかつ曖昧過ぎる。なので「「分析」をする人は「集約」や「整備」を行うべきなのか」という問いにした方がいい。

そして、答えは「「分析」をする人は「集約」や「整備」はやらない方がいい」である。理由はすでに書いたようにそれぞれが非常に広く専門性の必要である領域であるからだ。

もちろん全く関与しないということはありえない。お互いの領域を理解している方がコミュニケーションしやすくなるのは当然だ。興味が出れば勉強してみたいと思うこともあるだろう。しかし、役割に対して責任を持つのとは別の話だ。専門として身につけるにはそれぞれがあまりにも広すぎる。組織でカバーした方がいい。

セールスとマーケティングを考えるのがわかりやすい。それぞれの境界は曖昧であっても同じ職種だと考える人は少ないだろう。「人が足りていないのでセールスがマーケティングを兼ねている」ことはありえる。「セールスはマーケティングを知っておいた方がいい」もその通り。しかし「セールスはマーケティングにも責任を持たなければならない」とは言わない。データ分析も同じだ。

なぜ「データサイエンティスト」が「社内調整能力は必要」という話になるのか

とはいえ実態としてはデータ分析をする人が分析だけに注力できる環境はまれである。また規模が小さい企業や、規模が大きくとも分析への取り組みがまだあまり行われていない企業では「分析」だけに人を当てることはできない。

すると「分析」をしようとしている人が「整備」を兼ねることになる。その際には「社内調整」も付いてくる。なので「データ分析をする人は集約や整備をやらない方がいいが、分析に集中できる状況にないので別の役割も兼任している」が正しい表現だ。

一方で「データ分析をする人は集約や整備ができなければならない」は飛躍しすぎだろう。この飛躍が起きるのは以下の事情が混在しているように思える。

  • 収集と分析(処理や洞察)が区別されていないので「全部やるのが正しいと思っている」から
  • 基盤が整っていない上に人も足りていないので「やらないと仕事にならない」から
  • 実態としては他の仕事を中心に行っているが「データサイエンティストと名乗りたいので無理やり範囲を広げている」から
  • あれもこれもできる(ことにした)方が「評価されやすい」から
  • 役割と責任の明確化の話は「評価や採用に不利に働く」から

データ基盤はなぜ整っていないのか

そもそもデータ基盤がちゃんと整っており、役割が決まっているのであればこのような問題は起きないではない。ではなぜ基盤が無かったり整っていないかと言えば「誰も使ってなかった」からだ。

データの話はこの10年足らずで急激に盛り上がってきた領域だ。現在でもデータの実務に携わっているのは世の中全体からしたらほんのわずかにすぎない。ニーズが無いのに基盤がいつの間にかに自然発生することはない。なので基盤がないのはしょうがない、というより当たり前なのだ。

なのでデータを活用するにあたって基盤を作る動きが増えてくるのは当然の成り行きだ。そうなれば次は「データや基盤はあるが利用者不在で整備はされていない」ケースがどんどんと出てくるだろう。これは基盤がエンジニアリングだけで完結できるように見えてしまうことが原因だと考えられる。

そうすると今以上に「データ分析する人は〇〇しないとならない」という話が増えてくることになる。〇〇には社内調整だけでなく他の人が使うためのダッシュボードやデータマートの設計と作成、アドホックな抽出、データの品質管理といった整備の各仕事が言葉だけ変えながら度々出てくるようになりそうだ。とはいえ言うことは同じで「それはデータを分析する人の役割ではない」である。

今回の話と逸れるのでこれ以上は深くは触れないが、基盤作りにはバランスが必要という話は以前に発表したスライドに簡単にまとめてある。


「データサイエンティスト」という名称の問題

冒頭に「この手の話がややこしくなるのは多くの人が「データサイエンティスト」がどのような役割を担っているかを定義をしないからだ」と書いた。非常に新しい職名であるため多少の混乱があるのは仕方ないとは思う。しかし「データサイエンティスト」の場合は混乱している理由が「新しいから」では済まない事情がある。

日本では「データを活用して意思決定に結びつける」のはごく最近盛り上がったように見える。しかし本家のアメリカでは先にデータを使う文化があった。その上で近年データ量の巨大化と技術の発展があり、その結果大規模データを扱うことに長けた人として「データサイエンティスト」という新しい役割が出てきたと考えられる。

一方で日本では基盤も無い、整備もしていない、それ以前にデータを使う文化が無い。前段を全部飛ばして土台の無いところに特定の技術の専門家である「データサイエンティスト」の名前だけが入ってきてバズワード化した。結果、名前だけが独り歩きして実態が伴っていない。

だから「データサイエンティスト」は云々になるとまず論者それぞれの定義が違う。しかも定義が違うことの共有も無くそれぞれが話す。正解も無いので収拾がつかない。ここ数年同じ話題が定期的に繰り返される所以だろう。

「社内調整」をやらずに「分析」に特化したい人の選択肢

ビジネスの実務で「分析」に特化したければ選択肢はただ1つで「データエンジニアやデータアーキテクト(データ整備人)を多く抱え、すでにデータ基盤が整っている企業に入る」である。

ただし、このような企業ではすでに大学院で専門知識を学び、さらに数年の実務経験を経ている人達がいる。少なくとも同等の知識があり同じレベルでコミュニケーションができなければ参画は難しい。それ以上(?)に、「採用されるためのコミュニケーションとアピール」という全く別のスキルが必要だ。

よくわからない「職名」で話すよりも「求められている役割は何か」を考えよう

話題に乗っかって軽く書くつもりだったのに気づいたら随分長くなってしまった。

その時の状況と自分のスキルや希望が合わないのであれば、足りない部分を他の誰かに埋めてもらうか、自分でやるかだ。そうでなければ望みがかなう場所へ移動することだってできる。

言いたいことはつまり「職名はどうでもいいのでその時に何が求められているかから考えよう」である。

人気のある記事

HOME > 意思決定と分析のプロセス > データサイエンティストには社内調整が必要なのか