重要なお知らせ
【noteへ移行します】最新記事はnoteにて。フォローお願いします!

データ分析にまつわるカタカナ言葉を日本語で文章で表現したらどうなるのだろう

2020年5月23日

いろいろなカタカナ言葉を自分がどう考えているのかを言葉できちんと表現してみよう

カタカナ言葉というのは便利でもあるが、一方でその意味をきちんと捉えずあいまいなままで話を進めてしまえるのは欠点だ。話していてもいまいちかみ合わず、原因を探ると言葉の定義が違っていた、ということが頻繁におきる。

そこで、データ分析にまつわるカタカナ言葉を自分がどう捉えているかを日本語で具体的に表現するとしたらどうなるかを書いてみた。併せて世の中でよく聞く使われ方についても考えてみる。

「情報」に関する言葉を文章で書いてみる

「データサイエンティスト」など職種についての話の方がみんな興味があるだろうことはわかっているのだが、その言葉を文章で書くためには先に「情報」に関する言葉、つまり「インテリジェンス」と「インフォメーション」と「データ」について書かないとならない。

データサイエンティストやデータアナリスト、リサーチャーといった職種は後半にあるが前半を踏まえて書いているのでわからなくなったら戻ってきてほしい。

さて、「情報」と日本語では同じになっているが、インテリジェンスと(インフォメーションと)データには明確な違いがあるので以前にインテリジェンスとインフォメーションとデータと情報の違いでも書いたが改めてここでまとめ直してみる。

なおこのあたりの考え方については『インテリジェンス―機密から政策へ 』などの書籍からの影響が大きい(そのうちちゃんと紹介しようとずっと思っているがまだ手がでていない)。

データ

あえて書くなら「情報のうち観測された事象そのもの」とでも言おうか。あるいは「情報のうち特定の目的に対する意思決定のために分析と洞察を加えたもの(=インテリジェンス。詳しくは後述)ではないもの」でもいいかもしれない。

いくつかの重要なことを挙げると

  • 特定の目的に対するに対する分析と洞察がされているかであり、それ以外は全てデータ
  • デジタルかどうかは関係ない。紙でも記憶でもどこにどのような形式で残っているかは問わない
  • 数値かどうかも関係ない。文章でも画像でも音声でも全て含む

と考えている。

データというと「データベースに入っている主に数値」と使っている人も多いので気を付けてはいるのだがしばしば認識の違いを忘れて話がずれる。ちなみに、そこに入らない「データ」はまったく別のものとして扱っているのだろうか。

インフォメーション

「情報のうち特定の目的に対する意思決定のために分析と洞察を加えたもの(=インテリジェンス)ではないもの」。つまりはデータと同じ。

データとインフォメーションを分ける流儀もあるが、このブログでは考慮していない。理由としては「特定の目的に対する分析と洞察」があるか無いかが最も大きな違いであると考えているからだ。

インテリジェンス

「情報のうち特定の目的に対する意思決定のために分析と洞察を加えたもの」。「データ分析」の目的はつまりはこのインテリジェンスを作ることであり、理論もモデリングも可視化もプログラミングもすべてはそのための手段。

データ分析

「情報のうち特定の目的に対する意思決定のために分析と洞察を加えたもの(=インテリジェンス)を作り出す過程」。この過程の詳細はデータ分析プロセスの概要に書いている。

”特定の目的に対する意思決定のため”になっていない汎用的な情報は別の誰かが意思決定するための「データ」を作っていると捉えている。ただし同じ情報が立場を変えると「インテリジェンス」にもなりえる。

例えば「今日は一日大雨が降る」という情報は「あとで近所のスーパーに買い物に行くのに傘が必要か」には十分であるが、客足を予測するのには「いつまで、どのぐらい」も必要であり意思決定には不十分(それだけでも意思決定することも可能なのでこれも場合による)なので「データ」と考えるのが良いだろう。

次に”意思決定のため”である。意思決定が無く分析・洞察だけまでは不十分ということだ。

さらに”洞察を加えたもの”である。データがあってそれをどうにかする(手法の適用、プログラミング、可視化など)を「分析」と指すこともあるがこれは部分的な行為なので「分析」ではなく「処理」と呼ぶのががいいのではないかという提案をしているのだが反響はいまいち。

最後に”過程”である。もっと言うと「目的の決定から始まる過程」である。目的を決めずに何となくデータを集めていじくっても良いことはない。あちこちで繰り返しているが、目的無きデータ分析は無駄である

なお集計や可視化が全体一部だからそれが簡単だ、などと言っているわけではない。全体の一部でありそれだけでは成立しないということだ。

またインテリジェンス関連の書籍などでは「インテリジェンスサイクル」と呼ばれていることが多いのだが「インテリジェンス」の認知度が低すぎるために「データ分析」と書き換えている。

という話を踏まえて、次に職種についての話をしよう。

職種のカタカナ言葉を文章で説明するとしたら

前置きが長くなったがここからが本題。データ分析に関わる職種はいろいろあるが、まずは一番大きな枠で捉えているデータアナリストから初めていこう。

アナリスト:他の人の意思決定のために分析と洞察を加えた情報(=インテリジェンス)を作る人

データ分析そのものは全ての人が行っているが、その中でも”他の人の意思決定のために”分析を行うのがアナリスト。

中立性が大事なので具体的にどうするべきかの提案はしない。そこには明確な線引きがあるので企画に少しでも入り込むならマーケターなどと表現する方が適切なのだが、そのうち整理されてくるのかは不透明。

ちなみに外国のDataAnalystを調べてみても、施策の提案や実行のことに触れている企業は見当たらない(Googleで「dataanalyst job」「dataanalyst role」で検索して出てきた上位を自動翻訳で読んだ限りなので見かけないだけかもしれない)。

特定の分野に特化した場合は〇〇アナリストと区別することもある。

なおここでいう「アナリスト」はこの後に出てくる様々な職種を全て含めた一番広い概念ではあるがデータ分析関連の職種の中でも最も需要が少なく、実際にほとんど存在しないと考えている。

ではアナリストと呼ばれている人たちが何をしているかというと、「分析の割合が多めのコンサルタントやマーケター」か「エンジニアとアナリストの間で兵站を担う「データアーキテクト(データ整備人)」」でつまり「アナリスト」の業界はほとんど存在しない、というのが自分の見解だ。

このあたりの事情はこのスライドの前後を参考のこと。

データアナリスト:アナリストのうち意思決定のために分析と洞察を加えた情報を作る人のうち定量分析を主とする人

「データ」は上述の通り非常に広い意味なので「アナリスト」と実質同じ意味として捉えてはいるのだが、もともと「アナリスト」の存在感が薄い上に最近データアナリストを名乗っている人はビックデータ以降の人達が多く数値とかプログラミングのイメージが非常に強くなっているため定量的な分析をする人として使うことが多い。

が、定量と定性は手段の違いなので別々に考えることはあまり意味がないと思っていることもあり、多分自分でも話しているうちに混乱している気がするので気を付けたい。

手段が違うだけで後述のリサーチャーとは本質的に同じ役割。でもそのうち境目が消えていくのかは謎。

分析と洞察が無く「別の誰かが分析するための情報(=データないしはインフォメーション)を提供する人」ならデータ分析プロセスの外の話であり、データアーキテクト(データ整備人)の仕事の一部。もちろん両方やっている人もいるが名前はともかくアナリストとは区別して考えた方がいいだろう。

データサイエンティスト:データアナリストのうちデジタルで大量のデータを使った高度な分析に特化した人

どこからを大量とか高度と呼ぶかは難しいが、目安としてはこの記事2020年版:実務の現場で求められるデータサイエンティスト・機械学習エンジニアのスキル要件でいうジュニアクラス+シニアのどこかに特化しているぐらいでないとわざわざ別の名前にする必要性を感じない。その場合はデータアナリストないしはコンサルタントやマーケターで良いと考えている。

データアナリストが居酒屋ならデータサイエンティストは〇〇料理とかパティシエのようにどこかに特化したというイメージがよいだろうか。もしかしたら特化したというよりは入り口からして別なのかもしれない。

近年の技術の発達により大量のデータ収集・活用が可能になったことから従来のデータアナリストと区別するために生まれた言葉だったと思われるが、日本ではそのあたりの文脈を全部すっ飛ばして名前だが一人歩きしているために「自炊しているから料理人」みたいな使われ方もされている。

データアナリストの中でも、なので「アナリスト」であることが前提なのだがそもそもアナリストの需要そのものが無いためデータサイエンティストを名乗っていてもアナリストとしての活動をしている人はデータアナリストに輪をかけて少ない。

データサイエンティストは実態としては機械学習エンジニアである場合が多いようで、この場合はそもそもデータ分析(=インテリジェンス)の話とは別に考えた方がいいのかもしれないと考えているがまだ結論は出ていない。

リサーチャー:アナリストのうち意思決定のために分析と洞察を加えた情報を作る人のうち定性分析を主とする人

ビジネスでは特にマーケティングリサーチャーと同一視されることが多いと思われるが、意思決定のための情報を作る人の中でも定性的な調査を中心とする人。特定の分野に特化した場合は〇〇リサーチャーと区別することもある。最近は機械学習などの論文をリサーチする人も増えているようだ。

集計だけではデータアナリストと呼べないように、インタビューやアンケートだけではリサーチャーと呼ぶのは不自然。

手段が違うだけで前述のデータアナリストとは本質的に同じ役割だが、リサーチャーというと主に定性的調査を指すイメージなので使い分けている。

UXリサーチャー:UX領域の意思決定のために分析と洞察を加えた情報を作る人

サービス全体のデザインに関わる(UX)意思決定のための情報を作る人の中でも定性的な調査に特化している人。と言いたいところだが、

  • UXってどこからどこまでのことだか不明瞭
  • やっていることが似ているように見えるのでマーケティングリサーチャーとの区別がつかない
  • リサーチャーという名前だけどUXの一部である(と自分は認識している)UIの改善は数値での検証もするはずだから定性的な分析に限らないし・・・

というわけでよくわからない。

人によって大分定義が違うと思われるが、データサイエンティストとわざわざ名前を付け替える必要が無いのと同じで大半は(マーケティング)リサーチャーでくくれそう。

よく使っているわりに整理できていなかったので反省している

自分でどう考えているかをまとめようとふと思い立って、軽く書いてみようと始めたら結構な量になってしまったが、いつも使っている言葉を自分も曖昧なままで使っているな、と反省。

もちろん現時点でそう考えている、という話なのでしばらく経ったら変わっていることは大いにありえる。

もしよければこれを読んだら自分もどう考えているかについても発信してみて欲しい。