データサイエンスや機械学習のスクールが教えているのはサッカーで言うコーナーキック。必要だけれどもそれだけでは《まったく》足りない

「スクールで教えていることは実務を構成するごく一部であること」を教えてもらった人はどれぐらいいるのだろうか

ここ最近データサイエンスやプログラミングを勉強する環境が増えているのは非常に喜ばしいことであり、とても羨ましくも思う。しかし、乱立するスクールで学んだ人が実務で活躍できているのかというと疑問符が付く。

その原因の1つに、「スクールで教えていることは実務を構成するごく一部である」が、そのことがきちんと認識されていないからではと考えている。

この認識が無いと企業側と学習者の間に様々なギャップが生まれてしまうのだが、ではどういったことがスクールで教えられていないのかを具体的に挙げていこう。

スクールで教えていないこと

ざっとカリキュラムを見る限り、以下のような問題への対処法がきちんとカリキュラムに組み込まれているスクールは見当たらない。講座の中で雑談レベルで教えているかもしれないが、それではあまり意味がない。

もしアナリティクスディレクターの役割を他の誰かが担ってくれればとりあえずコードがかけるだけでも最低限の仕事にはできるかもしれないが、データ分析に関わる人が誰もいないようであれば自分でやらざるを得ない。

未経験者にいきなり座学で教えてどれほどの効果が見込めるのか、という問題はあるにしても、まったく知らずにこれらが抜け落ちるとよほど良い環境でない限りまともに仕事が出来なくなるということは教えてもいいのではないか。

課題をデータサイエンスの問題に変換し、解決するための適切な方法を選ぶ

課題があり、それをどのようにデータサイエンスや機械学習での解決に落とし込むのかを考える力はいくらコードを書いても身につかない。それもそのはずで全く別のスキルだからだ。

理論を学んだりプログラミングを覚えたてだったりするととにかくより難しい手法を使いたがるが、それは自己満足に過ぎない。慣れないプログラミングで半日かかるなら、Excelのクロス集計で8割ぐらいの結果を10分で出す方が有用なこともある。

ましてや経験が少ない人を雇う企業であればデータ分析に対してまだまだ取り組んだばかりであろうから、そのケースの方がはるかに多い。求められているのは課題に対して答える力であり、コードを書く力ではないのだ。

データを集めてくる

必要なデータが必要なだけ用意されているのがスクールだが、必要なデータが必要なだけ集まることはないので自分で集めてくる必要があるのが実務だ。

技術的な問題だけならまだしも、それ以外にも部署の壁、会社の壁、セキュリティの壁、リテラシーの壁を乗り越えてようやく手に入れたデータが足りなければ最初に考えていた手法が使えないかもしれないし、多すぎて前処理に時間がとんでもなくかかればデータがあってもやっぱり使えない。

また、環境を整えることにも参加しなければならない。構築はエンジニアの仕事であっても、どういった仕組みを作るか、どんなデータにしておけば使いやすいかを考えるのは分析者の仕事だ。

前処理を行う

これもきれいなデータがそのまま使えるように存在しているわけもなく、使えるように自分で前処理を行わなければならない。

前処理が8割や9割というのが当たり前であるが、スクールで教えられるのは前処理が終わった後にどう集計やモデリングをするかという話ばかりだ。

これもモデルをどう作るかだけしか知らないとデータの加工ができなかったりひどく時間を取られることがある。データサイエンスの教科書には値にカンマが入ったCSVファイルの扱い方は書いていないのだ。

解釈と説明

機械学習にまったく知識も興味もない人に説明をする機会も多い。時には「人工知能だったらなんでもできるんでしょ。それができないのはお前の能力不足」なんて言われることがあるとかないとか。

そこまで言われなくても上司やクライアントに説明することは会社に所属する以上は必須であることは当然として、問題なのはデータ分析リテラシーがある人がほどんといないことだ。

スクールなら知識はともかく少なくとも興味を持っている人しかいないだろうが、世の中全体ではデータサイエンスに興味がある人など圧倒的に少数派なのである。

その他いろいろ

データ量によって変わる実行時間を現実的な範囲に収めるとか、データの生成がおかしければ原因を突き止めて直しにいくとか、使いたいツールを入れるのに調整と交渉する(Pythonですら対象になることも)とか、言い出したらきりがない細かいことはたくさんある。

スクールで教えているのはサッカーで例えるとコーナーキック

スクールで教えているのは主にコードを書く部分と多少の基礎となる理論であるが、それらは実務上の問題における一部の話であるということがこれでわかるだろう。

サッカーではゲームの大半はボールに触ることなく走っているわけだが、コーナーキックからのゴールシーンだけ見せて「このスクールであなたもゴールを量産できる!」という広告はサッカーをまったく知らない人には魅力的に見えるのかもしれないが、それだけではレギュラーにはなれない。

コーナーキックならボールはフィールドに置かれているし相手も直接は邪魔をしてこない。ゴールが決まるように正確なボールをけることが出来ればそれで良い(それが簡単だという意味ではない)。

パスやドリブルやポジショニングといった話はコーナーキックには直接は影響ないし、ましてや基礎体力など考慮する必要もない。

しかし、サッカー未経験者がコーナーキックを蹴るのが得意だからとサッカー選手になれると勘違いしたら悲劇だし、それだけで入れるのは決してプロチームではなく、草サッカーチームでしかない。

練習と実務との違い

また、スクールで学ぶことはいわば練習であり、実務は試合に例えることができる。ということは、

  • 対戦相手がいる
  • 監督・スタッフ・チームメイトがいる
  • コンディション
  • 疲労
  • 負けることへのプレッシャー
  • 時間のプレッシャー

といったまた別の問題や状況にも対処しなければならない。詳しくは大学や独学でデータ分析の勉強をしただけだと実務で使えない理由に書いた。

責任は当人にある

繰り返すが「スクールで教えていることは実務を構成するごく一部である」ので、どこかで少し学んだからといってそれで第一線でいきなり活躍できるなど思うのは非常に危険だ。

とりあえずスクールに行けば良いというのはデータ分析者が良く馬鹿にしている「データがあれば後はうまくやってくれるんでしょ」と同じで、そう思わせようとしているスクールはそれだけでも選択肢から即座に外すべきであるが、スクールは技術を教えるサービスを提供しているだけなのでスクールが教えないことに文句を言うのもまた筋違いだ。

うまいスクールの使い方

スクールが全て無駄かと言えばそんなことは無く、使う側が主体的に自分の目的に合わせて選べば有用になるはずだ。ではどうしたらいいのかという話はまた別に書くことにしよう。