データ分析プロセス, 収集

分析の土台としての情報・データ収集も体系化したい

意思決定のためのデータ分析そのものがあまり語られていないこともありそれ以上に支える情報収集には目がいかないようだ。書籍や大学のデータサイエンス教育もきれいなデータが用意されてそこから話が ...

収集

データ収集の失敗を考える

とりあえず目についた面白い情報やなんとなく役に立ちそうなニュースを集めるだけならばともかく、まじめに考えてみるとデータ収集は簡単なようで難しい。そこでデータ収集の失敗(つまり自分が過去にやらかしたこと)について ...

伝達

やっても無駄になるのが大半だけど、やらないわけにいかない

「データ分析がいくら重要だと言ってもどうせ聞かないだろうから無駄」だとそのままにしてはやりたいこともできないし経験も積めない。揚句に業績が上がらずボーナスも出ない、ではどうしよう ...

分析

どっちがどっちで何しているんだっけ?

ブースティングとバギングの区別がようやくつくようになってきた(気がする)がさらにそれぞれのアルゴリズムになるとまだ混乱する。というわけで、今のところの自分の認識を書いてみる。

アンサンブル学習 ...

データ分析プロセス, 目的の決定

「何を知りたいのか」がわからなければデータ分析は始まらない

データ分析プロセスの始まりは、何を差し置いても意思決定者が「何を知りたいのか」を決めることだ。目的無きデータ分析は無駄である。

そもそも目的が決まっていなければ何を ...

データ分析プロセス, 分析

「データをいじくり回して何かわかった気になる症候群」

目的無きデータ分析は無駄であるで

数字をいじくり回すのは楽しいので、気が付くとあっという間に時間が過ぎる。何かがわかった気にはなれるが、後には何も残らない。よほど意識して ...

データ分析プロセス, 伝達

「理解できないのは向こうが悪いは」最悪の態度

データ分析に限らず専門家は、「こちらは十分に説明した、理解できないのは向こうが悪い。後のことは知ったことではない」という態度を取りがち。よくよく聞いてみるとたしかに説明はしているのだが、専門 ...

データ分析プロセス, 収集, 生産性

データは手に入れた。次に前処理・・・の前にデータを確認する。

データを手に入れたらすぐに前処理というとそうはいかない。データがきちんとしているか、チェックしなければならない。この工程をせずに先に進むと、後で抜けもれが発覚したり、どのよう ...

データ分析プロセス, 役割分担

「何が問題か」を考えるのは誰の仕事なのか

(アナリストとしての)データサイエンティスト・データアナリストの役割を考えるとき、何が問題であるかについても分析者が考える、としている場合があるが、これは必ずしも当たり前ではない。もしデータサイ ...

データ分析プロセス

「今あるデータで何かできないか」は選択肢を狭めるだけ

「今あるデータで何かできないか」と考える人は少なくない。そこにあるから使わなければもったいないとか、あわよくば利益が出たらうれしいとか、そうしたい気持ちはわかるのだが、そこはぐっと堪 ...