データ分析プロセスを組織の中でどう役割分担したらいいのかを考えてみた
データ分析組織については理想のデータ分析組織とはどんな組織だろうかや最悪のデータ分析組織とはを書いてみたが、ではその組織の中でどのような役割分担が考えられるか、についても考えてみたい。
話の基 ...
その言葉から期待される内容と実際の意味の違いについて(分析編)・・・情報・データを選別する(5)
情報・データを収集する際に言葉の定義は重要だ。同じ言葉を使っていても、同じ意味で使っているとは限らないのに気が付かないことからくるコミュニケーションの失敗はよくあるが、データ分析に関する言葉につい ...
集計結果がおかしいと思った時のチェックリスト
データを準備して、ツールに投入して実行したら、予想していたのとは大分違う結果が出てきて戸惑う、なんてことは日常茶飯事だが、その際どうやって検証したらよいかについてまと ...
情報・データ収集を体系化する(目次だけ)
意思決定のためのデータ分析そのものがあまり語られていないこともありそれ以上に支える情報収集には目がいかないようだ。書籍や大学のデータサイエンス教育もきれいなデータが用意されてそこから話が ...
データ収集が失敗する理由とその対策
とりあえず目についた面白い情報やなんとなく役に立ちそうなニュースを集めるだけならばともかく、まじめに考えてみるとデータ収集は簡単なようで難しい。そこでデータ収集の失敗(つまり自分が過去にやらかしたこと)について ...
アンサンブル学習のブースティングとバギングの違いについて
ブースティングとバギングの区別がようやくつくようになってきた(気がする)がさらにそれぞれのアルゴリズムになるとまだ混乱する。というわけで、今のところの自分の認識を書いてみる。
アンサンブル学習 ...
「何を知りたいのか」がわからなければデータ分析は始まらない
データ分析プロセスの始まりは、何を差し置いても意思決定者が「何を知りたいのか」を決めることだ。目的無きデータ分析は無駄である。
そもそも目的が決まっていなければ何を ...
「データをいじくり回して何かわかった気になる症候群」から逃れる方法
目的無きデータ分析は無駄であるで
数字をいじくり回すのは楽しいので、気が付くとあっという間に時間が過ぎる。何かがわかった気にはなれるが、後には何も残らない。よほど意識して ...
相手のレベルと好みに合わせたアウトプットを作る
データ分析に限らず専門家は、「こちらは十分に説明した、理解できないのは向こうが悪い。後のことは知ったことではない」という態度を取りがち。よくよく聞いてみるとたしかに説明はしているのだが、専門 ...
データを受け取ったらチェックすること
データを手に入れたらすぐに前処理というとそうはいかない。データがきちんとしているか、チェックしなければならない。この工程をせずに先に進むと、後で抜けもれが発覚したり、どのよう ...