ラバーダッキングするブログ

脳みそ垂れ流しブログ

分析って難しいな?

どうも。最近データサイエンティストとして働いている人です。

最近、働いていてちょっともやもやすることがあって、これについて軽いコーチングを受けて気づきがいくつかあったので、それをまとめる。

私は、データサイエンティストとして最近、分析及び資料化・発表という仕事をしている。この仕事が思うようにこなせていないというのが、もやもやしていることだ。

ここまで聞くと、分析が難しいなら勉強するしかないじゃないか、と思うかもしれないが、実は行っている分析はかなり簡単なもので、問題なのはそのあとの資料化・発表の部分にあるのだ。

自分的には、あるべき手順を踏めていると思っている。どういうことかというと、簡単な分析とテクニカルな分析で、行った分析を依頼主に理解してもらうのはどちらが簡単かというと、もちろん前者なはずであり、難しい分析でも相手に理解してもらわないと価値がないことは自明なので、簡単な分析で修業を積むことに何ら不思議な点はないということだ。

そればかりではない。データサイエンスをやるうえで、このテーマは何よりも大事な部分であるはずなのだ。データは、0と1、電気信号の集合でしかない。これを分析することをデータサイエンティストに依頼する企業の取締役は、ここから知識を得たいがために依頼するし、その知識から次の行動を決められるならそれは人間の肌感より精度が高く利益の出る行動になるはずだから、予算をとるのだ。売り上げを伸ばしたいとか、コストを削減したいとか、あるいはどこから手を付けたら利益が伸びるのかわからないという問題意識から、初めて分析が依頼される。

で、ここが非常に難しいのだ。明確なゴールがある場合は別なのだが、「こんなことが知りたい」という、クライアントサイドのモチベーションがない分析というのも、無いわけではないし、そもそもそれがあったところで、どんな分析をすればその答えが出るのかを考えるのはデータサイエンティストの仕事だ。特にクライアントがゴールを指定しない場合、ゴール設定も含めて分析者が考える必要がある。これが難しさの原因だ。

基本的に、分析の結果「つまりこんなアクションをするといいですよ」という結論が出るのが、理想形である。 例えば、「広告をこれくらいの頻度で出すとこれくらい購買頻度が上がるから、 広告を増やしましょう」とか、クライアントがコントロールできる何かが、利益に影響を与える関係である場合が、一番わかりやすい。 しかし現実はそんなには甘くなく、「こんな性質の顧客が利益の大部分を占めているから、そういう顧客を増やすのがいい目標ではないか」という程度のものになる。 だが、ここで問題になるのは、じゃあその目標をどうやってクリアするか、あるいはできるのかは私には少なくとも直感できないということだ。そして、直感できなくてしかるべきなのだとも思う。

これは、クライアントがどういう施策を今まで打ってきたのか、どういう場面では普通どういう経営判断をするのか、直接的ではなく間接的にコントロールすることのできる変数はどこまでなのか、どういうことをするのにどれだけコストがかかるものなのか、ということを理解していないと判断ができない。間接的に利益をコントロールできるというなら、最初から分析は必要ない。

つまり、自分の依頼されている分析から得られた結論が、経営判断に使えるのか使えないのかを、自分で資料を見返したときに理解できないのだ。 こんなでいいのかな?と思っても、部長にはOKをもらったり、その逆もあったりする。そこを判断するためのクライアントのやっているビジネスの知識も、データサイエンティストとしての知識も。恐らく足りていない。判断するための材料が足りないのだ。未知数に対して式の数が足りていない方程式のようになっている。 毎回、悩みに悩みぬいて、資料を作って、何回かのリテイクを受けているが、ぶっちゃけ”確かにこれはクライアントにとって重要で、アクションに繋がる知識だ!”と実感をできていない。 ”あ~、確かにそうかも”くらいの理解度だ。 こんな状態でまともに独り立ちできるとは思えない。

もしかしたら、これは経験とかセンスとか、そういう次元の話で、多くの人間が乗り越えてきた壁なのかもしれない。だがそれでは根本的解決にはならない。属人的すぎる。情報系の世界で一番忌み嫌うべき状態だ。個人的には、これを形式的な知識に落とし込みたいと考える。

もちろんすべてではない。どんな業種のどんな問題に対する分析にも、対応できるようなフレームワーク的なものがあるとは到底思えない。だが、根本的な部分をある程度ならその枠組みに沿って考えることができるのなら、色々な分析において、とくに初心者にとっては、どんな論理の順序で結論を出せば、価値のある分析になるのかを自力で導き出せるようになるはずなのだ。”こういう時、こうするのが普通”みたいな部分を、それがなぜ普通なのかを導き出せれば、 そういった細かい定理みたいなものが頭の中になくてもある程度のものがアウトプットできるようになるはずだし、定理の存在する意味も理解できるだろうから、そこから、自分の中に”こういう時はこうする”というルールを作れるようになると思う。

ここの回転が速くなれば、今でこそ外部のクライアントから納期を設定されて行っている分析だが、早ければ早いほど良いような自社プロダクトの分析をする場合は、段違いのバリューとなるはずだ。

じゃあどうやってこれをできるようにするのか。これはもう「過去に行った、”正解”であったはずの論理の流れを追う」ということくらいしかないだろう。 ひとまずはここから手を付けることとします。