RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス

分析スキルも大事だけど、思考法の方が大事だよっていう話

投稿日:

データサイエンス関連の仕事をしていて思うのは、

分析スキルも大事だけど、思考法の方が大事だよっていう話です。

最近、会社で教育・OJT関連の業務をしていて切に思うので、つらつらと書いていきます。

まず第一に、スキルは大事です。

大事ですが・・・記憶力のいいひとには、スキルは割と簡単に身に付きます。
特に簡易的な解説書がある分野に関しては、すごく早いスピードで身に付きます。
ただ、そこには価値があるのだろうかと思うことが多いのです。

正しい目標設定がなければ、事業は、仕事は上手く行きません

その目標設定ができる、自分なりの思考方法を持っている人が少ないなと思います。
持っていなければ過去の焼き直ししかできないので。

もちろん、思考法は確度の高い正解を求めることができますが、唯一絶対の答えを示すことはできないです。失敗は当たり前です。

目標設定ができた上で、分析スキルが活躍します。
あくまで分析スキルは、目的が上手くハマったときにしか生きません。
したがって、思考法を鍛えたいよねという話を良くしています。
あとは、その事業の内容を理解していないと話にならないよねとも。

例えば、ソーシャルゲーム業界の案件で、あるゲームの売り上げを伸ばしたいとします。

自然言語処理でレビューサイトの出現する言葉の傾向を見て、
良いレビュー群はさらに伸ばしていくべきポイント、悪いレビュー群は改修すべきポイントと仮定します。

ただし、分析の前にゲーム内容を確認していません。
さて、どのような分析結果になるのでしょうか?



予想するに、当たり前の結果しか出てこないとなるでしょう。
しかも、施策に反映しても売り上げに良い影響がある確率は非常に低いです。

なぜなら、売り上げとレビューが関連するという前提が正しいのかどうかわからないです。

細かく指摘をすると、以下のように様々な前提を検証していない中で、自然言語処理を使うことが目的になっているからです。
・サービス(ここで言うゲーム)内容を把握しておらず、コメントが事実かどうかが分からない。
・レビューは具体的な改修ポイントを言っていないことが多く、あくまで1プレイヤーの感覚であることが多い。
・自由文で書かれているため、評価が非常に難しい。英語では皮肉が割と多い。

なぜその内容をするのか、その手法でなければならない理由は何かという思考法がないんですよね。

そのため、スキルより、思考法を鍛えたいですねという結論になります。

思考法を鍛える方法は割と簡単で、分かっている人に対して壁打ちをすることです。
色々な本はありますし、学ぶのは難しくありません。

もちろん、最初は思考が上手く行かないので、自分の思考法が否定されます。
そこで自分を否定されたと思う人が多いんですよね。

ここが大きな壁です。

ただのスキルチェックをして、間違いを訂正しているだけなのに。
エンジニアで言うなら、このコードはこう書いたらバグ出ないよね?と言ってるだけです。

ただ、思考法はスポーツとよく似ていて、
頭(体)になじませる間は習得状況が分かり辛いという分析スキルとは大きな違いがあります。

意識しなくてもできるレベルを目指している思考法と、
本を見ても何でもいいから、とりあえず再現ができればいい分析スキルと習得難易度は違います。
その前提を理解してからすると、挫折しにくいはずです!

思考法の勉強、始めてみませんか?

-データサイエンス

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

ゲームデータで学ぶSQL(初級編)

近年のデータサイエンスブームをきっかけに「SQLを学びたい」と思った方へ。 そう思ったところで、壁になってくるのは実データの入手です。 私は職業としてデータサイエンス関連の業務に従事していますが、キレ …

[Meisyo] 練習の不均衡是正

練習に不均衡が生じているので、アップデートで改善します。 ちなみに練習の方法自体を変更しようと思っています。 すぐには実装しません。(案が固まっていないです) 基本的に平均が150より大幅に高い(また …

[Meisyo]練習難易度の不均衡是正への分析的アプローチ2

[Meisyo]練習難易度の不均衡是正への分析的アプローチから早3か月。 「練習ごとに難易度が違いすぎるんですけど!!」という不満は少しは解消されたかなー・・・ 効果測定してないのにわかるの?エスパー …

[社内コンペ] 細胞画像認識

これは何? 某社で行われている社内コンペのメモです。私の備忘録でもあります。 結果:2位 精度:68.3% 120枚をクラス1~3で各40枚としていました。 ただし、その数値に合わせに行こうとすること …

[Python]決定木(CHAID)のテストと可視化

意思決定のために使用される決定木分析 Scikit-learnでの決定木にはCART(指標:giniまたはentropy)他が採用されています。 CARTは下記の2点を含め、さまざまな理由から使われて …

筆者情報

名将と呼ばれた者達(Meisyo)公式ブログ
ゆっくりとした時間間隔で進行する高校野球チーム育成シミュレーションゲーム。
個性豊かな選手たちを育成し、監督としてチームを優勝に導こう!

ご連絡はTwitter(R@おいす)でしていただけると、すぐ反応できます。

メインサイト:Rの考え方

気に入ったらクリックしてね!