RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス データサイエンスおすすめ教材紹介【Skill Stacks】

【教材紹介】データ解釈学入門

投稿日:2022年1月11日 更新日:

「データ分析の初心者はこれを読むべし」と思う本です。なぜなら、データの解釈・観測をはじめデータサイエンスは難しい事柄が多く、かつビジネスで分析をする際に、初心者をはじめ分析者全員が陥りやすい罠があるからです。今回は、それらの落とし穴を正しく考慮するための理解しやすい書籍を紹介します。

名称


データ解釈学

著者

江崎貴裕

概要

データサイエンスは難しいです。特に、簡単に思われがちなデータの観測、収集、抽出、操作について説明されている書籍は多くはありません。その時点でその分析は無価値・・・というより、有害になりえます。
今回の書籍はそれらの基礎的知識をはじめ、分析とは何なのか、どう再現性(科学的姿勢)を担保していくのかを解説しています。

必要知識

なし

得られるスキル

測定, 誤差の分解, バイアス, 交絡因子, 因果関係, サンプリング, 記述統計量, 分布, 多変量データ, 信頼性, 再現性

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンス, データサイエンスおすすめ教材紹介【Skill Stacks】

執筆者:


  1. […] 【教材紹介】データ解釈学入門 […]

comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

[Python]グリッドサーチを軽量化し、チューニングしたパラメータも反映する機構を作る

パラメータチューニング方法であるグリッドサーチ、 確かに自動で実行してくれて、すごく便利なのですが問題点があります。 めっちゃ時間がかかる もし、下記のパラメータ設定のモノを全てグリッドサーチしようと …

Pandas DataFrameでの表示列・行をすべて表示する(表示制限を解除する)

Jupyter NotebookでPandasのDataFrameを表示する際、行数・列数が多すぎると省略されてしまう場合があります。 制限を解除しましょう。 pd.set_option(‘displ …

[社内コンペ] 細胞画像認識

これは何? 某社で行われている社内コンペのメモです。私の備忘録でもあります。 結果:2位 精度:68.3% 120枚をクラス1~3で各40枚としていました。 ただし、その数値に合わせに行こうとすること …

[Python] 機械学習での変数選択自動化(SVRを例に)

今回、会社のコンペで255というとんでもない量の変数を扱うことになりました。 価格予想を行うコンペです。 今回のデータのおさらい データ量は1500程度。8:2で分けると検証データが300しかないすご …

スッキリわかるSQL入門 第2版 題材A 問75

回答が非常に長い気がするのはなぜだろうか。 /* 自己結合を用いた場合 */ SELECT DISTINCT K1.名義, K1.口座番号, K1.種別, K1.残高, K1.更新日 FROM 口座 …