RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス データサイエンスおすすめ教材紹介【Skill Stacks】

【教材紹介】データ解釈学入門

投稿日:2022年1月11日 更新日:

「データ分析の初心者はこれを読むべし」と思う本です。なぜなら、データの解釈・観測をはじめデータサイエンスは難しい事柄が多く、かつビジネスで分析をする際に、初心者をはじめ分析者全員が陥りやすい罠があるからです。今回は、それらの落とし穴を正しく考慮するための理解しやすい書籍を紹介します。

名称


データ解釈学

著者

江崎貴裕

概要

データサイエンスは難しいです。特に、簡単に思われがちなデータの観測、収集、抽出、操作について説明されている書籍は多くはありません。その時点でその分析は無価値・・・というより、有害になりえます。
今回の書籍はそれらの基礎的知識をはじめ、分析とは何なのか、どう再現性(科学的姿勢)を担保していくのかを解説しています。

必要知識

なし

得られるスキル

測定, 誤差の分解, バイアス, 交絡因子, 因果関係, サンプリング, 記述統計量, 分布, 多変量データ, 信頼性, 再現性

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンス, データサイエンスおすすめ教材紹介【Skill Stacks】

執筆者:


  1. […] 【教材紹介】データ解釈学入門 […]

comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【教材紹介】深層学習 2020年度春学期 · ニューヨーク大学データ・サイエンス・センター

米国大学のコンピューターサイエンスの講義を無料で、かつ日本語で公開されている教材がありましたので共有いたします。 名称 深層学習 DS-GA 1008 · 2020年度春学期 · ニューヨーク大学デー …

スッキリわかるSQL入門 第2版 題材A 問75

回答が非常に長い気がするのはなぜだろうか。 /* 自己結合を用いた場合 */ SELECT DISTINCT K1.名義, K1.口座番号, K1.種別, K1.残高, K1.更新日 FROM 口座 …

【教材紹介】機械学習を解釈する技術

多くの企業で導入されるようになってきた機械学習。 その機械の判断基準、本当にわかっていますか? 今回は、実務に利用するために最低限の技術として、変数(特徴量)の重要度や変数と予測値の関係性を求める方法 …

[Meisyo]パラメータバランス調整 ver 0.10(a)

パラメータバランスを調整します。 理由としては、ミートが強すぎるからです。 ミートが神の地位を手に入れて早・・・というより、Meisyoが最初からそうだった。 「ミートを上げれば即ち打てる」で、パワー …

[Kaggle] Titanic 約80% by ランダムフォレスト

実力不足感が否めませんが、Kaggleのチュートリアル的なTitanicにおいてランダムフォレストで正答率約80%を出せたのでコードを載せておきます。 Colaboratory 実施期間:2019/0 …