RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス データサイエンスおすすめ教材紹介【Skill Stacks】

【教材紹介】データ解釈学入門

投稿日:2022年1月11日 更新日:

「データ分析の初心者はこれを読むべし」と思う本です。なぜなら、データの解釈・観測をはじめデータサイエンスは難しい事柄が多く、かつビジネスで分析をする際に、初心者をはじめ分析者全員が陥りやすい罠があるからです。今回は、それらの落とし穴を正しく考慮するための理解しやすい書籍を紹介します。

名称


データ解釈学

著者

江崎貴裕

概要

データサイエンスは難しいです。特に、簡単に思われがちなデータの観測、収集、抽出、操作について説明されている書籍は多くはありません。その時点でその分析は無価値・・・というより、有害になりえます。
今回の書籍はそれらの基礎的知識をはじめ、分析とは何なのか、どう再現性(科学的姿勢)を担保していくのかを解説しています。

必要知識

なし

得られるスキル

測定, 誤差の分解, バイアス, 交絡因子, 因果関係, サンプリング, 記述統計量, 分布, 多変量データ, 信頼性, 再現性

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンス, データサイエンスおすすめ教材紹介【Skill Stacks】

執筆者:


  1. […] 【教材紹介】データ解釈学入門 […]

comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【教材紹介】XAI(説明可能なAI)

今日では、さまざまなデータが収集され、判断の自動化や数値予測の高度化が行われています。 そのAIの判断、どう説明すればいいかわかりますか? エクセルのようなテーブルデータだけでなく、画像やテキストに対 …

【教材紹介】異端の統計学ベイズ

今回はベイズ統計学の歴史書です。今でこそ、頻度論の統計学とベイズ統計学などをひとまとめにして統計学と言われていますが、そこに至るまでに何があったのか?そちらを詳細に記述する500ページ越えの大作です。 …

Pandas DataFrameでの表示列・行をすべて表示する(表示制限を解除する)

Jupyter NotebookでPandasのDataFrameを表示する際、行数・列数が多すぎると省略されてしまう場合があります。 制限を解除しましょう。 pd.set_option(‘displ …

[Python] 機械学習での変数選択自動化(SVRを例に)

今回、会社のコンペで255というとんでもない量の変数を扱うことになりました。 価格予想を行うコンペです。 今回のデータのおさらい データ量は1500程度。8:2で分けると検証データが300しかないすご …

[社内コンペ] 細胞画像認識

これは何? 某社で行われている社内コンペのメモです。私の備忘録でもあります。 結果:2位 精度:68.3% 120枚をクラス1~3で各40枚としていました。 ただし、その数値に合わせに行こうとすること …