RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンスおすすめ教材紹介【Skill Stacks】 データサイエンス SQL

【教材紹介】10年戦えるデータ分析入門

投稿日:2022年1月16日 更新日:

何度でも言いたいことですが、データ分析をするための技術はSQLが一番良いです。
PythonやRよりも制限が少なく、ビッグデータを扱えるのはSQLです。
分析に触れる第一歩としてこの本はいかがでしょうか?

名称


10年戦えるデータ分析入門

著者

青木峰郎

概要

データ分析にはPythonやRという論調が多いですが、データサイエンス実務ではSQLの出番の方が多いのではないでしょうか。
テラバイト級データはSQLでは対応可能ですが、Pythonだけで分析をすることは困難です。

SQLでは技術的には様々な分析ができます。
本書では多種多様な分析の方法論を、実際に架空データを使いながら分析することでスキルの定着を図ります。

必要知識

パソコンの操作

得られるスキル

SQL, PostgreSQL, select, where, order_by, group_by, join, window関数, DWH, バッチ処理

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンスおすすめ教材紹介【Skill Stacks】, データサイエンス, SQL

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

決定木分析(Python CHAID)を解釈する

意思決定のために使用される決定木分析 Scikit-learnでの決定木にはCART(指標:giniまたはentropy)他が採用されています。 CARTは下記の2点を含め、さまざまな理由から使われて …

野球ゲームデータで遊ぶデータサイエンス(正規分布の検定編)

名将と呼ばれた者達のデータを使って、データサイエンスを学んでみましょう! 生きた&整えられたデータは中々公開されていないので、今回の野球ゲームのデータは分析に適していると思われます。もちろん、Kagg …

【教材紹介】異端の統計学ベイズ

今回はベイズ統計学の歴史書です。今でこそ、頻度論の統計学とベイズ統計学などをひとまとめにして統計学と言われていますが、そこに至るまでに何があったのか?そちらを詳細に記述する500ページ越えの大作です。 …

【Meisyo】ステータスバランス調整

はじめに Meisyo+ お知らせ ステータスバランス調整予定のお知らせの詳細を記載します。 下記の順番で対処を行いました。 ②本塁打率が高すぎる。 ①打率平均が低すぎる。 ③長打(二塁打・三塁打)が …

【教材紹介】データ解釈学入門

「データ分析の初心者はこれを読むべし」と思う本です。なぜなら、データの解釈・観測をはじめデータサイエンスは難しい事柄が多く、かつビジネスで分析をする際に、初心者をはじめ分析者全員が陥りやすい罠があるか …