RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス SQL データサイエンスおすすめ教材紹介【Skill Stacks】

【教材紹介】10年戦えるデータ分析入門

投稿日:2022年1月16日 更新日:

何度でも言いたいことですが、データ分析をするための技術はSQLが一番良いです。
PythonやRよりも制限が少なく、ビッグデータを扱えるのはSQLです。
分析に触れる第一歩としてこの本はいかがでしょうか?

名称


10年戦えるデータ分析入門

著者

青木峰郎

概要

データ分析にはPythonやRという論調が多いですが、データサイエンス実務ではSQLの出番の方が多いのではないでしょうか。
テラバイト級データはSQLでは対応可能ですが、Pythonだけで分析をすることは困難です。

SQLでは技術的には様々な分析ができます。
本書では多種多様な分析の方法論を、実際に架空データを使いながら分析することでスキルの定着を図ります。

必要知識

パソコンの操作

得られるスキル

SQL, PostgreSQL, select, where, order_by, group_by, join, window関数, DWH, バッチ処理

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンス, SQL, データサイエンスおすすめ教材紹介【Skill Stacks】

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【教材紹介】戦略的データサイエンス入門

ビジネスサイド(経営・営業・人事やエンジニアリングマネージャーなど)のあなたが1冊でデータサイエンスの概要を理解したい。 そんな時にはこの1冊でOK、分からない単語が出てくれば辞書としても使えるこの一 …

[Python] 機械学習での変数選択自動化(SVRを例に)

今回、会社のコンペで255というとんでもない量の変数を扱うことになりました。 価格予想を行うコンペです。 今回のデータのおさらい データ量は1500程度。8:2で分けると検証データが300しかないすご …

Pandas DataFrameでの表示列・行をすべて表示する(表示制限を解除する)

Jupyter NotebookでPandasのDataFrameを表示する際、行数・列数が多すぎると省略されてしまう場合があります。 制限を解除しましょう。 pd.set_option(‘displ …

[Meisyo] Viewは不要!SQL処理高速化方法

今回の問題は、対戦成績をデータ分析用に選手対選手で個別に保存していたことから始まります。 選手個人の総合成績をView処理で出力しまいした。 ただ・・・インデックス等がないのでめっちゃ計算時間が掛かる …

Skill Stacksの作成にあたって

Skill Stacksを書いている理由は、本をはじめとした教材の紹介サイトを作ろうと思っており、それが実際に求められていそうかを確認するためのテストマーケティング的な位置づけです。 「なぜ必要か?」 …