RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

データサイエンス SQL データサイエンスおすすめ教材紹介【Skill Stacks】

【教材紹介】10年戦えるデータ分析入門

投稿日:2022年1月16日 更新日:

何度でも言いたいことですが、データ分析をするための技術はSQLが一番良いです。
PythonやRよりも制限が少なく、ビッグデータを扱えるのはSQLです。
分析に触れる第一歩としてこの本はいかがでしょうか?

名称


10年戦えるデータ分析入門

著者

青木峰郎

概要

データ分析にはPythonやRという論調が多いですが、データサイエンス実務ではSQLの出番の方が多いのではないでしょうか。
テラバイト級データはSQLでは対応可能ですが、Pythonだけで分析をすることは困難です。

SQLでは技術的には様々な分析ができます。
本書では多種多様な分析の方法論を、実際に架空データを使いながら分析することでスキルの定着を図ります。

必要知識

パソコンの操作

得られるスキル

SQL, PostgreSQL, select, where, order_by, group_by, join, window関数, DWH, バッチ処理

その他の教材紹介ページはこちら → Skill Stacks

-データサイエンス, SQL, データサイエンスおすすめ教材紹介【Skill Stacks】

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

【教材紹介】異端の統計学ベイズ

今回はベイズ統計学の歴史書です。今でこそ、頻度論の統計学とベイズ統計学などをひとまとめにして統計学と言われていますが、そこに至るまでに何があったのか?そちらを詳細に記述する500ページ越えの大作です。 …

(VPSでつくる) セキュリティ設定

連載第十四回目です。 セキュリティ設定について何もわからん状態なので色々と漁っていました。 PythonやFlaskなどの個別のモノに対してのセキュリティ設定の書籍は中々多くないので、Linuxなどの …

ノートPCとPythonでできる音声合成

「音声合成やってみたいけど難しそうだなあ」 私もそう思っていました。 私が使おうとしたきっかけは、大量の青空文庫の書籍を機械に朗読させたいと思ったからです。 そこで、調べてみるとできるということが分か …

ヒストグラムの階級数を決める方法論

データ分析業務ははっきり言って泥臭い。 分析の設計を行い、可視化を行ってから使えるデータかどうか判断できる。 そもそもそれはデータ分析前の話なのだが。 今回は、可視化の中でもデータの傾向を把握するのに …

[Meisyo]パラメータバランス調整 ver 0.10(a)

パラメータバランスを調整します。 理由としては、ミートが強すぎるからです。 ミートが神の地位を手に入れて早・・・というより、Meisyoが最初からそうだった。 「ミートを上げれば即ち打てる」で、パワー …