Webサービス制作のための技術情報を。データ分析（Python、機械学習コンペ他）や自作野球ゲームMeisyoのこと中心。

Web制作 Python データサイエンス

[Kaggle] Titanic 約80% by ランダムフォレスト

投稿日：2019年2月19日更新日：2019年4月30日

実力不足感が否めませんが、Kaggleのチュートリアル的なTitanicにおいてランダムフォレストで正答率約80%を出せたのでコードを載せておきます。
Colaboratory

実施期間：2019/02/07～02/19
的中率：46%→80%
使用識別器：ロジスティック回帰、ランダムフォレスト、SVM、K-means、カーネルSVM
グリッドサーチ：あり

注意したこと：
・データをよく観察する。
・欠損値はよく考えて埋める。適当に埋めない。
・1つずつ理由を考える。

問題点：
・識別器の違いが判らなかった。（だいたい分かるようになってきた）
・分析のためのコードの書き方がわからなかった。
・名前の分類凝りすぎた感。（＋αするなら男の名前と女の名前で列を分けたほうが良かったかも？）
・データ正規化の自作関数、data_normalize()がWarning出てしまう。
・NNとかCNN、LGBなどの優秀な識別器を自作できなかった。理解が足りない。
・ほぼほぼモノマネに終始してしまった。
・上のColaboratory URL完成してない！
・「もし乗客になった場合、死亡確率を下げるにはどうしたらいいの？」という問いに答えられない。

感想：
・時間かかったけど楽しかった。
・KaggleはPythonに慣れるのにはよさそう。
・他の人のコードをもっと読みたい。（カーネル読もね）
・Pythonやデータサイエンスの理解を深めたい。で、仕事で使いたい。

【追記：04/30】
LightGBM、XGBoostをさらに試したところ、84%の精度が出ました。
・・・とは言え、単純な「データ加工→学習→出力」ではチューニングしたランダムフォレストが一番精度高かったです。
2つのBoosting系は、出力後の結果を再度取り込んで学習させるなど、さらなる精度を求めるならよさそうです。（なお、ノンチューニングなので真価は発揮していない）

-Web制作, Python, データサイエンス

執筆者：rei

comment コメントをキャンセル

関連記事

: 【Meisyo】ステータスバランス調整

はじめに Meisyo＋お知らせステータスバランス調整予定のお知らせの詳細を記載します。下記の順番で対処を行いました。 ②本塁打率が高すぎる。 ①打率平均が低すぎる。 ③長打（二塁打・三塁打）が …

: 【教材紹介】XAI(説明可能なAI)

今日では、さまざまなデータが収集され、判断の自動化や数値予測の高度化が行われています。そのAIの判断、どう説明すればいいかわかりますか？エクセルのようなテーブルデータだけでなく、画像やテキストに対 …

: 「実践！Chainerとロボットで学ぶディープラーニング」を作ってみた

実践！Chainerとロボットで学ぶディープラーニングを購入しました。単純にロボを動かすのは楽しいです。周りに意外と買った人が居ないようなので、レビューを書きました。所感ちょっとお高いけど、土 …

: [Meisyo]Androidアプリ版作成案1

「アンドロイドアプリの基本」的な本が届いて3日。だいたいわかった（わかってない）ので一応完成予想図を考えておきましょう。 [トップページ]→[ログイン画面]or[ゲーム画面] ・アプリの利用メリット …

: 【教材紹介】機械学習を解釈する技術

多くの企業で導入されるようになってきた機械学習。その機械の判断基準、本当にわかっていますか？今回は、実務に利用するために最低限の技術として、変数（特徴量）の重要度や変数と予測値の関係性を求める方法 …

PREV: スッキリわかるSQL入門第2版題材A 問75
NEXT: [Meisyo]練習試合のバグ修正

Meisyo：
高校野球チーム育成シミュレーションゲーム。
監督たちの甲子園世紀の逆転劇
 名将と呼ばれた者達＋
名将と呼ばれた者達

メインサイト：Rの考え方

: 2025/03/30

監督たちの甲子園(v1.3.5) 新規ユーザー分析

: 2025/03/10

【生成AIテスト記事】Unity運営に関する各種プラットフォーム(Google, Apple, Unity)の情報公開可否

: 2025/03/02

監督たちの甲子園世紀の逆転劇戦略指針

: 2025/02/23

Unityで”Class” is missing the class attribute ‘ExtensionOfNativeClass’が発生する原因がわからない ⇒ Easy Save3でした

: 2025/02/20

UnityでiOS版をリリースする際に、Firebaseを使っていると起こるビルドエラー「Undefined symbols for architecture arm64」への対応