RのWeb制作

Webサービス制作のための技術情報を。データ分析(Python、機械学習コンペ他)や自作野球ゲームMeisyoのこと中心。

Web制作 Meisyo

[Meisyo]左投右打が出過ぎで気持ち悪い件の分析

投稿日:

本日フリーゲーム夢現に初コメントが付いたのでワクワクして見ました。

#————————————————————-#
フリーゲーム夢現の’名将と呼ばれた者達’にコメントが投稿されました。
運営が公開処理するまでこのコメントは表示されません。(※投稿されてから約1日程度)

————————-
[コメント投稿者] 匿名

■ コメント内容 ■
左投げ右打ちの選手が出過ぎでちょっと気持ち悪いです

————————-

【投稿されたページを見る】
https://freegame-mugen.jp/simulation/game_7374.html
#————————————————————-#

お・・・おう・・・。そうか。

というわけで、どれくらい気持ち悪いのか数値化してみます。

やること

  1. コード確認
  2. データ把握
  3. あるべき姿(論文等)の調査
  4. 現状とあるべき姿の比較
  5. 改善点
  6. まとめ

コード確認

選手生成のコードを確認。

        // 投
        if(mt_rand(1, 1000) >= 115){ $CD['side_p'] = 'R'; }else{ $CD['side_p'] = 'L'; }

        // 打
        if(mt_rand(1, 100) >= 35){ $CD['side_b'] = 'R'; }else{ $CD['side_b'] = 'L'; }

投、打はどちらも独立に判定される。
投:88.5(=100-11.5)%で右投、その他(11.5%)で左投
打:65(=100-35)%で右打、その他(35%)で左打

このコードから、それぞれが起こる可能性は以下の通りです。
(全体合計は1。ただかけ合わせるだけです。)

右投 左投
右打 0.57525 0.07475
左打 0.30975 0.04025

※検算済み

約7.5%で左投右打ちが出てくる計算です。

データ把握

実際データはどうなってるの?ということで計算してみました。
データセットは[Meisyo]ビッグデータから学ぶ試合の基礎設計4のモノを使用しています。
*このデータで注意すべきは2点。成績準拠なので、「試合に出場した選手のみのデータが記録されていること」「任意でデータを削除できること」ですね。

データセット結果:
Total:6558
RR:3778(0.576)
RL:1991(0.304)
LR:527(0.080)
LL:262(0.040)

コードでの指定:

右投 左投
右打 0.57525 0.07475
左打 0.30975 0.04025

0.005分LRが上に、RLが下にぶれています。
6.7%程度の変動ですね。
これ分散値とか計算できるのか?
おおよそコードとデータは違っていないと判断します。(判断基準があいまい)
計算には実データを使っていきます。

計算コード:

# -*- coding: utf-8 -*-

import os, sys, csv
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 基礎設定
file_name = 'meisyo_b 20181217.csv'

# CSV読み込み
df = pd.read_csv(file_name, encoding='utf-8')

# 基礎設定
an = pd.DataFrame(index=[], columns=[])

# 投/打把握
an['side_p'] = df['side_p']
an['side_b'] = df['side_b']

# print(an)

# 集計
date = {'RR':0, 'RL':0, 'LR':0, 'LL':0}
for index, row in df.iterrows():
    key = row['side_p'] + row['side_b']
    date[key]+=1

# 表示
print("Total:" + str(len(an)))
for key in date.keys():
    print(str(key) + ":" + str(date[key]))

あるべき姿(論文等)の調査

野球の右投左投等のデータがありそうな論文と言えば、セイバーメトリクス関係か右/左打でどれだけ成績が変わるのか的な論文だと思いました。ということで調べました。

The Success of Sinister Right-Handers in Baseball(October 26, 2017)
超日本語訳:野球で成功したいなら右打ちはやめとけ

Abstract:
This new analysis of data on 17,564 professional baseball players shows a distinct advantage in hitting for those who bat left-handed but throw right-handed. The findings argue against any advantage due to hemispheric lateralization.
Abstract超日本語訳:
17,564人ものプロ野球選手のデータから分析した結果は、左バッターが右バッターに比べて優位(有意)なアドバンテージを持っていることを示した。この発見は他の全てのアドバンテージを跳ね返す力を持っている。

わースポーツ医学の論文カナー・・・

Table1に結果が載ってました。

結果:
All recorder major league players(N=5663)
Percent of Players
RR:63.2%
RL:19.0%
LL:12.3%
RB:4.7%
LR:0.5%
LB:0.3%
(B=両打ち)

現状とあるべき姿の比較

現状とあるべき姿のデータが取れたので比較し、相関関係を確認します。

データセット結果:
Total:6558
RR:57.6%
RL:30.4%
LR:8.0%
LL:4.0%

あるべき姿の結果:
All recorder major league players(N=5663)
Percent of Players
RR:63.2%
RL:19.0%
LL:12.3%
RB:4.7%
LR:0.5%
LB:0.3%
(B=両打ち)

0.5%であるべきところが、8.0%って・・・。差が大きくないか・・・?たしかに気持ち悪い。
以下、両打を無視して計算します。

あるべき姿:
右投:
 右打:左打=63.2:19.0(ALL82.2)
 =77:23

左投:
 右打:左打=0.5:12.3(ALL12.8)
 =4:96

現状は投げ・打ちは互いに独立ですが、あるべき姿では関連性ありですねー。

改善点

コードはこんな感じかなと。

        if(mt_rand(1, 100) >= 13){
            $CD['side_p'] = 'R';
            if(mt_rand(1, 100) >= 23){ $CD['side_b'] = 'R'; }else{ $CD['side_b'] = 'L'; }
        }else{
            $CD['side_p'] = 'L';
            if(mt_rand(1, 100) >= 96){ $CD['side_b'] = 'R'; }else{ $CD['side_b'] = 'L'; }
        }

まとめ

確かに気持ち悪い量の左投げ右打ちの選手が生成されていました。

よく考えてみると、プロ野球選手でも左投げ右打ちの選手いないですね。
野球エリートだと幼い内に左投右打なら左打に矯正されるし、そっちのほうが結果もいいみたいだし。
まあ生涯打率で1割違ったらねえ・・・。

今回MLBのデータを使いましたが、それでもLL>>LRなのでそういうものなんですね。
諸説では「あちら(米国)のほうが個人の意思を優先する」とのことですが、ここまではっきりとした差(LL24:LR1)ならしょうがないね。

コメントありがとうございました!

-Web制作, Meisyo

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

no image

PHPで祝日判定

PHP 祝日判定で検索すると、「GoogleカレンダーAPIで祝日を取得する」ばかりです。 しかし、GoogleカレンダーAPIは抜け落ちている祝日が存在することが知られています。 今回は、抜け落ちが …

[Meisyo]ビッグデータから学ぶ試合の基礎設計3

これは[Meisyo]ビッグデータから学ぶ試合の基礎設計2の投手編です! ここでは、「どのパラメータが打率等にどれくらい関係するのか」を理解することで強いチームを作る指針を記載しておきます。 というわ …

[Meisyo]育成情報

これは何? 名将と呼ばれた者達(略:Meisyo)の説明書です。 まず何をやればいいの?というところから、 どうすれば上手くいくの?という疑問にお答えします。 質問や気になるところがあれば、れいまでご …

(VPSでつくる) セキュリティ設定

連載第十四回目です。 セキュリティ設定について何もわからん状態なので色々と漁っていました。 PythonやFlaskなどの個別のモノに対してのセキュリティ設定の書籍は中々多くないので、Linuxなどの …

[SQL]URLから正規表現でホストの抽出

他のサイトの説明が釈然としなかったので投稿。 以下のref0~2番のホストを抽出したいとする。 ref[0] = "http://www.other.com/path1/index …