安打数から四球数を予測する

1. 単回帰分析という解析方法を用いて安打数から四球数を予測できる直線の式を求める。
単回帰分析とは説明変数(ここでは安打数)から目的変数(四球数)を求める方法で ある。
2.今季に1度でも打席に立ったことのある選手を対象に絞り広島カープの打席データを元に単回帰分析を行った。
(表1は選手名、安打数、四球数のデータをグラフにしたもの。)

  係数
切片 1.059773
安打 0.318906
この表から回帰直線は
y=0.32x+1.06となる
y(予測される四球数)
x(安打数)
この式のxに新井選手の安打数61を代入して四球数を予測する
y=0.32×61+1.06=20.58
約21である。
表1を見てみると実際の四球数も21である。
どや( ・’―・`)。
回帰分析結果
回帰統計  
重相関 R 0.88883
重決定 R2 0.790019
補正 R2 0.778967
標準誤差 4.434002
観測数 21
この表から何が言えるかというと
Rは説明変数と目的関数の関係の強さを現す度合であり、1に近づく程関係性が強いと言える。
このときのRの値はR=0.88883と1にかなり近く安打数の関係性はかなり強いといえる
R2は寄与率といい値が1に近ければ近いほど求めた直線が実際の値に近いのか、つまり誤差の少ないよう正しく予測できているのかをあらわす。
このときのR2は約0.8でありかなり誤差が小さく安打数から四球数を予測できると言える。
あとはめんどくさいので省略

3.まとめ
説明変数(安打数)から目的関数(四球数)をもとめることができる。このときの説明変数と目的関数を変えることでいろいろな予測ができる。
例えば 握手完売速度から次の選抜の位置、(フロント、2列目、3列目)など
さきほどのR2の値が1に近い場合での話ではあるが。
統計は結構面白いものだと知ってもらえれば何よりである。
なぜ広島カープのデータであるかというと安打数が多いので敬遠される数が多いと思ったのでいいデータが取れると思ったからである。(もうしわけないがDenaは論外)

ちなみに筆者は大の野球観戦嫌いである。 

 

 

 

 

 

表1 選手名 安打数 四球数
選手名 安打 四球数
田中 広輔
66 30

丸 佳浩
64 29

菊池 涼介
75 14

エルドレッド
65 21

新井 貴浩
61 21

鈴木 誠也
44 12

石原 慶幸
15 8

安部 友裕
31 8

松山 竜平
29 7

會澤 翼
19 7

天谷 宗一郎
12 12

ルナ
18 9

小窪 哲也
9 9

堂林 翔太
8 1

磯村 嘉孝
4 1

西川 龍馬
3 0

野間 峻祥
0 0

赤松 真人
3 1

下水流 昂
0 0

土生 翔平
0 0

上本 崇司
0 0

引用 http://baseball-data.com/stats/hitter-c/