300億円欲しい

メジャーリーグのデータ解析します

メジャーリーグのデータ解析をしたい( 犠牲フライくらい打てよ )

序論

Rを使ってデータ解析します.
またメジャーリーグの話です.

0アウトか1アウトでランナーが3塁にいると,
「おっしゃ1点はとったな」
と思いますよね.

外野フライでもいいし, 深めの内野ゴロでもいいです.
高く弾んでもいいです. 何か少し手間のかかるところに転がればランナーは生還できます.
打者から見れば"おいしい"場面です.

なのに, です.
点が全く入らない事があります. 結構あります.
腹立ちますよね. リモコン投げます.

実際にどれくらいの割合で点が入るのでしょうか.

ここで新たにデータ解析の種が生まれました.

ノーアウトか1アウト, ランナーが3塁にいる場面で回ってきた大チャンスの打席のうち,
ちゃんと点が入るのは◯◯%

計算

実際に調べてみます.
retrosheetで提供されている2013年の全試合結果で, 実際に数えてみます.
http://www.retrosheet.org/boxesetc/index.html

整形済みの試合進行データ all2013.csvを利用します.
https://github.com/gghatano/AnalyzingBaseballData
ランナーの様子と動きが確認できるので, それを利用します.

Scored or not when runner is on third-base (MLB, 2 ...

大チャンスに強い選手を見てみます.

>head(data2013.SuperChance.over10chance.arranged,10)
     BAT_ID SuperChance SuperChanceScored SuperChanceScoredRate
1  robeb003          15                14             0.9333333
2  blank002          11                10             0.9090909
3  bourm001          20                17             0.8500000
4  reyej001          12                10             0.8333333
5  peres002          21                17             0.8095238
6  suzuk001          15                12             0.8000000
7  lombs002          14                11             0.7857143
8  utlec001          29                22             0.7586207
9  carpm001          20                15             0.7500000
10 encae001          20                15             0.7500000

... 微妙ですね.
全体ではどうでしょう. 和をとって計算すれば得点ゲット率がわかります.

successRate <- with(data2013.SuperChance, sum(SuperChanceScored)/ sum(SuperChance))

見てみます.

> successRate
[1] 0.5018051

こんなもんですか...

ノーアウトか1アウト, ランナーが3塁にいる場面で回ってきた大チャンスの打席のうち,
ちゃんと点が入るのは50.2%

5割ですか. それほど高くないですね.

ありがとうございました.

おまけ

大チャンスを作っても抑える投手も見てみます.
投手のID(PIT_ID)で分割するだけです.

.> tail(data2013.SuperChance.over20chance.arranged,10)
      PIT_ID SuperChance SuperChanceScored SuperChanceScoredRate
166 iwakh001          39                15             0.3846154
167 minom001          35                13             0.3714286
168 estrm001          22                 8             0.3636364
169 gonzg003          33                12             0.3636364
170 johnj010          22                 8             0.3636364
171 kellj001          22                 8             0.3636364
172 outmj001          22                 8             0.3636364
173 lee-c003          23                 8             0.3478261
174 chavj001          21                 7             0.3333333
175 manes001          25                 2             0.0800000

マリナーズの岩隈投手がいますね.
大ピンチでも被得点率は38.5%. すごいです.
他の選手は分かりません.
1人すごい人がいますね.
カージナルスのセス・マネス選手です.
http://www.baseballprospectus.com/card/card.php?id=68920
今年デビューみたいです.


使用したデータセットとコードです.
https://github.com/gghatano/AnalyzingBaseballData

参考文献

読んでます

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)