読者です 読者をやめる 読者になる 読者になる

300億円欲しい

メジャーリーグのデータ解析します

最も勝利に貢献した選手は誰だったのか 2015年メジャーリーグのデータ分析

R セイバーメトリクス 野球

はじめに 野球の勝負強さ

「9回表の2アウト、同点の場面で打ったホームラン」

「9回表の2アウト、10点リードの場面で打ったホームラン」

この2つは、選手の個人成績としては同じです。

記録上は同じ、ホームラン1本で1点取った、となります。

しかし、勝利への貢献という意味では、全く価値が異なります。

チームを勝利に近づけるようなプレイが重要ですからね。

以下、参考記事です。

巨人村田の"死体蹴り"が有名です。村田は大事な場面で打たないんですよね。

プロ野球 死体蹴り名人ランキングwwwwwwwwwwww : なんJ(まとめては)いかんのか?
【死体蹴り】 ヤクルト打線大爆発、9回表に11点wwwwww : なんJ(まとめては)いかんのか?

勝利への貢献度合いから打席を見ることで、

勝負強さや打席結果の価値を評価してみたいと思いました。

勝率の変動を調べてみる

過去に、こういう記事を書きました。

gg-hogehoge.hatenablog.com

巨人の勝率を上げたい (スクレイピングとデータ集計)

過去の試合結果データを利用して、試合状況から勝率を計算できるようにした、というものです。

こんな感じです。

打席ごとに勝率が変化します。

先のスライド、19ページ目にある、巨人の勝率変化のイメージです。

f:id:gg_hatano:20151220085830p:plain

ここで、勝率の変動の大きさで打席結果の価値を評価してみればいい、

というアイデアがあります。

2015年メジャーリーグの全試合の全打席で計算してみました。

## 2015年メジャーリーグで、最も勝利に貢献した打席

2015年のメジャーリーグの2429試合で発生した、全189,591イベントに対して、勝率変動を調べました。

その中で、最も勝率変動が大きかった打席と、その試合を挙げてみます。

勝率変動の絶対値をとって、試合ごとにその最大値を調べてみました。

そして、その最大値が大きかった上位5試合です。

GAME_ID 勝率変動の最大値
1 CHN201507270 0.9145
2 TEX201505310 0.8273
3 TOR201506090 0.8100
4 COL201506022 0.7940
5 ANA201509130 0.7916

GAME_IDが分かり辛いですが、勝率変動が最大だったのは、7月27日のこの試合です。

live.baseball.yahoo.co.jp

試合中の勝率変動を見てみましょう。

f:id:gg_hatano:20151220080328p:plain

最後の打席が、2015年の勝率変動最大打席でした。

live.baseball.yahoo.co.jp

1点ビハインドの9回裏、2アウト1塁から、ルーキーのクリス・ブライアントがサヨナラ2ランホームランを打ちました。

勝率8.5%の場面から起死回生でした。

シーズン通算の勝率変動

次に、2015年のシーズンを通じて、選手ごとに勝率を何%上げたかを調べてみました。

もっとも勝利に貢献した選手が分かります。上位10人です。

ID 勝率変動(%) 選手名
1 vottj001 6.29 Joey Votto
2 goldp001 5.90 Paul Goldschmidt
3 donaj001 5.83 Josh Donaldson
4 rizza001 5.81 Anthony Rizzo
5 troum001 4.84 Mike Trout
6 carpm002 4.73 Matt Carpenter
7 harpb003 4.69 Bryce Harper
8 mccua001 4.59 Andrew McCutchen
9 morem001 4.06 Mitch Moreland
10 davic003 4.06 Chris Davis


1位はジョーイ・ボットーでした。

baseball.yahoo.co.jp

2015年の成績は、打率.314、29本塁打、80打点。

それぞれ、突出した成績ではありません。物足りないです。

しかし、勝利貢献度合い、という形で高く評価することが出来ました。

こういう選手に光を当てていきたいですね。試合を決める選手。

他の勝負強さ指標と比べてみます。

例えば、打点。

打点ランキングの順位と勝利貢献度合いランキングの順位をプロットしてみました。

f:id:gg_hatano:20151220185630p:plain

結構違いますね。

まとめ

勝率の変動を利用して、打席や試合を評価してみました。

セイバーメトリクスでは、WPAと呼ばれる指標です。

チームの勝利に貢献した選手を定量的に評価できて面白いです。

コレを利用すれば、ある試合のMVPを自動的に決められますね。

試合の勝率貢献度が最大の選手を選べばいいわけですし。

展望1 日本プロ野球

日本プロ野球では、適切なデータが用意できませんでした。

打席単位のデータが欲しいです。

展望2 野球以外のスポーツ

試合状況から勝率を推定できれば、同様の手法が他のスポーツでも適用できます。

バスケとか面白そうですね。

例えば、残り10分で何点差であれば勝率95%で安心できる、といったような形で、

いわゆる「セーフティリード」を定量的に主張することが出来るかもしれません。

おわりに

この記事は、R Advent Calendar 2015、12月21日担当分でした。

qiita.com

また、今回の分析に際して利用したコードとデータは、ここにあります。

github.com

Advent Calendar 2015, 12月22日の担当は@kazutanさんです。

twitter.com

予告によれば、leafletという、地図上でデータを可視化するライブラリを利用した記事だそうです。

楽しみですね。

以上です。