読者です 読者をやめる 読者になる 読者になる

300億円欲しい

メジャーリーグのデータ解析します

中日の大島は本当にセカンドゴロ製造機なのか (2015年の打席結果データを作りました)

野球 R

はじめに

元ネタ。セカンドゴロ製造機として名高い、中日の大島選手に関する記事です。

blog.livedoor.jp

手でデータを集計しているようです。大変そうです。

そこで私は、プログラムを書いて全自動化してみました。

ついでに、大島選手だけではなく全選手の打席結果をまとめたデータをcsvで作ってみました。

2015年 打席結果データ作りました

データはこちら。2015年の全試合の打席結果.csvが入っています。

2015年打席結果.csv: 試合ID, チーム名, ホームかアウェイか, イニング, 選手名, 打席結果, イニング内の打席順, というデータです。 · GitHub

約65000行あります。気をつけて下さい。

yahoo一球速報の試合結果ページを1試合ずつ整理して作りました。

打席結果が表になっているので、ここをいい感じにまとめるだけです。

作ったデータの中身を紹介します。

先頭の6行。

試合ID チーム ホーム_アウェイ 選手 結果 結果番号
1 2015032701 巨人 home 1 坂本 勇人 左安 1
2 2015032701 巨人 home 1 井端 弘和 遊ゴロ 2
3 2015032701 巨人 home 1 長野 久義 中2 3
4 2015032701 巨人 home 1 阿部 慎之助 捕邪飛 4
5 2015032701 巨人 home 1 村田 修一 中飛 5
6 2015032701 巨人 home 2 坂本 勇人 右飛 1

1行目は、2015年3月27日の試合、巨人がホームで、1回に坂本が先頭でレフトにヒットを打った...

...といったものです。

このように、打席の情報が1行に入ったデータとなっています。

大島はセカンドゴロ製造機なのか

中日の大島選手の打席結果を集計してみました。

##   result count
##    (chr) (int)
## 1 二ゴロ    85
## 2   左飛    48
## 3 遊ゴロ    47
## 4 空三振    45
## 5   中安    39
## 6   四球    38

とりあえず棒グラフにしてみました。

f:id:gg_hatano:20151031202710j:plain

元記事の数字とは一致しています。

大島選手の打席結果では、セカンドゴロの数が最も多かったです。

他の選手と比べるとどうでしょうか。

200打席以上の選手で、セカンドゴロ率を調べてみました。

セカンドゴロ率ランキング、top10人がこちらです。

チーム 選手 結果 回数 打数 割合
1 ロッテ 岡田 幸文 二ゴロ 30 208 0.1442
2 ソフトバンク 髙谷 裕亮 二ゴロ 29 208 0.1394
3 中日 大島 洋平 二ゴロ 84 608 0.1382
4 楽天 後藤 光尊 二ゴロ 58 440 0.1318
5 巨人 アンダーソン 二ゴロ 35 269 0.1301
6 楽天 藤田 一也 二ゴロ 57 447 0.1275
7 巨人 立岡 宗一郎 二ゴロ 50 397 0.1259
8 中日 森野 将彦 二ゴロ 31 248 0.1250
9 楽天 銀次 二ゴロ 41 354 0.1158
10 ヤクルト 雄平 二ゴロ 71 616 0.1153
左打ちのノーパワー系バッターばかりです。アンダーソン以外。

大島は3位でした。ただ、打席数は多いです。

セカンドゴロ製造機と認定してよさそうです。

できなかったこと

打席結果データで、イニング内の打席結果の順番が上手く取れていません。

例えば、先ほどのデータで、6行目に坂本が来ています。

これは、坂本が2回の先頭打者という意味ではありません。

6,7,8,9番の打席の後に坂本の打席...だったのですが、この順番が反映できまていせん。

ちょっと面倒なので、後回しにします。

また、塁の状況が分かると面白いのですが、取得できていません。

なので、例えば、得点圏打率の計算は出来ません。

おわりに

みなさんもExcelとかで遊んで下さい。

以上です。

追記1 (2015年10月31日)

今回のデータには、クライマックスシリーズ日本シリーズの試合も含まれています。

なので、集計結果には、シーズン通算成績とは異なる数字が現れています。

追記2 (2015年10月31日)

打者1順の時の打撃結果が正しく反映出来ていませんでした。

データを手で直しました。