300億円欲しい

メジャーリーグのデータ解析します

2014-01-01から1ヶ月間の記事一覧

メジャーリーグのデータ解析をしたい ( 初球ストライクは大事なの )

野球の話です. 初球ストライク率 初球の入り方は大事なんですかね. 分かりません. 初球の入り方について調べると, 初球ストライク率という指標が見つかりました. First-pitch strike - Wikipedia, the free encyclopediaどうなんですかね. Damejima's HARDBA…

メジャーリーグのデータ解析をしたい (ヤマの張り方)

野球の話です Fastball Countとは 速球系の球を投げやすいカウントがあるらしいです. Damejima's HARDBALL:メジャーと日本の配球論の差異から考える「城島問題」damejimaノート(11) なぜライアン・ハワードは9回裏フルカウントでスイングできなかったのか…

メジャーリーグのデータ解析をしたい (投球テンポと援護率の関係とは)

野球の話です. 序論 「投球テンポが悪いから点が入らないんじゃ」 みたいな言説. ありますよね. http://ohad.2chblog.jp/archives/30860233.html 投球テンポがいいと打線が援護してくれる風潮:非常識@なんJ 投球のテンポが悪いと何故援護がもらえないので…

RからC++を使いたい (Rcppの練習)

R C++

Rは便利ですが, 重たい計算をさせると遅いです. 計算が重たい部分だけ他の言語を利用すれば, 早く計算できますね. 今回はRからC++を利用します. Rcppというパッケージを使えばいいです. 便利で速い計算環境が構築できるんじゃないですかね. RからC++を使う R…

俳句で形態素解析をしてみたい

R

序論 友人から17,000の俳句を渡されました. せっかくなので形態素解析してみました. 参考文献 データマイニング入門解析の結果を利用して, 雰囲気だけそれっぽい俳句が作れそうな気がします 面白かった俳句 パンツ脱ぐ 遠くの少年 泳ぐのか 分析が明確です泳…

メジャーリーグのデータ解析をしたい (安打製造機かどうかなんて分からん)

前々回に試した手法が全然ダメそうだ, という内容です. 序論 こんな記事を書きました メジャーリーグのデータ解析をしたい (イチローは本当に安打製造機なのか) - 300億円欲しい内容をまとめると, サロゲートデータ法を使って, イチローの打席結果に系列相関…

効率的にデータフレームの処理がしたい ( doBy vs plyr vs dplyr)

R

メジャーリーグのデータを弄って遊んでいます. 100Mbオーダーのデータフレームの処理をしています. 序論 今まではplyrのddplyで計算させていましたが, 遅いです. doByパッケージで大体同じことができて, しかも速く計算出来ました. どう使い分ければいいんで…

イチローは本当に安打製造機なのか!?

この記事はR Advent Calendar 2013 : ATND , 1月3日の配当記事です. よろしくお願いします. 序論 イチロー. 凄いですよね. MLBでの成績をのせます. YEAR GAME ATBAT HIT AVG 1 2001 157 692 242 0.3497110 2 2002 157 647 208 0.3214838 3 2003 159 679 212 …