300億円欲しい

メジャーリーグのデータ解析します

野球のスコアで一番多いのは何対何だと思う?

野球のスコア こんなツイートを見つけました. 本日は神宮で東都大学野球を観戦後、Hさん、Gさんと外苑前の居酒屋で一杯。Gさんから「野球のスコアで一番多いのは何対何だと思う?」とお題。Gさんによれば、過去のMLBの試合を全て調べた人がいて、その…

Rで野球データを取得したい

野球データが欲しい スライド作りました. Rで野球のデータ解析がしたい (データが欲しい) from Takuma Hatano 以上です.

Shinyで作ったWebアプリを公開したい

R

RでWebアプリを作って公開する RでWebアプリを作るパッケージとして, shinyがあります. RStudio - Shinyこれを利用して, 自分でもWebアプリを作ってみた, という記事が前々回でした. RでWebアプリを作りたい - 300億円欲しいshinyアプリの公開方法は, 色々あ…

Vimのneosnippetで自分用snippetファイルを追加したい

vim

neosnippetが凄いので使いましょう. Shougo/neosnippet.vim · GitHub Luaを有効にしたVimのインストール luaが有効になっているvimを導入します. » luaを有効にしてVimをインストールする TECHSCORE BLOG ここを参考にして, Luaを有効にしたVimをインストー…

rChartsでグラフを作りたかった

いろいろ作りました rChartsで野球データのグラフを作った 3000本安打以上のバッターについて, 通算成績推移をグラフにしました. RPubs - rChartsでレジェンドプレーヤーの成績を可視化したい 250勝以上の投手について, 通算成績推移をグラフにしました. RPu…

RでWebアプリを作りたい

R

Shinyを使う こういうのを自分でも作りたいです. http://spark.rstudio.com/jkatz/SurveyMaps/左側でパラメータを指定したら, 右側でそれが反映された図表が作成される感じです. しかも, ブラウザ上で動く. Webアプリ. かっこいいです. RでWebアプリを作れま…

メジャーリーグのデータ解析をしたい ( スピンの効いた球)

野球の話です. 打たれない球とは 球速, 回転軸, 回転量とボールの軌道については, データがあります. メジャーリーグのデータ解析をしたい (pitch f/xって何) - 300億円欲しいどのような球が打たれないのか...が分かれば嬉しいですね. 色々調べましょう. 今…

野球の話をまとめたい

野球ネタをまとめます. 勝利確率 勝利確率(Win Probability)を利用して, 各プレーの評価をしました 勝利確率で見る巨人戦 (vs. 日本ハム 6月6日) - 300億円欲しい 1アウト3塁のランナーを返せるか 犠牲フライを打てば点が入る場面で, ちゃんと点が入った割合…

Rの知識を更新したい

R

Rの知識を改めたいです. 日々パッケージが更新されているのでついていけませんが, 多少は抗いたいです.※ 以下、個人の感想です ※ 間違いがあったら直します イコールで代入しよう 矢印で代入するのは面倒ですよね. 実はイコールが使えます. > x <- 100 > y =…

Rstanを動かしたいけど動かないと思ったら動いた

StanでMCMCサンプリングをしたいです. Rstanを動かしたい データ解析のための統計モデリング入門を読んでいます.データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)作者: 久保拓弥出版社/メーカー: 岩波書…

Rで文芸的プログラミングがしたい

R

Rの話です. 文芸的プログラミングとは 文芸的プログラミングってなんですかね. その説明から入ります.ソースコードを読んでも, コードが何をしているのか分からないこと. ありますよね. 自分が書いたコードなんだから覚えているだろ...と甘えて, コメントを…

Rからデータベースに接続したい

Rの話です PostgreSQLを使う 野球データの数が大きくなり, ファイルもフォルダも管理できなくなりました. こういうときのデータベースです. データベースにデータを投げて, 整理します. 7年分の打席結果データをPostgreSQLに読ませました. baseball_data=# \…

data.tableでmelt的な処理をしたい

R

Rの話です. ggplotしたいのでreshape2のmeltをする場面って結構ありますよね. meltはdataframeの処理です. しかし, 時は2014年. dataframeからdata.tableに移行していきたいですよね. http://cran.r-project.org/web/packages/data.table/vignettes/datatabl…

メジャーリーグのデータ解析をしたい ( パワプロ打撃テスト式ランキング)

野球の話です. パワプロ打撃テスト式ランキング こんな記事がありました. セパ、パワプロの打撃テスト式ランキグンwwwww : なんJをまとめた結果www(速報)パワプロに打撃練習がありますね. こんな感じです. パワプロ2013 男・村田修一で打撃練習し…

メジャーリーグのデータ解析をしたい ( 被BABIPの集計 )

被BABIP 前回は打者目線で考えました. メジャーリーグのデータ解析をしたい ( とりあえずBABIPの集計 ) - 300億円欲しい今回は投手目線で考えます. 被打球方向に関して, ある程度は運要素がある気がしますね. めちゃくちゃ打たれているのに, 飛んだところが…

メジャーリーグのデータ解析をしたい ( とりあえずBABIPの集計 )

野球の話です. BABIPとは 「当たりは良かったのですが, セカンド正面でした」 ってよくありますよね. 飛んだところが悪かった, という打球です. 逆に, 「当たりは悪かったのですが, 内外野の間に落ちました」 もよくあります. ポテンヒットです. 飛んだとこ…

メジャーリーグのデータ解析をしたい ( 初球ストライクは大事なの )

野球の話です. 初球ストライク率 初球の入り方は大事なんですかね. 分かりません. 初球の入り方について調べると, 初球ストライク率という指標が見つかりました. First-pitch strike - Wikipedia, the free encyclopediaどうなんですかね. Damejima's HARDBA…

メジャーリーグのデータ解析をしたい (ヤマの張り方)

野球の話です Fastball Countとは 速球系の球を投げやすいカウントがあるらしいです. Damejima's HARDBALL:メジャーと日本の配球論の差異から考える「城島問題」damejimaノート(11) なぜライアン・ハワードは9回裏フルカウントでスイングできなかったのか…

メジャーリーグのデータ解析をしたい (投球テンポと援護率の関係とは)

野球の話です. 序論 「投球テンポが悪いから点が入らないんじゃ」 みたいな言説. ありますよね. http://ohad.2chblog.jp/archives/30860233.html 投球テンポがいいと打線が援護してくれる風潮:非常識@なんJ 投球のテンポが悪いと何故援護がもらえないので…

RからC++を使いたい (Rcppの練習)

R C++

Rは便利ですが, 重たい計算をさせると遅いです. 計算が重たい部分だけ他の言語を利用すれば, 早く計算できますね. 今回はRからC++を利用します. Rcppというパッケージを使えばいいです. 便利で速い計算環境が構築できるんじゃないですかね. RからC++を使う R…

俳句で形態素解析をしてみたい

R

序論 友人から17,000の俳句を渡されました. せっかくなので形態素解析してみました. 参考文献 データマイニング入門解析の結果を利用して, 雰囲気だけそれっぽい俳句が作れそうな気がします 面白かった俳句 パンツ脱ぐ 遠くの少年 泳ぐのか 分析が明確です泳…

メジャーリーグのデータ解析をしたい (安打製造機かどうかなんて分からん)

前々回に試した手法が全然ダメそうだ, という内容です. 序論 こんな記事を書きました メジャーリーグのデータ解析をしたい (イチローは本当に安打製造機なのか) - 300億円欲しい内容をまとめると, サロゲートデータ法を使って, イチローの打席結果に系列相関…

効率的にデータフレームの処理がしたい ( doBy vs plyr vs dplyr)

R

メジャーリーグのデータを弄って遊んでいます. 100Mbオーダーのデータフレームの処理をしています. 序論 今まではplyrのddplyで計算させていましたが, 遅いです. doByパッケージで大体同じことができて, しかも速く計算出来ました. どう使い分ければいいんで…

イチローは本当に安打製造機なのか!?

この記事はR Advent Calendar 2013 : ATND , 1月3日の配当記事です. よろしくお願いします. 序論 イチロー. 凄いですよね. MLBでの成績をのせます. YEAR GAME ATBAT HIT AVG 1 2001 157 692 242 0.3497110 2 2002 157 647 208 0.3214838 3 2003 159 679 212 …

効率的にデータフレームの処理がしたい(doByパッケージとは)

序論 Rでデータフレームを効率的に弄りたいです. plyrパッケージはとても優秀です. 使いましょう. doByパッケージもとても優秀です. 使いましょう. irisデータの処理 データフレームを処理する道具として, plyrパッケージを紹介します. みんな大好きirisデー…

メジャーリーグのデータ解析をしたい (pitch f/xって何)

pitch f/x とは また野球の話です. こんな記事がありました. 【MLB】 PITCHf/xとかいう球速測定装置wwwwww - キャッチャーライナー http://blog.livedoor.jp/catcherliner/archives/7557031.html複数の場所からボールを撮影することで投球の軌道を追い…

メジャーリーグのデータ解析をしたい( 犠牲フライくらい打てよ )

序論 Rを使ってデータ解析します. またメジャーリーグの話です.0アウトか1アウトでランナーが3塁にいると, 「おっしゃ1点はとったな」 と思いますよね.外野フライでもいいし, 深めの内野ゴロでもいいです. 高く弾んでもいいです. 何か少し手間のかかるところ…

メジャーリーグのデータ解析をしたい (ダルビッシュがすごい)

序論 Rを使ってメジャーリーグのデータ解析がしたいです.全ての試合結果データが公開されています. retrosheetという名前で, 無料で使えます. http://www.retrosheet.org/game.htm せっかくなので使います. 試合結果データを整形してcsvファイルにしたあとで…

メジャーリーグのデータ解析をしたい (K/BBの計算したら上原が凄い)

序論 Rを使ってメジャーリーグのデータ処理をします. 今回は前処理に役立つplyrパッケージを使いながら, レッドソックスの上原浩治選手の成績を確認します. 今回使うのは, plyrパッケージです. データのまとめにはとても便利です. ddplyの使い方がわかると思…

メジャーリーグのデータ解析をしたい ( 21世紀限定HRランキング)

序論 ある程度まとまったデータの解析をしたいです. でも, 興味のないデータを漫然と弄っても楽しくないです. 今回は, みんなが大好きなメジャーリーグのデータで遊びます. 野球に詳しくなって, さらにRの関数の使い方も練習できます. さっそく, 21世紀のデ…