300億円欲しい

メジャーリーグのデータ解析します

R

効率的にデータフレームの処理がしたい ( doBy vs plyr vs dplyr)

R

メジャーリーグのデータを弄って遊んでいます. 100Mbオーダーのデータフレームの処理をしています. 序論 今まではplyrのddplyで計算させていましたが, 遅いです. doByパッケージで大体同じことができて, しかも速く計算出来ました. どう使い分ければいいんで…

イチローは本当に安打製造機なのか!?

この記事はR Advent Calendar 2013 : ATND , 1月3日の配当記事です. よろしくお願いします. 序論 イチロー. 凄いですよね. MLBでの成績をのせます. YEAR GAME ATBAT HIT AVG 1 2001 157 692 242 0.3497110 2 2002 157 647 208 0.3214838 3 2003 159 679 212 …

メジャーリーグのデータ解析をしたい (pitch f/xって何)

pitch f/x とは また野球の話です. こんな記事がありました. 【MLB】 PITCHf/xとかいう球速測定装置wwwwww - キャッチャーライナー http://blog.livedoor.jp/catcherliner/archives/7557031.html複数の場所からボールを撮影することで投球の軌道を追い…

メジャーリーグのデータ解析をしたい( 犠牲フライくらい打てよ )

序論 Rを使ってデータ解析します. またメジャーリーグの話です.0アウトか1アウトでランナーが3塁にいると, 「おっしゃ1点はとったな」 と思いますよね.外野フライでもいいし, 深めの内野ゴロでもいいです. 高く弾んでもいいです. 何か少し手間のかかるところ…

メジャーリーグのデータ解析をしたい (ダルビッシュがすごい)

序論 Rを使ってメジャーリーグのデータ解析がしたいです.全ての試合結果データが公開されています. retrosheetという名前で, 無料で使えます. http://www.retrosheet.org/game.htm せっかくなので使います. 試合結果データを整形してcsvファイルにしたあとで…

メジャーリーグのデータ解析をしたい (K/BBの計算したら上原が凄い)

序論 Rを使ってメジャーリーグのデータ処理をします. 今回は前処理に役立つplyrパッケージを使いながら, レッドソックスの上原浩治選手の成績を確認します. 今回使うのは, plyrパッケージです. データのまとめにはとても便利です. ddplyの使い方がわかると思…

メジャーリーグのデータ解析をしたい ( 21世紀限定HRランキング)

序論 ある程度まとまったデータの解析をしたいです. でも, 興味のないデータを漫然と弄っても楽しくないです. 今回は, みんなが大好きなメジャーリーグのデータで遊びます. 野球に詳しくなって, さらにRの関数の使い方も練習できます. さっそく, 21世紀のデ…

Rで研究者の業績を調べたい

R

Rは日々パッケージが更新されています. レポジトリには数千のパッケージがあるのでフォローしきれません. 面白そうなものは使っていきたいです.今回は "scholar"パッケージを使います.参考文献 http://www.r-bloggers.com/new-r-package-scholar/ Package "s…

Rで作った地図に統計情報を載せたい

R

アメリカの犯罪者状況を可視化したい Rのデフォルトで使えるデータフレームで, アメリカの州別の暴力犯罪発生率が入っているものがあります. >data(USArrests) >head(USArrests) Murder Assault UrbanPop Rape Alabama 13.2 236 58 21.2 Alaska 10.0 263 48 …

Rで地図を描きたい

R

地図上にデータをプロットしたいときってありますよね.そのための第一段階として, 地図を描きます.ggplot2パッケージを利用します. library(ggplot2) world <- map_data("world") g <- ggplot() + geom_polygon(data = world, aes(x = long, y=lat, group = …

Rで計算時間の比較をしたい(その1)

R

Rは工夫してコードを書かないと遅いことがあります. どの手法が遅いのか. 計算時間を比較して, 最速技法を身につけたいです. 計算時間を知りたければ, time <- system.time( 何かの関数 ) とすればOKです. 計算時間をグラフに表して比較したいです.同じこと…

Rで計算の進行状況を確認したい

R

Rでfor文を回すと遅いです. これを, 高速化とは別の方法で解決したいです. Rでプログレスバーの表示 待ち時間が暇だからよくないのです.コンソールにプログレスバーを表示しましょう. 進捗状況が分かると, 精神が安定しますし.計算の進行に応じて, こんな感…

Rのforeach関数を使って並列計算をしたい (その1)

R

foreach関数とは Rでfor文を回すことはご法度らしいです. 計算が遅いので. Rの高速化のために様々な手段が考えられます. その1つが並列計算です.Rのforeach関数は, Rで並列計算をする際にしばしば登場します. この関数で何ができるのかよく分かりません.なの…

Gershgorinの定理で遊びたい

行列の固有値に関する定理, Gerschgorinの定理があります. スペル分かりません.Gerschgorin? Gershgorin? 2通り観測されます. 正しいほうが分かり次第, 修正します.内容を整理して, 図示して動画も作りたいと思います. Gershgorinの定理 弱い形から. Gershgo…

Rのggplot2でグラフを作りたい

R

Rおじさんだよ 描画が綺麗にできるRパッケージ, ggplot2を使いたいです. 紹介のために, ローレンツ方程式の数値解を描画します. ローレンツ方程式とは. http://en.wikipedia.org/wiki/Lorenz_system ローレンツ方程式はカオス的な振る舞いをする有名な問題で…

quickrun.vimとR

R vim

Macの端末でvimを使っています. .rファイルをquickrunで実行したかったのですが動きません.辛かったので, quickrun.vimを覗いて ’r'のところを \ 'r': { \ 'exec': 'sh -c "R -q --no-save --slave < %s"', \ }, としてしまえば動くようにはなりましたが, こ…

Rで遺伝的アルゴリズム (その1)

R

序論 寒いですね。遺伝的アルゴリズムを使いたくなりますね。しかしMatlabの遺伝的アルゴリズムパッケージは有償です。 やっぱMatlabって糞だわ。300億円あったら買うのに。 C言語でゼロから実装しますか。 そんなの面倒でやりたくないです。お金も頭も使わ…

初めてのUbuntuからRを使うまで

概要 Rを使うところまで頑張ります。 全体としては ・Rのインストール ・Rスクリプトを書く ・Rスクリプトを実行する という流れです。 R環境の整備 まずは統計ソフトRのインストールです。 Ctrl + Shift + T で端末を起動して、 sudo apt-get install r-bas…