300億円欲しい

メジャーリーグのデータ解析します

Rで文芸的プログラミングがしたい

Rの話です.

文芸的プログラミングとは

文芸的プログラミングってなんですかね. その説明から入ります.

ソースコードを読んでも, コードが何をしているのか分からないこと. ありますよね.
自分が書いたコードなんだから覚えているだろ...と甘えて, コメントをサボってしまいます.
結果理解できずに, また最初から書き直す羽目になります. アホですね.

解決策.
コードをそのままドキュメントにすればいいんです.
これが文芸的プログラミングだ....と思っています.
解説を書きながらコードを書くスタイルです.
文芸的プログラミング - コンピュータサイエンスの第一人者 Donald Knuth博士が提唱しているプログラミングスタイル。

Rのknitrで文芸的プログラミング

~knitr+pandocではじめる~『R MarkdownでReproducible Research』
なるほど.
Rスクリプトの解説と実行内容, 図表がいっぺんに書けます.
図の切り貼りや, 計算結果のコピペが必要無くなります. 楽ですね.
簡単な文書なら, コードと一緒に書いてしまうほうがいい気がします.

Rのknitrパッケージは,
"文書の中にRスクリプトが挟まっているコード"を翻訳して, 文書ファイルを作ってくれます.
試しに作ってみましょう.
久保先生の"データ解析のための統計モデリング入門"の写経をしました.


こんな感じのコードをknitrに読ませて,
https://github.com/gghatano/kubo_book/blob/master/chap7.Rmd
HTMLファイルを作ってもらいました.
https://github.com/gghatano/kubo_book/blob/master/chap7.html
中身はこんな感じです.
f:id:gg_hatano:20140225232014p:plain

これで日報を書く手間が減りますね. レポートも書けます. 素敵です.
以上です.

おわりに

図の位置調整などはオプション指定で実現するらしいです. よく分かっていません.
TeXで出力もできるみたいです. Rsweave? よく分かっていません.
また, Rstudio内では問題なかったggplot2でのプロットが, HTMLで死んでいるところがあります. よく分かりません.