久保拓弥,データ解析のための統計モデリング入門,岩波書店.

 

 この本は一部では「みどり本」とも呼ばれているようです。著者は北大の生物系の先生です。全体を読んでみて、統計モデリングの入門本として、とてもいい本だと思いました。その理由として、以下の3つを挙げます。

1.語り口がやわらか(ひらがなと絵が多い)
著者は統計学者でも情報系の先生でもありません。統計手法を研究している先生ではなく、統計モデリングを使う側の先生なのだと思います。なので、具体的なデータをどのようにして、分析するかという姿勢が、文中からひしひしと伝わってきます。大学の教科書は高校までのとは違って、文体が急に堅苦しくなって、読む者を拒んでいるような印象をもってしまう人もいるかと思います。いわゆる大学の教科書アレルギーのある人でも、この本だと、どんどん読めると思います。
また、この本にはひらがなが多い印象をもちます。難しそうな本には、大量の漢字、大量のカタカナ、大量の数式が含まれているものですが、この本はいずれにもあてはまりません。その代りに、大量のひらがなと大量の絵(図)が含まれていて、とっつきやすいです。

2.例がわかりやすい
この本では、一貫して「種子数の統計モデリング」を例として、話を進めていきます。「種子数の統計モデリング」とはある植物個体からいくつの種がとれるか、といった話です。きわめて基本的な実験例なので、すっと理解できます。植物個体と種子数の関係を具体例として、ポアソン分布による最尤推定に始まり、一般化線形モデル、一般化線形混合モデル、マルコフ連鎖モンテカルロ法、階層ベイズモデルに至るまでを理解できます。具体例が一貫しているということが、こんなに理解を容易にさせるんだと感心しました。

3.Rの勉強も同時にできる
この本には、Rのコードもあわせて記載しています。なので、Rを動かしながら、勉強をすることができます。個人的に、統計学は数式を手で追っていくのも大事だとは思いますが、具体的なデータを分析できたという体験をすることも大事だと思います。なんとなく、Rを使っていると、すごいことをしているような気がしますし、グラフを描画したときには、すこし楽しい気持ちにもなれます。