湯どうふ

久保拓弥,データ解析のための統計モデリング入門,岩波書店.

 

 この本は一部では「みどり本」とも呼ばれている。著者は北大の生物系の先生である。全体を読んでみて、統計モデリングの入門本として、とてもいい本だと思った。その理由として、以下の3つを挙げる。

1.語り口がやわらか(ひらがなと絵が多い)
著者は統計学者でも情報系の先生でもない。統計手法を研究している先生ではなく、統計モデリングを使う側の先生なのだと思う。なので、具体的なデータをどのようにして、分析するかという姿勢が、文中からひしひしと伝わってくる。大学の教科書は高校までのとは違って、文体が急に堅苦しくなって、読む者を拒んでいるような印象をもってしまう人もいるかと思う。いわゆる大学の教科書アレルギーのある人でも、この本だと、どんどん読める。
また、この本にはひらがなが多い印象をもつ。難しそうな本には、大量の漢字、大量のカタカナ、大量の数式が含まれているものだが、この本はそうではない。その代りに、大量のひらがなと大量の絵(図)が含まれていて、とっつきやすい。

2.例がわかりやすい
この本では、一貫して「種子数の統計モデリング」を例として、話を進めていく。「種子数の統計モデリング」とはある植物個体からいくつの種がとれるか、といった話である。きわめて基本的な実験例なので、すっと理解できる。植物個体と種子数の関係を具体例として、ポアソン分布による最尤推定に始まり、一般化線形モデル、一般化線形混合モデル、マルコフ連鎖モンテカルロ法、階層ベイズモデルに至るまでを理解できる。具体例が一貫しているということが、理解を容易にさせる。

3.Rの勉強も同時にできる
この本には、Rのコードもあわせて記載している。なので、Rを動かしながら、勉強できる。個人的に、統計学は数式を手で追っていくのも大事だとは思う、具体的なデータを分析できたという体験をすることも大事だと思う。なんとなく、Rを使っていると、すごいことをしているような気がするし、グラフを描画したときには、すこし楽しい気持ちにもなれる。