2013年7月6日土曜日

統計学が最強の学問である を読みました。

統計学が最強の学問である (西内 啓 著、2013.1発行)を読みました。

統計学が巷で話題な中、一般向け統計学の本ということで書店でも平積みされて良くみかけるので、どんなものかよんでみることにしました。

タイトルからして、なかなか強気な本です。
計測値などの観測結果を処理し、その意味や傾向を分析し、さらには意図することを実現するにはどのようにするのが効果的かということを統計的に導くことで、数少ない経験や勘に頼るよりも、良い結論を導く確率は高まり、説得力も持つというのが、統計学の実際に強力な面。
ITや計算機技術の発展により、これまで以上に大規模なデータをすばやく処理できるようになり、ビッグデータの活用といった話を良く聞くようになっている今、統計学は非常に重要であるのは確かなような気もします。

ただ、本書でも述べられていますが、大量のデータから特徴を抽出したりしても、そこから目的を果たすためにどうすればよいかが最終的に重要で、必ずしもビッグデータである必要もないし、サンプリングの条件や変数の間の相関などを注意しなくては、誤った結論を導きだしてしまうこともある。
だからこそ、計測値やそれらから導かれる推定値の精度、さまざまな制約下でより良い結論をより早く導く統計学の正しい理解が重要。

データ分析に必要となる統計的内容は一通り書かれ、サンプルのランダム化や変数の独立性が十分でないと、得られた数値から誤った結論を導くことになってしまう場合についても説明されていて、結果はその取得のしかたや精度について、慎重に読み解く必要があることも含めて、統計でこんなことができるのかとか、このような分析をするのかといったことがわかる本だと思います。

一般向けの本なので、統計学のエッセンスについても、極力イメージがつかめるように書かれています。それでも、理系大学を出ていたり、文系分野でも統計を一度は学んだりしたことがなければ、理解は少し難しいのではないかと思いました。

実際に統計分析をしたいと思えば、いまではツールもいろいろ出ていて、データを入れれば何かしら答えが出てしまい、新たな知見を得た気がしてしまいがちなことが多いと思います。
統計的にデータを分析するときの制約からくる注意点について、もっと例を増やしたり冗長になっても説明を繰り返してあれば、さらに良かったように思いました。

                

0 件のコメント: