知識ゼロから統計検定2級に合格するまで
データ分析に必要な基礎的な統計知識を習得することを目標に、2018年前期(6月)に統計検定2級を受験し無事に合格したので、その時使用した参考書や勉強方法を記録です。
スケジュール
統計の基礎を1ヶ月。過去問を使用した勉強が3ヶ月。合計4ヶ月ほど。
勉強時間は平日は1時間半くらい。休日は2〜3時間ほど。
スペック
数学苦手。統計の知識はほぼなし。分散、標準偏差が曖昧なレベル。
使用した参考書
- 統計の基礎
まずはこの一冊から 意味がわかる統計学 (BERET SCIENCE)
- 作者: 石井俊全
- 出版社/メーカー: ベレ出版
- 発売日: 2012/01/01
- メディア: 単行本
- 購入: 4人 クリック: 15回
- この商品を含むブログを見る
1冊目にハードルをあげるのはよくないと考えて中学数学程度の知識で読み通せる本から始めました。 第1章は殆ど数式を用いないで検定や区間推定を俯瞰し、第2章からは確率変数を導入してややステップアップした内容になっています。この章立てが自分には丁度良いレベル感で読みやすかったです。
Amazonでは以下の「完全独習 統計学入門」も人気が高いようです。本屋さんでパッと中身を見て自分に合いそうな方を選びました。
- 作者: 小島寛之
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2013/06/17
- メディア: Kindle版
- この商品を含むブログ (2件) を見る
- 回帰分析
統計学が最強の学問である[実践編]――データ分析のための思想と方法
- 作者: 西内啓
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2014/10/24
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (7件) を見る
例年試験では必ず重回帰分析の結果の解釈問題が出題されます。「まずはこの一冊から」では単変量の最小二乗法による回帰直線の求め方しか触れていません。 統計検定の為ではなく通勤の合間の読書として購入しましたが、実践的な内容で重回帰分析の解釈の仕方が説明されており、この分野の知識を補うことができました。統計検定と結びつけて紹介しているブログなどは多分ないと思いますが、付録に数理的な背景も載っており意外とオススメです。
- 確率
長岡先生の授業が聞ける高校数学の教科書数学 (考える大人の学び直しシリーズ)
- 作者: 長岡亮介
- 出版社/メーカー: 旺文社
- 発売日: 2011/09/23
- メディア: 単行本
- 購入: 2人 クリック: 19回
- この商品を含むブログ (5件) を見る
袋から玉を取り出したり、じゃんけんで勝つ期待値など数Aのセンター試験ででるような確率や条件付き確率も出題されます。統計検定の勉強を始める前に高校数学全体の復習を上記の本でざっと勉強していたのでこの本を紹介しますが、適当な本で数Aの問題を勉強すればこの分野は問題ないと思います。
- 過去問
日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年]
- 作者: 日本統計学会
- 出版社/メーカー: 実務教育出版
- 発売日: 2018/03/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
当たり前ですが一番重要です。使用できる過去問は2016年までの6回分を、4回は時間に測らずに自分の頭で考え、分からなかったらネットや参考書をみて時間をかけてでも自力で答えを出すようにし、2回分はキッチリ時間を測りました。
- その他
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る
統計学の入門の勉強としてスタンダードなのがこの「統計学入門」(通称赤本)みたいです。網羅性は確かに高いのですが、読み解いていくのに大学レベルの数学知識が必須なので数学が苦手な私はだいぶ苦労しました。なので、つまづいたときの辞書の用途や、基礎が理解できた後により理解を深める副読本として使用しました。 私は読み通してないのでこれがなくても2級は受かると思います。
試験について
図をかなり細かいところまで読み込まないと解けない問題があったりしてとにかく時間が足りませんでした。いくつかはほぼ直感で選んだのもあります。これが外れていたら多分落ちてます。簡単に解けるオーソドックスな問題をいかに落とさないようにすることが重要だと思います。
試験後に数学教室で無料の解説授業があったので参加してみました。 講師の先生によると、より本質的な部分を問うような問題が増えてだんだん難化している印象とのことです。 一方でいつでも受けることができるCBT方式はプールされている問題からチョイスして出題されているためペーパーテストより問題が平均化されやすと話していました。特にこだわりがなければ結果もすぐに出るみたいですし、通年受けることができるCBT方式の方が精神衛生的に楽かと思います。
総括と準一級について
平均、分散、標準偏差などの統計指標の意味が理解できるようになり、箱ひげ図やコレログラムなど分析に使用されるチャートの見方もわかるようになりました。
ただ、検定や推定は機械学習の分野では全然使わないのでほとんど忘れかけています。というかもう忘れています。
最近の機械学習ブームによるものだと思いますが、準一級の傾向として本来の出題範囲と異なる機械学習で使うような分野の問題が出題されているようです。準一級はまだ始まって間もなく出題傾向が安定していないので、勉強外から出題されたら...と考えるとちょっとリスクが高いです。もう少しタイミングを見ていずれ受けたいと思います。