2018年の夏から統計検定2級の勉強を始めて、2019年11月 の試験でようやく合格することができました。
特にS判定でも、A判定でもなくおそらくギリギリ合格なのですが、ようやく謎のプレッシャーから解放されるので安心しております。
- 何故受けようと考えたのか?
- 勉強法
- 今後どうするか?
等、覚えているうちにまとめておこうかと思います。
どのような立場でまとめているか?
-
サーバーサイドエンジニア
-
機械学習は好き、Pythonはそこそこ書ける。
-
ソフトウェア品質管理には興味がある。
統計検定とは?
統計検定とは|統計検定:Japan Statistical Society Certificate を引用します。
「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。 データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。 日本統計学会は、中高生・大学生・職業人を対象に、各レベルに応じて体系的に国際通用性のある統計活用能力評価システムを研究開発し、統計検定として実施します。
統計検定2級は 大学基礎統計学の知識と問題解決力
を問われます。
大学の1年次、2年次での一般教養レベルで習う統計の知識があれば、合格できるレベルなのかと思います。
合格率について
受験データ 2019年6月16日試験|統計検定:Japan Statistical Society Certificate
に記載がありますが、45.6% だいたい5割程度です。
個人的には大分苦労したので、非効率な学習をしていたのかもしれません。
何回受けたか?
4回目でようやく合格しました。
1回目をCBTで受験し、その後3回は、通常試験を受けました。
回数は多いほうだと思います。。
何故受けようと思ったか?
いくつか受けようと思った理由を記載します。
-
機械学習の習熟度を上げたかった
2017年くらいから、scikit-learn「アルゴリズム・チートシート」を見ながら、気になった手法でデータ分析、機械学習を勉強していました。
一通り使い方を覚えたので、次にDeep Learning の勉強をしようかとも思ったのですが、scikit-learn を使っていると登場する p値や、検定という言葉が意味不明で、統計用語だということがわかっていました。
Deep Learning の前に統計を学習することで、scikit-learn でやっていることがより理解できるようになると思いました。 -
品質管理業務、品質保証業務での知識の足し
仕事上は、データサイエンティスト的な業務をすることはなく、サーバーサイドエンジニアとしてバグ表の管理、レビュー記録の管理など実施します。
統計的品質管理とも言ったりするので、統計的にデータが見れるようになると、品質管理業務、品質保証業務 でもメリットがあるかなと思いました。 -
効果測定での知識の足し
仕事上、効果測定のできない、もしくは手法がわからない等、ROIがうまく測定できない時がたまにありなんとかならないかという問題意識がありました。
Webアクセスがポアソン分布に従うとか、ABテストの検証がカイ二乗検定で評価できるなどの知識を得たかったです。
勉強法について
3回落ちているので、全く参考にならなそうですが、どんなことをしていたのか記載します。
書籍を読んだ
他の合格した方が購入した書籍を参考に以下の書籍を購入し、通勤中読んでいました。
-
統計学入門 (基礎統計学Ⅰ) | 東京大学教養学部統計学教室 |本 | 通販 | Amazon
個人的には、最初読んだ時はあまり頭に入らず、他の書籍を読んだ後、読み返してその深みに気づく感じでした。
コラムや、式に挟まれた事例っぽい内容がためになることに精読して気がつきました。 -
マンガでわかる統計学入門 | 滝川好夫 | 数学 | Kindleストア | Amazon
Kindle 版がちょうど安くなっていて、購入しました。
会社帰りに4-5km歩いているのですが歩きながら読んでいました。統計学入門 (基礎統計学Ⅰ) を読む前に読むのが良いかと思います。 -
史上最強 図解 これならわかる!統計学 | 涌井 良幸, 涌井 貞美 |本 | 通販 | Amazon
統計学入門 (基礎統計学Ⅰ) を読む前に読むのが良いかと思います。数量化3類 等 統計学入門 (基礎統計学Ⅰ) には記載がない内容も載っています。 -
史上最強図解 これならわかる!ベイズ統計学 | 涌井良幸, 涌井貞美 | Kindle本 | Kindleストア | Amazon
統計検定2級のベイズの定理の問題がわからず、購入しました。わかりやすいです。
ただ、統計検定2級ではベイズの定理の問題は出題があっても1問程度なので、試験観点だとROIは良くありません。
過去問を解いた
2011-2013、2015-2017 の統計検定 2級の問題集を購入して、2回問題を解きました。
-
日本統計学会公式認定 統計検定 2級 公式問題集[2011〜2013年] | 日本統計学会 |本 | 通販 | Amazon
-
日本統計学会公式認定 統計検定 2級 公式問題集[2015〜2017年] | 日本統計学会 |本 | 通販 | Amazon
Webで参考にした情報
検定、信頼区間、確率分布の過去問の正答率が悪かったので、Webで関連情報を調べてまとめていました。
良く見ていたサイトは以下になります。
-
統計WEB - 統計学、調べる、学べる、BellCurve(ベルカーブ)
1分野をピンポイントで調べる際は良く見ていました。 -
Logics of Blue | 統計分析や統計的予測・意思決定理論など
カイ二乗検定の記事がわかりやすかったです。これがなければ問題が解けなかった。 -
R-Tips
Rを使って確率分布の計算をする際に良く見ていました。
統計検定3級から勉強することにした
2度目の受験で落ちて、全く受かる気がしなかったので、3級から勉強することにしました。
結果3度目で3級は受かり、4度目で2級に受かったので基礎固めはやってよかったと思いました。
記述統計の問題は、2級も3級も内容はそれほど変わりなく、3級の勉強は2級でも役に立ちます。
Jyupter Notebook を作った
統計学入門 (基礎統計学Ⅰ) に記載のある確率分布等、統計検定に関係するトピックに対する Jyupter Notebook を作って実際にプログラムを動かして試していました。
統計検定の勉強にもなりましたが、作った Notebook がそれなりにアクセス数を稼いでいて、広告収入の面でも学習の面でも良かったと思います。
* カテゴリーの投稿を見る データ分析 | Monotalk
ノートを作った
間違った問題については調べてノートを作っていました。
3級受けた時と、2級ノートをそれぞれ作りました。
* mutter.monotalk.xyz- 統計検定2級 ノート
* mutter.monotalk.xyz- 統計検定3級 ノート
おすすめの受験方法
統計検定2級は、計算問題や積分知ってないと解けない問題が出ます。
大学卒業から10年以上経っている方の場合、数学のやり直しの意味で3級から受験されるのが良いのではと思います。
もしくは高校数学を少し勉強しなおすとかやれば、いきなり2級でも良いのかと思います。
プログラミングはそれなりにやっているとはいえ、私にいきなり2級は難しかったです。
取得したことでどんなメリットがあるか?
個人的には取得するために統計を勉強したことで以下ができるようになりました。
-
Excel、スプレッドシートのデータを見たら、どんなグラフで描画すれば良いか判断ができるようになった。
記述統計を勉強したことで、どんなグラフで描画すべきか以前よりもすぐ判断できるようになりました。 -
とりあえず、基本統計量を計算するようになった。
スプレッドシートや、RDBから取得したCSVファイル等の分析対象項目の基本統計量を計算するようになりました。 -
Webサービスの負荷テストの評価、負荷見積もりに、統計の知識が使える。
Webサービスの負荷見積もりや、負荷テストの評価 に区間推定等、統計的な知識が使えます。
今後どうするか?
以下のようなことを考えています。
-
統計調査士、専門統計調査士 の取得を目指す
人文・社会科学の統計学 - 東京大学出版会 を買って読んだら面白いと思えたので、 専門統計調査士、統計調査士を受けてみたいとも思います。 -
統計検定準1級の取得を目指す
統計検定2級の取得に、1年以上かかったので、どれだけ時間がかかるかわかりませんが、準1級を受ける方向もありかもしれません。
統計検定 準1級|統計検定:Japan Statistical Society Certificate -
Deep Learning を学習する
Deep Learning を学習するか統計検定を取るかで迷っていたので、Deep Learning を勉強するかもしれません。 -
QC検定とか、 JCSQE ソフトウェア品質管理系の資格取得を目指す
統計学の勉強の動機として、ソフトウェア品質管理で使えそうというのはあります。
いっそのことソフトウェア品質に関わる資格をとるというのも思い浮かびました。
参考
-
【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた - Qiita
scikit-learn のアルゴリズムチートシートの説明記事です。 -
大学で学ぶ「統計学」の,入門用の講義ノートPDF。データ分析や確率統計の基礎 - 主に言語とシステム開発に関して
Web上で読めるPDF等の統計関連の文書のリンク集。試験後に知りました。
以上です。
コメント