統計データに騙されないようにするために 2つの心構えを紹介!

未分類

物事を定量的に語る上で、統計データは大きな武器になります。
しかし、この統計データが正確に計測されたもの、かつ作為的に計測されていないものであるとしても、解釈次第で誤った結論に至ってしまうことがあります。

この記事では、誤った結論に至ってしまう以下の2点の要因について、説明していきます。

1.前提条件の読み誤り
2.因果関係の読み誤り


1.前提条件の読み誤り

これは、統計データを実験で得ている場合に特に注意が必要になります。

例えば、ある画面で検索ボタンを押して結果が表示されるまでの時間が、実験により平均1秒であることがわかったとします。
しかし、実際に運用した際に平均1秒で結果が表示されるとは限りません。
実際の運用では、複数ユーザーによるシステム利用や裏で動いているバッチ処理により、危機に負荷がかかっている可能性があるからです。
この負荷により、2秒や3秒、あるいはそれ以上かかる場合が出てきます。

このような実験を行う際は、実運用に条件を近づけることが肝要になります。
例えば、疑似的に不可をかけるプログラムを裏で動かす、人を集めて同時にシステムを利用してもらう、といった、条件を近づけるための工夫が重要になります。


2.因果関係の読み誤り

これは、現実の活動から統計データを得ている場合に特に注意が必要になります。

例えば、手順書を用意している作業では作業ミスが高頻度で発生する、という統計データが得られたとします。
この統計データをもって、「作業ミスを減らすためには手順書を用意せずに作業するのが良い」という結論を導き出すのは危険です。

手順書の有無と交差点の作業ミスの発生頻度が関連している理由として、「手順書を用意すると作業ミスが増える」という理由以外にも、「作業ミスが出やすい作業で手順書を用意しているため」という逆の因果関係の理由も考えられるからです。
手順書には作業ミスを減らす効果があり、手順書があってもなお作業ミスが高頻度で発生する、ということかもしれません。
(むしろ、そう考える方が自然でしょう)

このように、得られた統計データから因果関係を導き出したい場合は、そのような統計データとなった背景に考えを巡らせる必要があります。


【あとがき】

統計データの読み取りのスキルは、社会人に一般に求められるスキルですが、システムの開発や運用の現場でも役立つものです。
こうしたスキルがあれば、プログラミングスキルのような技術力を仕事の中でより活かしやすくなります。

株式会社サイゼントでは、即戦力のJavaプログラマーを育てるための書籍「絶対にJavaプログラマーになりたい人へ」をKindleで販売しています。


また、上記の書籍をテキストとして用いたプログラミングスクール「サイゼントアカデミー」も開校しています。
このスクールは、受託開発事業・SES事業である弊社が、新入社員向けの研修で培ったノウハウを詰め込んだものです。


ご興味がある方は、上記画像から個別ページにアクセスしてみてください!

コメント

タイトルとURLをコピーしました