偏差値の求め方と性質
偏差値とは
偏差値とは、観測したデータ群と個別のデータ(観測値)を比較することによって得られる数値です。
もう少し詳しく説明すると「観測したデータが正規分布に従うと仮定したうえで、平均が50、標準偏差が10(つまり分散が100)となるように規格化する」とことで求められます。
偏差値の意義
テストの結果を偏差値で比較する場合を考えます。
偏差値は「平均50、標準偏差10」で求められる値なので、あなたの偏差値が50ならば平均レベルであるということになり、偏差値が高いほど周りと比べて高い点数、偏差値が低いほど周りと比べて低い点数を取ったと理解することができます。
さらに偏差値が便利なのは、異なるテストの結果を比較できるという点です。「数学のテストにおいて、学校の定期試験で90点、全国模試で60点取った」としましょう。
この場合、単純に点数で比較すると30点落ちているからダメな結果だったということになりますが、この比較方法ではテストによって問題や難易度が異なることが考慮されていないので良い比較方法とは言えません。
このようなときに偏差値を用いて、各回で自分が取った点数が周りの人と比較してどの程度だったかを算出することで、テスト結果を公平に比較することができるのです。
偏差値の求め方
偏差値は以下の式で求められます。
は、正規分布の標準化という正規分布を標準正規分布に変形する操作をしています。これによって、データがどのような形の正規分布に従っていても、同じ指標に変換して比較できるようになります。
次に、「標準化した結果を10倍」しています。ここで10倍しているのは、標準化によって得られる数値があまりにも小さいため、10倍して分かりやすくしているのです。
最後の「50を足す」というのは、偏差値の分布の平均を50にするための操作です。これも平均は50の方が、指標として分かりやすいからです。
これによって、正規分布に従うどの様なデータ群も、「平均50、標準偏差10の正規分布に規格化(得点調整)」されます。
偏差値が適さないケース
データの比較に有用な偏差値ですが、以下の場合には指標として適さない可能性があります。
観測できるデータ数が少ない場合
偏差値は、観測したデータ群が正規分布に従うと仮定しています。これは、「世の中のデータは標本数が増えると正規分布に従う」という性質を利用しているからです。
ですので、観測したデータ数が少ない場合は、正規分布に従うと仮定できず偏差値の定義が覆ってしまいます。
データの値がすべて等しい場合
もし、すべてのデータが等しい場合、平均と個々のデータが一致し標準偏差が0すなわちに偏差値の公式の第1項の分母が0になり計算不能になってしまいます。
カテゴリ: 統計学の基礎
関連するサービス
記事の筆者
AVILEN編集部
株式会社AVILEN