ブログBlog

平均値・中央値・最頻値

投稿日:2025年10月20日 ビジネス

こんばんは。岡崎です。

2~3年前にBIツールの練習問題を実施した際に、

「平均値が極端な値に引っ張られる場合どうすれば良いか?」

といった設問がありました。

今回は、そういったケースに役立つ、外れ値や傾向の見極めに使える指標について簡単にまとめてみます。


平均値

たとえば、次のようなデータがあるとします。

サンプル 300万円、310万円、320万円、350万円、1億円

このときの平均値はおよそ2,256万円ですが、実際には大半が300〜350万円台です。

このように、極端に大きな値(外れ値)があることで、平均値が実態と離れたものになってしまうことがあります。


外れ値や傾向を把握する他の方法

平均値に加えて、以下のような指標を組み合わせることで、外れ値の存在や分布の偏りを見つけやすくなります。


中央値

中央値は、データを小さい順に並べたときの真ん中の値です。

外れ値の影響を受けにくく、分布が偏っているデータの「中心」を知るのに向いています。

300万円、310万円、320万円、350万円、1億円 → 中央値は320万円

このように、平均よりも現実的な値が見えてきます。


最頻値

最頻値は、データの中で最も多く出現する値です。

特に、商品カテゴリや選択肢が限られるデータでは、「よく選ばれている傾向」を見る手がかりになります。

平均や中央値がバラけるデータでも、最頻値を見ることで、特徴的な集中を発見できる場合があります。


指標の比較
指標 特徴 向いている場面
平均値 全体傾向を見られるが、外れ値に弱い 外れ値が少ないデータ
中央値 中心を示し、外れ値の影響を受けにくい 価格、所得など偏りのある分布
最頻値 最も出現回数が多い値 カテゴリーデータ、人気傾向の把握

まとめ

平均値は便利な指標ですが、極端な値が含まれると、実態と離れてしまうことがあります。

そういったときは、中央値や最頻値でデータの中心や傾向を見直すことで、より正確な分析につながります。

また、外れ値や分布の偏りを視覚的に確認したい場合は、箱ひげ図(ボックスプロット)や散布図などのグラフを活用するのも効果的です。これにより、数値だけでは見えにくい異常値やパターンを直感的に把握できます。

PAGE TOP