受験生や独学する一般人のための学習サイト

  

代 表 値

与えられた資料について、その特徴や傾向を示す尺度となる数値を代表値 といいます。 代表値を求める場合、まず、資料の範囲 (レンジ) を求めてから、適当な値の階級と階級の幅を設定して度数分布表をつくることからはじめます。

主な代表値

ある資料において、全体の特徴を表している数値のことを代表値(だいひょうち) といい、次の \(3\) つがあります。

平均値 \(:\) 資料全体の合計を資料の全個数で割った値

\(\mathbf{平均値}\;=\; \cfrac{\mathbf{資料の数値の合計}}{\mathbf{資料の全個数}}\)

の式で表せます。度数分布表を用いて表す場合は、

\(\mathbf{平均値}\;=\; \cfrac{\mathbf{(階級値 \times 度数) の合計}}{\mathbf{度数の合計}}\)

のようにします。

最頻値(さいひんち) \(:\) モードともいい、資料の値の中で、〈最〉も現れる〈頻〉度が高い〈値〉のこと。度数分布表では、最も度数が高い階級の階級値

中央値(ちゅうおうち) \(:\) メジアンともいい、すべての資料をその値の大きい(または小さい)順に並べたとき、〈中央〉にあるものの〈値〉

度数の合計(\(=\) 資料の個数の合計)が偶数の場合、 中央値は \(2\) つ存在し、それらの平均値になります。 また、資料の値の中で最も大きい値を「最大値」、最も小さい値を「最小値」といい、資料の値の最大値と最小値の 範囲(= レンジ) といいます。 この範囲は、資料の散らばっている幅を示します。

次は、あるクラスの生徒 \(40\) 名の体重を表す資料です。これを整理して、代表値を求めます。

\(50\) \(58\) \(40\) \(63\) \(46\) \(49\) \(38\) \(48\) \(44\) \(56\)
\(39\) \(51\) \(59\) \(41\) \(65\) \(48\) \(57\) \(40\) \(53\) \(54\)
\(58\) \(48\) \(63\) \(41\) \(42\) \(61\) \(56\) \(53\) \(62\) \(47\)
\(51\) \(53\) \(44\) \(48\) \(61\) \(54\) \(43\) \(60\) \(46\) \(57\)

\(\boldsymbol{(1)}\) \(\boldsymbol{40}\) 名の体重の範囲(レンジ)を求める
 資料の値を小さい順に並べます

1 2 3 4 5 6 7 8 9 10
\(38\) \(39\) \(39\) \(39\) \(40\) \(40\) \(41\) \(41\) \(42\) \(43\)
11 12 13 14 15 16 17 18 19 20
\(44\) \(44\) \(46\) \(46\) \(47\) \(48\) \(48\) \(48\) \(48\) \(48\)
21 22 23 24 25 26 27 28 29 30
\(48\) \(49\) \(50\) \(51\) \(51\) \(53\) \(53\) \(53\) \(54\) \(54\)
31 32 33 34 35 36 37 38 39 40
\(56\) \(57\) \(57\) \(58\) \(58\) \(59\) \(60\) \(61\) \(62\) \(63\)

\(40\) 名の体重のうち最も大きいのは 「\(\boldsymbol{63}kg\)」、最も小さいものは 「\(\boldsymbol{38}kg\)」 ですから、体重の範囲 \((=\;レンジ)\) は \[\boldsymbol{63-38=27}\;(kg)\]

\(\boldsymbol{(2)}\) 最初の階級を「\(\boldsymbol{30}kg\) 以上 \(\boldsymbol{35}kg\) 未満」 として度数分布表をつくる

階級の幅は 「\(5kg\)」、体重の最大値は「\(63kg\)」なので最後の階級を「\(\boldsymbol{60}kg\) 以上 \(\boldsymbol{65}kg\) 未満」 に設定します。

体 重 \((kg)\) 人 数 (人)
\(30\;\small{以上}\hspace{5px}\normalsize{\sim\hspace{5px}35}\;\small{未満}\)
\(35\hspace{5px}\sim\hspace{5px}40\)
\(40\hspace{5px}\sim\hspace{5px}45\)
\(45\hspace{5px}\sim\hspace{5px}50\)
\(50\hspace{5px}\sim\hspace{5px}55\)
\(55\hspace{5px}\sim\hspace{5px}60\)
\(60\hspace{5px}\sim\hspace{5px}65\)

次に、\((1)\) の表を見ながらそれぞれの階級のらんへ人数を書き入れます。

体 重 \((kg)\) 人 数 (人)
\(30\;\small{以上}\hspace{5px}\normalsize{\sim\hspace{5px}35}\;\small{未満}\) \(0\)
\(35\hspace{5px}\sim\hspace{5px}40\) \(4\)
\(40\hspace{5px}\sim\hspace{5px}45\) \(8\)
\(45\hspace{5px}\sim\hspace{5px}50\) \(10\)
\(50\hspace{5px}\sim\hspace{5px}55\) \(8\)
\(55\hspace{5px}\sim\hspace{5px}60\) \(6\)
\(60\hspace{5px}\sim\hspace{5px}65\) \(4\)
\(40\)

\(\boldsymbol{(3)}\) \(\boldsymbol{(2)}\) から平均値を求める
度数分布表を使って平均値を求めるには階級値と、\((\)階級値 \(\times\) 度数\()\) が必要になるので、 上の表に必要な項目を加えていきます。

階級 \((kg)\) 階級値 度数 (人) 階級値 \(\times\) 度数
\(30\;\small{以上}\hspace{5px}\normalsize{\sim\hspace{5px}35}\;\small{未満}\) \(32.5\) \(0\) \(0.0\)
\(35\hspace{5px}\sim\hspace{5px}40\) \(37.5\) \(4\) \(150.0\)
\(40\hspace{5px}\sim\hspace{5px}45\) \(42.5\) \(8\) \(340.0\)
\(45\hspace{5px}\sim\hspace{5px}50\) \(47.5\) \(10\) \(475.0\)
\(50\hspace{5px}\sim\hspace{5px}55\) \(52.5\) \(8\) \(420.0\)
\(55\hspace{5px}\sim\hspace{5px}60\) \(57.5\) \(6\) \(345.0\)
\(60\hspace{5px}\sim\hspace{5px}65\) \(62.5\) \(4\) \(250.0\)
\(40\) \(1980.0\)

よって、平均値は \begin{eqnarray} & &\small{\text{平均値}}=1980 ÷ 40\\[5px] & &\;=(2000-20) \div 40\\[5px] & &\;=50-0.5\\[5px] & &\;=\boldsymbol{49.5}\;(kg) \end{eqnarray} となります。
度数分布表を利用する以外に、もとの資料を用いてそのすべての和を求める方法もありますが、 度数分布表の場合とは出た数値が異なることを覚えておいてください。

\(\boldsymbol{(4)}\) \(\boldsymbol{(2)}\) からモードを求める
度数分布表において、最も度数の高い階級は 「\(45kg\) 以上 \(\sim\;50kg\) 未満」の「\(10\)」であり、この階級の階級値がモードになるで、 \[(45+50) \div 2=\boldsymbol{47.5}kg\] になります。

\(\boldsymbol{(5)}\) \(\boldsymbol{40}\) 名の体重のメジアンを求める
中央値は、\(1\) 番最初からと \(1\) 番最後からの位置が同じところにあるので、

\(\boldsymbol{1}\) 番目から中央値までの個数 \(=\) 中央値から最後までの個数

度数の合計が偶数と奇数では、中央値の求め方が異なります。

・奇数の場合:
奇数は 「\(\boldsymbol{2}\) で割ると \(\boldsymbol{1}\) 余る数」 ですから、 整数を \(n\) で表せば \[\boldsymbol{\color{darkblue}{2n+1}}\] よって、中央値は \(\boldsymbol{n+1}\) 番目の数になります。
\(n=9\) の場合、 \[\color{blue}{9=2 \times 4+1}\] より、\(4+1=5\) 番目の位置が中央値になります。

\(\{\qquad 4\qquad\}\) 中央値 \(\{\qquad 4\qquad\}\)
\(1\) \(2\) \(3\) \(4\) \(5\) \(6\) \(7\) \(8\) \(9\)

\(5\) の位置が中央値

・偶数の場合:
偶数は 「\(\boldsymbol{2}\) で割り切れる数」 ですから、整数を \(n\) で表せば この数は \[\boldsymbol{\color{darkblue}{2n}}\] よって、度数の合計が偶数のとき、中央値は \(n\) 番目と \(n+1\) 番目の \(2\) 数の平均になります。
\(n=10\) の場合、 \[\color{blue}{10=2 \times 5}\] より、\(5\) 番目と \(6\) の数の平均が中央値になります。

\(\{\qquad 4\qquad\}\) 中央値 \(\{\qquad 4\qquad\}\)
\(1\) \(2\) \(3\) \(4\) \(5\) \(6\) \(7\) \(8\) \(9\) \(10\)

\(5\) の位置 \(+6\) の位置の平均が中央値

問題の度数は \(40\) と偶数なので、中央値は\(\boldsymbol{20・21}\)番目の数の平均値になります。 \((1)\) の表から、\(40\) 名の体重の中央値(メジアン)は \(20\) 番目と \(21\) 番目の資料の平均値ですが、どちらも 「\(48\)」と同じであるから、その平均は、 \[(48+48) \div 2=48\] になります。

inserted by FC2 system