データの分析|データの代表値について

数学1データの分析,代表値,平均値,中央値,最頻値

データの代表値を扱った問題を解いてみよう

次の問題を解いてみましょう。

問1
12人の生徒の1ヶ月の読書冊数を調べたら
$\quad 3 \ , \ 2 \ , \ 6 \ , \ 0 \ , \ 4 \ , \ 1 \ ,$
$\quad 5 \ , \ 2 \ , \ 4 \ , \ 1 \ , \ 3 \ , \ 2$
であった。次の値を求めよ。
(1) 平均値
(2) 中央値
(3) 最頻値

問1の解答・解説

問1は、データの代表値を求める問題です。問1(3)で最頻値を求める必要があるので、問題を解く前に、度数分布表を作っておいても良いでしょう。

度数分布表は以下のようになります。

問1の解答例
\begin{align*}
&\text{度数分布表は以下のようになる。} \\[ 5pt ]
&\begin{array}{c|c|c|c|c|c|c|c|c}
{\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\
\hline
{\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12
\end{array}
\end{align*}

この度数分布表も利用しながら問題を解きます。問1(1)は、平均値を求める問題です。平均値は公式を利用して求めます。

データの平均値
\begin{equation*}
\scriptsize{
\quad \text{データの平均値} = \frac{\text{データの値の総和}}{\text{データの大きさ}}
}
\end{equation*}

公式に値を代入して平均値を求めます。

問1(1)の解答例
\begin{align*}
&\text{データの値の総和は、} \\[ 5pt ]
&\quad 3+2+6+0+4+1+5+2+4+1+3+2 = 33 \\[ 5pt ]
&\text{となるので、} \\[ 5pt ]
&\quad \frac{33}{12} = 2.75 \\[ 5pt ]
&\text{よって、平均値は} \\[ 5pt ]
&\quad 2.75 \quad \text{(冊)}
\end{align*}

度数分布表に冊数と度数の積を追記すると、値の総和を求めやすくなります。

問1(1)の別解例
\begin{align*}
&\begin{array}{c|c|c|c|c|c|c|c|c}
{\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\
\hline
{\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12 \\
\hline
{\scriptsize{\text{冊数×度数}}} & 0 & 2 & 6 & 6 & 8 & 5 & 6 & 33
\end{array} \\[ 10pt ]
&\text{度数分布表より、} \\[ 5pt ]
&\quad \frac{33}{12} = 2.75 \\[ 5pt ]
&\text{よって、平均値は} \\[ 5pt ]
&\quad 2.75 \quad \text{(冊)}
\end{align*}

問1(2)は、中央値を求める問題です。データを値の大きさの順に並べ替える必要がありますが、すでに度数分布表があるので、それを利用します。

データの大きさは12なので偶数です。ですから、6番目と7番目の数値の平均値が中央値になります。

中央値を求めるとき、度数分布表に累積度数を追記しておくと求めやすくなります。累積度数は、その名の通り、度数を累積したもので、データの値の小さい方から順に度数を足し算して求めます。累積度数の最後は必ず度数の合計と等しくなります。

度数分布表に累積度数を追記する
\begin{array}{c|c|c|c|c|c|c|c|c}
{\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\
\hline
{\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12 \\
\hline
{\scriptsize{\text{累積度数}}} & 1 & 3 & 6 & 8 & 10 & 11 & 12 & –
\end{array}

2冊までの累積度数が6で、3冊までの累積度数が8です。このことから6番目のデータは2、7番目のデータは3であることが分かります。中央の2つの値が分かったので、中央値を求めます。

問1(2)の解答例
\begin{align*}
&\text{中央の $2$ つの値は、$2 \ , \ 3$ であるので、} \\[ 5pt ]
&\quad \frac{2+3}{2} = 2.5 \\[ 5pt ]
&\text{より、中央値は} \\[ 5pt ]
&\quad 2.5 \quad \text{(冊)}
\end{align*}

問1(3)は、最頻値を求める問題です。度数分布表にまとめると、度数の大きい冊数が分かります。

問1(3)の解答例
\begin{equation*}
\text{度数分布表から、最頻値は $2$ (冊)}
\end{equation*}

度数分布表はデータを整理した表ですが、上手に利用できなければまとめた意味がありません。表の上手な使い方を自分なりにマスターしておきましょう。

同じ値が出てくるデータでは、度数分布表を上手に利用しよう。

問1は基本的な問題だったので、少し応用的な問題を解いてみましょう。

問2
6個の自然数のデータ
$\quad 2 \ , \ 3 \ , \ 3 \ , \ 6 \ , \ 8 \ , \ x$
について、次の各問に答えよ。
(1) 平均値が $4$ となる $x$ の値を求めよ。
(2) 中央値が $4$ となる $x$ の値を求めよ。

問2の解答・解説

問2も、データの代表値である平均値や中央値を求める問題ですが、少し難しく感じるかもしれません。特に、問2(2)のように思考力を必要とする問題は、出題されやすく、差が付きやすいので、しっかり解けるようにしておきましょう。

問2(1)は、平均値を扱った問題なので、公式を利用すれば解けそうだと予想できます。公式を利用すると、$x$ についての方程式を導出することができます。

問2(1)の解答例
\begin{align*}
&\text{データの値の総和は、} \\[ 5pt ]
&\quad 2+3+3+6+8+x = 22+x \\[ 5pt ]
&\text{となる。} \\[ 5pt ]
&\text{平均値が $4$ となるので、} \\[ 5pt ]
&\quad \frac{22+x}{6} = 4 \\[ 5pt ]
&\text{これを解くと、} \\[ 5pt ]
&\quad x = 2
\end{align*}
文字の値を求める問題では、公式や条件を利用して方程式を導出しよう。

問2(2)は、中央値を扱った問題です。データの大きさが6で偶数なので、中央の2つの自然数が中央値となります。中央の2つの自然数は、小さい方から数えて3番目と4番目の自然数です。

ここで注意したいのは、中央の2つの自然数が $x$ の値によって変わることです。$x$ の値を具体的に考えて、3番目と4番目の自然数が何になるのかを調べてみましょう。

中央値を調べる
\begin{align*}
&\text{6個の自然数のデータ} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ 3 \ , \ 6 \ , \ 8 \ , \ x \\[ 5pt ]
&\text{について、} \\[ 10pt ]
&\text{$x=1$ のとき} \\[ 5pt ]
&\quad 1 \ , \ 2 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=2$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 2 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=3$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=4$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{4} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=5$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{5} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=6$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 6 \ , \ 8 \\[ 10pt ]
&\text{$x=7$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 7 \ , \ 8 \\[ 10pt ]
&\text{$x=8$ のとき} \\[ 5pt ]
&\quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 8 \ , \ 8
\end{align*}

調べた結果、中央の2つの自然数は、$x$ 以外の自然数である場合と、$x$ と他の自然数である場合があることが分かります。もう少し詳しくまとめると以下のようになります。

  • $x = 1 \ , \ 2 \ , \ 3$ のとき、中央の2つはともに $3$ ( $x$ 以外の自然数)
  • $x = 4 \ , \ 5$ のとき、中央の2つは $3$ と $x$
  • $x = 6 \ , \ 7 \ , \ \cdots$ のとき、中央の2つは $3$ と $6$ ( $x$ 以外の自然数)

これをもとに $x$ の値について場合分けして、中央値が4となる $x$ の値を求めます。

問2(2)の解答例
\begin{align*}
&\text{$1 \leqq x \leqq 3$ のとき} \\[ 5pt ]
&\quad \text{中央の2つの自然数はともに $3$ であるので、} \\[ 5pt ]
&\quad \text{中央値は $3$ となり、$4$ とならないので不適。} \\[ 10pt ]
&\text{$4 \leqq x \leqq 5$ のとき} \\[ 5pt ]
&\quad \text{中央の2つの自然数は $3$ と $x$ となる。} \\[ 5pt ]
&\quad \text{中央値は $4$ となれば良いので、} \\[ 5pt ]
&\qquad \frac{3+x}{2} = 4 \\[ 5pt ]
&\quad \text{より、} \\[ 5pt ]
&\qquad x = 5 \\[ 5pt ]
&\quad \text{これは $4 \leqq x \leqq 5$ を満たす。} \\[ 10pt ]
&\text{$6 \leqq x$ のとき} \\[ 5pt ]
&\quad \text{中央の2つの自然数は $3$ と $6$ となるので、} \\[ 5pt ]
&\quad \text{中央値は} \\[ 5pt ]
&\qquad \frac{3+6}{2} = 4.5 \\[ 5pt ]
&\quad \text{となり、$4$ とならないので不適。} \\[ 5pt ]
&\text{よって、求める自然数 $x$ は} \\[ 5pt ]
&\quad x = 5
\end{align*}

問2(2)のような問題は、解ける人と解けない人がはっきりするので、入試でも出題されやすい問題です。最初から上手く解こうと考えずに、具体的な数値を使って調べてみましょう。解くきっかけさえ得られれば、それほど難しくありません。

具体的な数値を使って規則性を調べよう。抽象的でイメージが湧かないときは、具体化して考えよう。
Recommended books

データの分析を扱った問題は、測定値や観測値が多いと手際よく表やグラフを使って整理していく必要があります。また、表やグラフの目の付け所も知っておかなければなりません。こればかりは頭で分かっていても、実際に整理したり、表やグラフを扱ったりしたことがないと手際よくできません。

ただ、データを手早く扱うコツや表やグラフから読み取るコツを掴んでしまえば、得点源にできる単元です。単元別の問題集で集中的に取り組んでマスターしましょう。

これから紹介する教材で気になるものがあれば、ぜひ一読してみて下さい。気に入ったら最後まで徹底的にこなしましょう。

オススメその1

『[affi id=65]』は、「データの分析」の学習を短期間でこなすための教材です。教科書レベルから扱っているので、基礎から習得できます。

短時間で「データの分析」の学習が一通りできるように作成した問題集。図の読み取りについては、微妙な違いがわかることが必要となる場合には、違いが判断できるように多くの図を掲載。計算方法については、実際に問題を解くとき効率よく計算を行うことを最優先にして、その計算方法を徹底的にマスターできるように配慮。

[affi id=64]

オススメその2

『[affi id=67]』は、参考書兼問題集です。教科書よりも丁寧に解説されているので、教科書で躓いてもこれでカバーできます。算数から扱っているので、自習でも躓きにくくなっています。

小学校の算数における資料の調べ方から始めて、高等学校の数学Iにおける「データの分析」までを扱った「統計分野」の参考書。中学校までの復習を扱った「ホームルーム」、数学I データの分析で学習する内容をていねいに説明した「授業」、あらゆる問題形式(センター形式や記述式)を演習する「講習」の3部構成。

[affi id=66]

オススメその3

『[affi id=69]』は、メダカカレッジの大上丈彦先生が統計学の基本をまとめた1冊です。「ゆる~いけど、鋭い! 」イラストが人気です。

統計学全般を扱っているので、数学Bの「確率分布と統計的推測」についても解説されています。「確率分布と統計的推測」はベクトルや数列よりも問題に対処しやすいので、ベクトルや数列がどうしても苦手な人は取り組んでみると良いでしょう。

統計学というと「なんだか難しそうだな」と思うかもしれませんが、ポイントをしっかり押さえ、
あまり本質的でないところにこだわらなければ、誰にでも確実に理解できます。
「統計学ってなに?」という素朴な疑問から、マンガでゆる~く解説し、読み終わったときには、
知らないうちに統計学が身に付いているという、いままでにない統計学の入門書です。

[affi id=68]

さいごにもう一度まとめ

  • データの代表値を求めることができるようにしておこう。
  • 中央値はデータの大きさによって求め方が異なることに注意しよう。
  • 同じ値があるときは度数分布表を上手に利用しよう。
  • 具体的な数値を代入してみて、規則性を調べよう。