データの分析|データの代表値について

数学1

数学1 データの分析

データの代表値を扱った問題を解いてみよう

次の問題を解いてみましょう。

問1

$12$ 人の生徒の $1$ ヶ月の読書冊数を調べたら

\begin{align*} &\quad 3 \ , \ 2 \ , \ 6 \ , \ 0 \ , \\[ 7pt ] &\quad 4 \ , \ 1 \ , \ 5 \ , \ 2 \ , \\[ 7pt ] &\quad 4 \ , \ 1 \ , \ 3 \ , \ 2 \end{align*}

であった。次の値を求めよ。

$(1)$ 平均値

$(2)$ 中央値

$(3)$ 最頻値

問1(1)の解答・解説

問1は、データの代表値を求める問題です。問1(3)で最頻値を求める必要があるので、問題を解く前に、度数分布表を作っておくと良いでしょう。

度数分布表は以下のようになります。

問1の度数分布表

度数分布表は以下のようになる。

\begin{align*} \begin{array}{c|c|c|c|c|c|c|c|c} {\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\ \hline {\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12 \end{array} \end{align*}

この度数分布表も利用しながら問題を解きます。問1(1)は、平均値を求める問題です。平均値は公式を利用して求めます。

データの平均値

\begin{align*} \scriptsize{ \quad \text{データの平均値} = \frac{\text{データの値の総和}}{\text{データの大きさ}} } \end{align*}

公式に値を代入して平均値を求めます。

問1(1)の解答例

データの値の総和は

\begin{align*} &\quad 3+2+6+0+4+1 \\[ 7pt ] &\qquad +5+2+4+1+3+2 = 33 \end{align*}

となるので

\begin{align*} \quad \frac{33}{12} = 2.75 \end{align*}

よって、平均値は

\begin{align*} \quad 2.75 \quad \text{(冊)} \end{align*}

データの値の総和を求めるとき、すべての値を足しましたが、度数分布表を利用すると負担を減らせます。

度数分布表に冊数と度数の積を追記すると、値の総和を求めやすくなります。

問1(1)の別解例

\begin{align*} \begin{array}{c|c|c|c|c|c|c|c|c} {\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\ \hline {\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12 \\ \hline {\scriptsize{\text{冊数×度数}}} & 0 & 2 & 6 & 6 & 8 & 5 & 6 & 33 \end{array} \end{align*}

度数分布表より

\begin{align*} \quad \frac{33}{12} = 2.75 \end{align*}

よって、平均値は

\begin{align*} \quad 2.75 \quad \text{(冊)} \end{align*}

データの分析の単元では、図表を上手に利用しましょう。

問1(2)の解答・解説

問1(2)は、中央値を求める問題です。データを値の大きさの順に並べ替える必要がありますが、すでに度数分布表があるので、それを利用します。

データの大きさは12なので偶数です。ですから、6番目と7番目の値の平均値が中央値になります。

中央値を求めるとき、度数分布表に累積度数を追記しておくと求めやすくなります。

累積度数は、その名の通り、度数を累積したもので、データの値の小さい方から順に度数を足し算して求めます。累積度数の最後は必ず度数の合計と等しくなります

度数分布表に累積度数を追記する

\begin{array}{c|c|c|c|c|c|c|c|c} {\scriptsize{\text{冊数}}} & 0 & 1 & 2 & 3 & 4 & 5 & 6 & {\scriptsize{\text{計}}} \\ \hline {\scriptsize{\text{度数}}} & 1 & 2 & 3 & 2 & 2 & 1 & 1 & 12 \\ \hline {\scriptsize{\text{累積度数}}} & 1 & 3 & 6 & 8 & 10 & 11 & 12 & – \end{array}

2冊までの累積度数が6で、3冊までの累積度数が8です。このことから6番目のデータは2、7番目のデータは3であることが分かります。

中央の2つの値が分かったので、中央値を求めます。

問1(2)の解答例

中央の $2$ つの値は、$2 \ , \ 3$ であるので

\begin{align*} \quad \frac{2+3}{2} = 2.5 \end{align*}

よって、中央値は

\begin{align*} \quad 2.5 \quad \text{(冊)} \end{align*}

問1(3)の解答・解説

問1(3)は、最頻値を求める問題です。度数分布表を利用すると、度数の大きい冊数が分かります。

問1(3)の解答例

度数分布表から、最頻値は $2$(冊)

度数分布表はデータを整理した表ですが、上手に利用できなければまとめた意味がありません。表の上手な使い方を自分なりにマスターしておきましょう。

同じ値が出てくるデータでは、度数分布表を上手に利用しよう。

次の問題を解いてみましょう。

問2

$6$ 個の自然数のデータ

\begin{align*} \quad \quad 2 \ , \ 3 \ , \ 3 \ , \ 6 \ , \ 8 \ , \ x \end{align*}

について、次の各問に答えよ。

$(1)$ 平均値が $4$ となる $x$ の値を求めよ。

$(2)$ 中央値が $4$ となる $x$ の値を求めよ。

問2(1)の解答・解説

問2も、データの代表値である平均値や中央値を求める問題ですが、少し難しく感じるかもしれません。

特に、問2(2)のように思考力を必要とする問題は、出題されやすく、差が付きやすいので、しっかり解けるようにしておきましょう。

問2(1)は、平均値を扱った問題なので、公式を利用すれば解けそうだと予想できます。公式を利用すると、xについての方程式を導出することができます。

問2(1)の解答例

データの値の総和は

\begin{align*} \quad 2+3+3+6+8+x = 22+x \end{align*}

となる。

平均値が $4$ となるので

\begin{align*} \quad \frac{22+x}{6} = 4 \end{align*}

これを解くと

\begin{align*} \quad x = 2 \end{align*}

文字の値を求める問題では、公式や条件から求める文字についての方程式を導出しましょう。

問2(2)の解答・解説

問2(2)は、中央値を扱った問題です。

データの大きさが6で偶数なので、中央の2つの自然数が中央値となります。中央の2つの自然数は、小さい方から数えて3番目と4番目の自然数です。

ここで注意したいのは、中央の2つの自然数がxの値によって変わることです。xの値を具体的に考えて、3番目と4番目の自然数が何になるのかを調べてみましょう。

中央値を調べる

$6$ 個の自然数のデータ

\begin{align*} \quad 2 \ , \ 3 \ , \ 3 \ , \ 6 \ , \ 8 \ , \ x \end{align*}

について

$x=1$ のとき

\begin{align*} \quad 1 \ , \ 2 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \end{align*}

$x=2$ のとき

\begin{align*} \quad 2 \ , \ 2 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \end{align*}

$x=3$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{3} \ , \ 6 \ , \ 8 \end{align*}

$x=4$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{4} \ , \ 6 \ , \ 8 \end{align*}

$x=5$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{5} \ , \ 6 \ , \ 8 \end{align*}

$x=6$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 6 \ , \ 8 \end{align*}

$x=7$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 7 \ , \ 8 \end{align*}

$x=8$ のとき

\begin{align*} \quad 2 \ , \ 3 \ , \ \underline{3} \ , \ \underline{6} \ , \ 8 \ , \ 8 \end{align*}

調べた結果、中央の2つの自然数にxが含まれる場合とそうでない場合とがあることが分かります。整理すると以下のようになります。

  • x=1,2,3のとき、中央の2つはともに3(x以外の自然数)
  • x=4,5のとき、中央の2つは3とx
  • x=6,7,…… のとき、中央の2つは3と6(x以外の自然数)

これをもとにxの値について場合分けして、中央値が4となるxの値を求めます。

問2(2)の解答例

$1 \leqq x \leqq 3$ のとき

$\quad$ 中央の $2$ つの自然数はともに $3$ であるので

$\quad$ 中央値は $3$ となり、$4$ とならないので不適。

$4 \leqq x \leqq 5$ のとき

$\quad$ 中央の $2$ つの自然数は $3$ と $x$ となる。

$\quad$ 中央値は $4$ となれば良いので

\begin{align*} \qquad \frac{3+x}{2} = 4 \end{align*}

$\quad$ より

\begin{align*} \qquad x = 5 \end{align*}

$\quad$ これは $4 \leqq x \leqq 5$ を満たす。

$6 \leqq x$ のとき

$\quad$ 中央の $2$ つの自然数は $3$ と $6$ となるので

$\quad$ 中央値は

\begin{align*} \qquad \frac{3+6}{2} = 4.5 \end{align*}

$\quad$ となり、$4$ とならないので不適。

よって、求める自然数 $x$ は

\begin{align*} \quad x = 5 \end{align*}

問2(2)のような問題は、解ける人と解けない人がはっきりするので、入試でも出題されやすい問題です。

最初から上手く解こうと考えずに、具体的な数値を使って調べることから始めましょう。解くきっかけさえ得られれば、それほど難しくありません。

具体的な数値を使って規則性を調べよう。抽象的でイメージが湧かないときは、具体化して考えよう。

Recommended books

データの分析を扱った問題は、測定値や観測値が多いと手際よく表やグラフを使って整理していく必要があります。また、表やグラフの目の付け所も知っておかなければなりません。こればかりは頭で分かっていても、実際に整理したり、表やグラフを扱ったりしたことがないと手際よくできません。

ただ、データを手早く扱うコツや表やグラフから読み取るコツを掴んでしまえば、得点源にできる単元です。単元別の問題集で集中的に取り組んでマスターしましょう。

これから紹介する教材で気になるものがあれば、ぜひ一読してみて下さい。気に入ったら最後まで徹底的にこなしましょう。

オススメその1『教科書だけでは足りない 大学入試攻略 7日間完成 データの分析

教科書だけでは足りない 大学入試攻略 7日間完成 データの分析』は、「データの分析」の学習を短期間でこなすための教材です。1日60分の学習を7日間で完成させることができます。短期間で周回できます。また、教科書レベルから扱っているので、基礎から習得できます。

内容をできる限り絞り、短時間で「データの分析」の学習が一通りできるようにしました。また、微妙な違いがわかることが必要な「図の読み取り」については、多くの図を掲載し、違いが判断できるようにしました。「計算方法」については、効率よく計算を行うことを最優先に、その計算方法を徹底的にマスターできるようにしました。

オススメその2『改訂版 佐々木隆宏の数学I「データの分析」が面白いほどわかる本

改訂版 佐々木隆宏の数学I「データの分析」が面白いほどわかる本』は、参考書兼問題集です。教科書よりも丁寧に解説されているので、教科書で躓いてもこれでカバーできます。算数から扱っているので、自習でも躓きにくくなっています。

小学校の算数における資料の調べ方から始めて、高等学校の数学1における「データの分析」までを扱った「統計分野」の参考書。中学校までの復習を扱った「ホームルーム」、数学1データの分析で学習する内容をていねいに説明した「授業」、あらゆる問題形式(センター形式や記述式)を演習する「講習」の3部構成。好評だった初版のよいところを活かしつつ、2015年から実施された現行課程下の入試でのセンター試験の問題を追加したほか、私大・国公立入試で出題された問題のうち、とくに重要かつ今後の出題が見込まれるものを収録。

オススメその3『ふたたびの確率・統計[2]統計編

ふたたびの確率・統計[2]統計編』は、学び直しの人だけでなく、初学者も意識して書かれています。

本書に収められている統計の内容は、高校数学における統計の全単元を網羅しています。項目の詳細は、現指導要領に含まれる内容だけでなく、令和4年(2022 年)度から実施予定の新指導要領で新たに盛り込まれる内容も、統計に関するものはすべてカバーしているのが特徴です。

公式と記号の意味を理解しながら使いこなす!「統計」という訳語をひねり出した明治人の奮闘から、「戦死」の実態を統計で視覚化した白衣の天使の話、100人中62人がその効果を認めたダイエットサポート飲料の判定まで、「統計リテラシー」の核心に迫る。

確率編の方が先です。

さいごにもう一度まとめ

  • データの代表値を求めることができるようにしておこう。
  • 中央値はデータの大きさによって求め方が異なることに注意しよう。
  • 同じ値があるときは度数分布表を上手に利用しよう。
  • 具体的な数値を代入してみて、規則性を調べよう。