データの分析|データの散らばりについて その1

数学1データの分析,四分位数,四分位範囲,四分位偏差,箱ひげ図

四分位数や箱ひげ図などを扱った問題を解いてみよう

次の問題を解いてみましょう。

四分位数や箱ひげ図を扱った問題の図


図は、ある学校の $1$ 年生と $2$ 年生の身長のデータの箱ひげ図である。
この箱ひげ図から読み取れることとして、正しいものを次の①~④からすべて選べ。
ただし、各学年の人数はともに $200$ 人である。
① $185cm$ より大きい生徒が $1$ 年生にはいるが、$2$ 年生にはいない。
② $170cm$ 以上の生徒が $2$ 年生には $100$ 人以上いるが、$1$ 年生では $100$ 人以下である。
③ $165cm$ 以下の生徒がどちらの学年にも $50$ 人より多くいる。
④ $175cm$ 以下の生徒は $1$ 年生では $150$ 人より多くいるが、$2$ 年生では $150$ 人以下である。

問の解答・解説

問は、箱ひげ図から読み取れることの正誤を判断する問題です。図から情報を正しく読み取る必要があります。どこに着目すれば良いのかを知っておきましょう。

箱ひげ図で着目するところ

選択肢①
① $185cm$ より大きい生徒が $1$ 年生にはいるが、$2$ 年生にはいない。

選択肢①では、1年生と2年生のデータに $185cm$ より大きい値があるかどうかが分かれば良いので、最大値に着目します。

選択肢1で着目するところ

箱ひげ図から、1年生の最大値は $185cm$ よりも大きいので、1年生の中に $185cm$ より大きい生徒がいることが読み取れます。また、2年生の最大値は $185cm$ よりも小さいので、2年生の中に $185cm$ より大きい生徒がいないことが読み取れます。このことから、選択肢①は正しいと言えます。

選択肢②
② $170cm$ 以上の生徒が $2$ 年生には $100$ 人以上いるが、$1$ 年生では $100$ 人以下である。

選択肢②では、人数についての正誤なので、度数を考えます。各学年の人数はそれぞれ200人であるので、データの大きさはともに偶数です。度数の全体に占める割合を利用することができます。

中央値(第2四分位数)に注目します。中央値から最大値までの度数は、全体の50%を占めるので100人です。

選択肢2で着目するところ

箱ひげ図から、1年生の方の中央値は $170cm$ よりも小さいので、$170cm$ 以上の生徒は、全体の50%以下、つまり100人以下であることが読み取れます。また、2年生の方の中央値は $170cm$ よりも大きいので、$170cm$ 以上の生徒は、全体の50%以上、つまり100人以上であることが読み取れます。このことから、選択肢②は正しいと言えます。

選択肢③
③ $165cm$ 以下の生徒がどちらの学年にも $50$ 人より多くいる。

選択肢③も選択肢②と同じように度数を考えます。第1四分位数に注目します。最小値から第1四分位数までの度数は、全体の25%を占めるので50人です。

選択肢3で着目するところ

箱ひげ図から、1年生の方の第1四分位数は $165cm$ よりも小さいので、$165cm$ 以下の生徒は、全体の25%より大きい、つまり50人より多いことが読み取れます。また、2年生の方の第1四分位数は $165cm$ よりも大きいので、$165cm$ 以下の生徒は、全体の25%より小さい、つまり50人より少ないことが読み取れます。このことから、選択肢③は正しくないと言えます。

選択肢④
④ $175cm$ 以下の生徒は $1$ 年生では $150$ 人より多くいるが、$2$ 年生では $150$ 人以下である。

選択肢④も度数を考えます。第3四分位数に注目します。最小値から第3四分位数までの度数は、全体の75%を占めるので150人です。

選択肢4で着目するところ

箱ひげ図から、1年生と2年生の第3四分位数はともに $175cm$ よりも大きいので、$175cm$ 以下の生徒は、全体の75%より小さい、つまり150人より少ないことが読み取れます。このことから、選択肢④は正しくないと言えます。

解答例は以下のようになります。

問の解答例
\begin{align*}
&\quad ( \text{$1$ 年生のデータの最大値}) \ \gt 185 \\[ 5pt ]
&\quad ( \text{$2$ 年生のデータの最大値}) \ \lt 185 \\[ 5pt ]
&\text{であるので、選択肢①は正しい。} \\[ 10pt ]
&\text{$1$ 年生の第 $k$ 四分位数、$2$ 年生の第 $k$ 四分位数をそれぞれ} \\[ 5pt ]
&\quad Q_{\scriptsize{1k}} \quad (k=1 \ , \ 2 \ , \ 3) \ , \ Q_{\scriptsize{2k}} \quad (k=1 \ , \ 2 \ , \ 3) \\[ 5pt ]
&\text{とする。} \\[ 5pt ]
&\quad Q_{\scriptsize{12}} \lt 170 \ , \ Q_{\scriptsize{22}} \gt 170 \\[ 5pt ]
&\text{であるので、選択肢②は正しい。} \\[ 10pt ]
&\quad Q_{\scriptsize{21}} \gt 165 \\[ 5pt ]
&\text{であるので、選択肢③は正しくない。} \\[ 10pt ]
&\quad Q_{\scriptsize{13}} \gt 175 \\[ 5pt ]
&\text{であるので、選択肢④は正しくない。} \\[ 10pt ]
&\text{したがって、正しいのは選択肢①と②である。}
\end{align*}

単に箱ひげ図を書けるだけでなく、箱ひげ図から正しく情報を読み取れるように演習をこなしておきましょう。特に、正誤問題を多く解いておくと良いでしょう。

データの大きさが偶数のとき、度数の全体に占める割合が分かる。
Recommended books

データの分析を扱った問題は、測定値や観測値が多いと手際よく表やグラフを使って整理していく必要があります。また、表やグラフの目の付け所も知っておかなければなりません。こればかりは頭で分かっていても、実際に整理したり、表やグラフを扱ったりしたことがないと手際よくできません。

ただ、データを手早く扱うコツや表やグラフから読み取るコツを掴んでしまえば、得点源にできる単元です。単元別の問題集で集中的に取り組んでマスターしましょう。

これから紹介する教材で気になるものがあれば、ぜひ一読してみて下さい。気に入ったら最後まで徹底的にこなしましょう。

オススメその1

『[affi id=65]』は、「データの分析」の学習を短期間でこなすための教材です。教科書レベルから扱っているので、基礎から習得できます。

短時間で「データの分析」の学習が一通りできるように作成した問題集。図の読み取りについては、微妙な違いがわかることが必要となる場合には、違いが判断できるように多くの図を掲載。計算方法については、実際に問題を解くとき効率よく計算を行うことを最優先にして、その計算方法を徹底的にマスターできるように配慮。

[affi id=64]

オススメその2

『[affi id=67]』は、参考書兼問題集です。教科書よりも丁寧に解説されているので、教科書で躓いてもこれでカバーできます。算数から扱っているので、自習でも躓きにくくなっています。

小学校の算数における資料の調べ方から始めて、高等学校の数学Iにおける「データの分析」までを扱った「統計分野」の参考書。中学校までの復習を扱った「ホームルーム」、数学I データの分析で学習する内容をていねいに説明した「授業」、あらゆる問題形式(センター形式や記述式)を演習する「講習」の3部構成。

[affi id=66]

オススメその3

『[affi id=69]』は、メダカカレッジの大上丈彦先生が統計学の基本をまとめた1冊です。「ゆる~いけど、鋭い! 」イラストが人気です。

統計学全般を扱っているので、数学Bの「確率分布と統計的推測」についても解説されています。「確率分布と統計的推測」はベクトルや数列よりも問題に対処しやすいので、ベクトルや数列がどうしても苦手な人は取り組んでみると良いでしょう。

統計学というと「なんだか難しそうだな」と思うかもしれませんが、ポイントをしっかり押さえ、
あまり本質的でないところにこだわらなければ、誰にでも確実に理解できます。
「統計学ってなに?」という素朴な疑問から、マンガでゆる~く解説し、読み終わったときには、
知らないうちに統計学が身に付いているという、いままでにない統計学の入門書です。

[affi id=68]

さいごにもう一度まとめ

  • データの散らばりの度合いを知るには、四分位数や箱ひげ図などを利用しよう。
  • 四分位数はデータを4等分する3つの値。
  • 最小値や最大値、四分位数を箱とひげで表したのが箱ひげ図。
  • 箱ひげ図と度数の関係を知っておこう。