公式・定理,数学1
データの分析
データの代表値
平均値 $\bar{ x }$
\begin{align*}
\bar{x} = & \frac{1}{n} \bigl( x_{\tiny{1}} + x_{\tiny{2}} + \cdots \cdots +x_{\tiny{n}} \bigr) \\[ 10pt ]
= & \frac{1}{n} \sum_{ i = 1 }^{ n } x_{\tiny{i}}
\end{align*}
中央値(メジアン)
データを値の大きさの順に並べたとき、中央の位置にくる値。
データの大きさが偶数のときは、中央に並ぶ2つの値の平均値。
最頻値(モード)
データにおける最も個数の多い値。
度数分布表に整理したときは、度数が最も大きい階級の階級値。
箱ひげ図
データのうち5つの数値を箱と線(ひげ)で表した図。
箱ひげ図に必要な5つの数値
- 最小値
- 第1四分位数 Q1
- 中央値(=第2四分位数 Q2 )
- 第3四分位数 Q3
- 最大値
分散と標準偏差
偏差
変量 $x$ の各値と平均値 $\bar{ x }$ との差
変量が $x = x_{\tiny{1}} \ , \ x_{\tiny{2}} \ , \cdots \cdots , \ x_{\tiny{n}}$ であるとき、
偏差は $x_{\tiny{1}} \ – \bar{x} \ , \ x_{\tiny{2}} \ – \bar{x} \ , \cdots \cdots , \ x_{\tiny{n}} \ – \bar{x}$
分散
偏差の2乗の平均値
\begin{align*}
s^{\scriptsize{2}} = & \frac{1}{n} \Bigl\{ {\bigl( x_{\tiny{1}} \ – \bar{x} \bigr)}^{\scriptsize{2}} + {\bigl( x_{\tiny{2}} \ – \bar{x} \bigr)}^{\scriptsize{2}} + \\[ 10pt ]
& \quad \cdots \cdots + {\bigl( x_{\tiny{n}} \ – \bar{x} \bigr)}^{\scriptsize{2}} \Bigr\} \\[ 10pt ]
= & \frac{1}{n} \sum_{ i = 1 }^{ n } {\bigl( x_{\tiny{i}} \ – \bar{x} \bigr)}^{\scriptsize{2}}
\end{align*}
標準偏差
分散の正の平方根
\begin{equation*}
s = \sqrt{\text{分散}}
\end{equation*}
分散と平均値の関係式
\begin{equation*}
s^{2} = \overline{x^{\scriptsize{2}}} – {\left( \bar{x} \right)}^{\scriptsize{2}}
\end{equation*}
分散の式を変形すると得られる。
(分散) = (2乗の平均) – (平均の2乗)
相関係数
2つの変量 $x \ , \ y$ の共分散 $s_{\tiny{xy}}$ は
\begin{align*}
s_{\tiny{xy}} = & \frac{1}{n} \Big\{ {\left( x_{\tiny{1}} \ – \bar{x} \right)}{\left( y_{\tiny{1}} \ – \bar{y} \right)} + {\left( x_{\tiny{2}} \ – \bar{x} \right)}{\left( y_{\tiny{2}} \ – \bar{y} \right)} + \\[ 10pt ]
& \quad \cdots \cdots + {\left( x_{\tiny{n}} \ – \bar{x} \right)}{\left( y_{\tiny{n}} \ – \bar{y} \right)} \Bigr\} \\[ 10pt ]
= & \frac{1}{n} \sum_{ i = 1 }^{ n } {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)}
\end{align*}
変数 $x \ , \ y$ の標準偏差をそれぞれ $s_{\tiny{x}} \ , \ s_{\tiny{y}}$ とし、$x$ と $y$ の共分散を $s_{\tiny{xy}}$ とすると、相関係数 $r$ は
\begin{equation*}
r = \frac{s_{\tiny{xy}}}{s_{\tiny{x}} \ s_{\tiny{y}}} \quad \left( -1 \leqq r \leqq 1 \right)
\end{equation*}
2つの変量 $x \ , \ y$ について、それぞれの平均値を $\bar{x} \ , \ \bar{y}$ とし、$\left( x- \bar{x} \right) \left( y- \bar{y} \right)$ の総和を $a$、${\left( x- \bar{x} \right)}^{2}$ の総和を $b$、${\left( y- \bar{y} \right)}^{2}$ の総和を $c$ とするとき、相関係数 $r$ は
\begin{align*}
r = & \frac{s_{\tiny{xy}}}{s_{\tiny{x}} \ s_{\tiny{y}}} \\[ 10pt ]
= & \frac{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)}}{\sqrt{{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}^{2}} \cdot {\frac{1}{n} \sum {\left( y_{\tiny{i}} \ – \bar{y} \right)}^{2}}}} \\[ 10pt ]
= & \frac{\frac{1}{n} \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}{\left( y_{\tiny{i}} \ – \bar{y} \right)}}{\frac{1}{n} \sqrt{{ \sum {\left( x_{\tiny{i}} \ – \bar{x} \right)}^{2}} \cdot { \sum {\left( y_{\tiny{i}} \ – \bar{y} \right)}^{2}}}} \\[ 10pt ]
= & \frac{a}{\sqrt{bc}} \quad \left( -1 \leqq r \leqq 1 \right)
\end{align*}
Recommended books
データの分析を扱った問題は、測定値や観測値が多いと手際よく表やグラフを使って整理していく必要があります。また、表やグラフの目の付け所も知っておかなければなりません。こればかりは頭で分かっていても、実際に整理したり、表やグラフを扱ったりしたことがないと手際よくできません。
ただ、データを手早く扱うコツや表やグラフから読み取るコツを掴んでしまえば、得点源にできる単元です。単元別の問題集で集中的に取り組んでマスターしましょう。
これから紹介する教材で気になるものがあれば、ぜひ一読してみて下さい。気に入ったら最後まで徹底的にこなしましょう。
『教科書だけでは足りない 大学入試攻略 7日間完成 データの分析』は、「データの分析」の学習を短期間でこなすための教材です。1日60分の学習を7日間で完成させることができます。短期間で周回できます。また、教科書レベルから扱っているので、基礎から習得できます。
内容をできる限り絞り、短時間で「データの分析」の学習が一通りできるようにしました。また、微妙な違いがわかることが必要な「図の読み取り」については、多くの図を掲載し、違いが判断できるようにしました。「計算方法」については、効率よく計算を行うことを最優先に、その計算方法を徹底的にマスターできるようにしました。
『改訂版 佐々木隆宏の数学I「データの分析」が面白いほどわかる本』は、参考書兼問題集です。教科書よりも丁寧に解説されているので、教科書で躓いてもこれでカバーできます。算数から扱っているので、自習でも躓きにくくなっています。
小学校の算数における資料の調べ方から始めて、高等学校の数学1における「データの分析」までを扱った「統計分野」の参考書。中学校までの復習を扱った「ホームルーム」、数学1データの分析で学習する内容をていねいに説明した「授業」、あらゆる問題形式(センター形式や記述式)を演習する「講習」の3部構成。好評だった初版のよいところを活かしつつ、2015年から実施された現行課程下の入試でのセンター試験の問題を追加したほか、私大・国公立入試で出題された問題のうち、とくに重要かつ今後の出題が見込まれるものを収録。
『ふたたびの確率・統計[2]統計編』は、学び直しの人だけでなく、初学者も意識して書かれています。
本書に収められている統計の内容は、高校数学における統計の全単元を網羅しています。項目の詳細は、現指導要領に含まれる内容だけでなく、令和4年(2022 年)度から実施予定の新指導要領で新たに盛り込まれる内容も、統計に関するものはすべてカバーしているのが特徴です。
公式と記号の意味を理解しながら使いこなす!「統計」という訳語をひねり出した明治人の奮闘から、「戦死」の実態を統計で視覚化した白衣の天使の話、100人中62人がその効果を認めたダイエットサポート飲料の判定まで、「統計リテラシー」の核心に迫る。
確率編の方が先です。