単元 | 重要度 | 標準講義回 | |
---|---|---|---|
1.統計学の意義 | 統計リテラシー | 日常の生活における身近な統計数値の役割を理解するとともに,統計の生成過程におけるランダムネスやバイアスの概念および統計の表現上の誇張や誤解などを事例とともに考えることができる。 | 偶然の一致(coincidenceの確率)、ランダムネス(ランダムネスの誤解)、統計のウソ(statistical lie) |
問題の発見と解決 | データに基づく統計的問題解決のプロセスを理解し,研究仮説の立て方,調査や実験・観察などのデータの収集計画,比較・関連性・分類など分析の方向性を考えることができる。 | 問題設定、問題解決の枠組み(PDCA・PPDAC・DMAICサイクル) | |
種々のデータ | 時系列データとクロスセクションデータにおけるデータの変動の違いを理解するとともに,データの型や尺度の違いも具体的な例を交えて考えることができる。 | データの型と尺度、調査・実験・観察データ、1次資料・2次資料(ミクロデータ、マクロデータ)、クロスセクション・時系列・パネルデータ | |
統計学の歴史 | 計算技術やコンピュータの進展に伴い発展してきた統計手法の変遷を概観し,現在の統計の役割を理解する。 | 統計学の起源、海外における統計発展史、日本における統計発展史 | |
2.調査と実験のデザイン | 調査 | 調査においては,質問の仕方や調査対象者の抽出の仕方によって精度の違いや結果の偏りが生じる可能性があることを理解し,必要に応じて無作為抽出法(ランダムサンプリング)などの適切な調査方法を考えることができる。 | サンプリング、偏り、交絡因子 |
実験 | 実験結果に生じる変動として,どのような変動が考えられるのかを考察し,局所管理や繰り返し測定,比較実験でのランダム割り付けなどの手法を適切に活用して,より正確な実験結果を導く方法を考えることができる。 | Fisherの3原則(ランダム化、反復、局所管理)、対照群 | |
3.データの記述 | 統計表・グラフ(一般) | データ全体の傾向や特徴を,目的に応じて見やすく表やグラフ(棒グラフ,折れ線グラフ,円グラフ,帯グラフなど)にまとめ,状況を読取る方法を理解する。 | 棒グラフ、折れ線グラフ、円グラフ、帯グラフ |
分布を表す統計表・グラフ | いろいろな値をとるデータを,度数分布表や箱ひげ図,ドットプロット,ヒストグラムなどのデータの分布を示すグラフにまとめ,中心の位置とばらつきの様子や程度を読取る方法を理解する。 | ドットプロット、幹葉図、度数分布表、累積度数分布表、度数折れ線グラフ、ヒストグラム、パレート図、箱ひげ図、累積相対度数グラフ、QQプロット | |
基本統計量 | 平均値,中央値,最頻値,範囲(レンジ),四分位範囲,分散,標準偏差などの基本統計量を求めて,分布の中心の位置とばらつきの大きさを評価する方法を理解する。 | 最頻値、中央値、平均値、範囲、四分位範囲、分散と標準偏差、変動係数、標準化得点、パーセント点、外れ値 | |
分割表(クロス集計表) | 2つ以上の質的変数(名義尺度あるいは順序尺度で測定)について,分割表を構成し,度数の分布,カテゴリごとの百分率,オッズ比などから,変数間の関係を把握することができるようになる。 | 構成比、連関指標、層別 | |
相関関係 | 2つ以上の量的変数(間隔尺度あるいは比率尺度で測定)について,散布図を作成し,分布や相関係数などから相関関係を把握し,さらに回帰分析が理解できるようになる。 | 散布図、共分散、相関係数、回帰直線、相関と因果、見かけの相関 | |
4.確率と確率分布 | 確率 | 様々な事象の起こりやすさを数値で表す確率について,その概念と求め方や統計学における意味を理解する。 | 確率空間、古典的確率と公理的確率、条件付き確率、ベイズの定理 |
確率分布の概念 | 確率変数や確率分布の概念を学び,確率変数の平均や分散の求め方を知ったうえで,複数の確率変数の同時分布や独立性などを理解する。 | 確率変数、離散型確率分布と連続型確率分布、平均と分散(共分散、相関を含む)、同時分布と周辺分布 | |
主な確率分布 | 2項分布や正規分布などの基本的な確率分布の定義や統計学的性質を学び,実際の使用事例についても理解する。 | 2項分布、ポアソン分布、正規分布、指数分布、一様分布 | |
5.母集団と標本 | 統計量 | 母集団の特性を知るという目的のために,母集団と標本,および,母数(パラメータ)と統計量を区別し,適切な標本抽出を行い,統計量を手がかりにして母集団の特性を推測するという考え方を理解する。 | 母集団からの標本抽出、母数と統計量、標本分布、標準誤差、大数の法則、中心極限定理 |
標本分布 | 母集団分布を仮定した時に,標本平均や標本割合の分布について知り,標本サイズが大きくなるほど分散が小さくなり,精度よく母集団の平均や割合を推定できることを理解する。 | t分布、Χ2分布、F分布 | |
6.統計的推測 | 点推定 | 母集団分布を特徴づける平均などのパラメータの値を,標本に基づいてひとつの値で推定する方法,および,その方法によって推定される量の偏りや分散などについて理解する。 | 点推定(最小二乗法)、点推定(最尤法)、不偏性と偏り、有効性、一致性 |
区間推定 | 母集団分布を特徴づける平均などのパラメータの値を,標本に基づいてある幅を持って推定する方法とその考え方を理解する。 | 信頼区間と信頼係数、平均の区間推定、比率の区間推定、分散の区間推定 | |
仮説検定の考え方 | 母集団分布のパラメータに関して帰無仮説と対立仮説を立てて,帰無仮説を棄却するか否かを標本に基づいて判断するための方法を理解する。 | 帰無仮説、対立仮説、検定統計量、p値、有意水準と棄却域、2種の誤りと検出力 | |
種々の検定 | 母集団の平均がある特定の値であるか(平均値の検定),2つの母集団の平均に違いがあるか(平均値の差の検定),母集団がある特定の分布であるか(適合度検定),分割表の2つの属性が独立であるか(独立性の検定)などを検定する方法を理解する。 | 平均の検定、比率の検定、分散の検定、独立性の検定 | |
分散分析 | 観測値の変動を誤差変動と各要因による変動に分けることにより,各要因の効果を判定するための方法である分散分析法を理解する。 | 平方和の分割とF値、主効果と交互作用、一元配置の分散分析、二元配置の分散分析、多重比較 | |
7.多変量データの扱い | 時系列データの分析 | 月日・時間の推移に伴う景気の変動や生理指標の変化といった時系列データを対象にして,ノイズを除く方法や時系列の周期性を表す統計指標を学び,時間的変化のトレンドを捉えて将来の動向を予測するための基礎を学ぶ。 | トレンドと将来予測、移動平均、コレログラム、自己相関 |
重回帰分析 | 例えば,「製品の質・値段・見栄え」から「製品の売上」を予測・説明するケースのように, 複数変数から一つの変数を予測・説明するために用いられる重回帰分析の成り立ちと説明の精度を表す統計指標を理解する。 | 重回帰モデル、決定係数と重相関係数、偏回帰係数、残差 | |
主成分分析・因子分析 | 多数の変数を少数の成分に縮約する主成分分析と,多数の変数に共通する少数の原因を見いだす因子分析について,それらの成り立ちと相違点を理解し,結果の解釈の仕方を学ぶ。 | 変数の縮約、重みつき合計得点、共通因子と独自因子、因子回転 | |
判別・クラスタリング | 様々なデータの集合を分類・分割するために多く用いられるクラスタリングについて,基本的な概念やアルゴリズムを理解する。 | 距離、類似度、階層的クラスタリング、樹形図(デンドログラム)、非階層的クラスタリング、線形判別 | |
統計モデル | 線形回帰モデル、一般化線形モデル、非線形モデル |