著者
天理大学 医療学部 教授 博士(保健学)
大阪大学大学院 医学系研究科 招聘教授 山西 八郎 著
発刊・体裁・価格
発刊 2020年10月26日 定価 6,600円 (税込(消費税10%))
体裁 B5判 130ページ ISBN 978-4-86502-202-5 →詳細、申込方法はこちらを参照
本書は2016年9月に発刊した、「基礎からの統計学【改訂増補版】」に加筆修正をしたものです。
→書籍を購入された方へ(アンケートのお願い)
→PDFパンフレットを見る
本書のポイント
「基礎からの統計学」の完成版!
○基準範囲と95%信頼区間・信頼区間の算出方法
○有意差:有意差があるとは? どうやって分かり、調査対象データがどの程度なら正規分布と判断するか?
○帰無仮説と対比仮説
○検定についての基本的な考え方と原理・帰無仮説と検定の流れ・検定の使い分け
○t検定とは? T検定とスチューデントt検定の原理と流れ
○t検定で必要となるn数の目安
○t検定の落とし穴、誤用例
○等分散の検定(F検定)
○ウェルチ法による2標本t検定
○カイ2乗適合度検定
○一元配置分散分析
○群間差指数
○Mann-Whitney検定の実例・スチューデントt検定とMann-Whitney検定の使い分け
○「パラメトリック/ノンパラメトリック」と「差/出現度数/散布度」に分類分けした検定一覧表
○有病率を組み込んだ、陽性的中率の算出式
○重回帰分析とロジスティック回帰分析
〇因子分析と構造方程式モデリング
著者より
本書は「基礎からの統計学 改訂増補版」に、因子分析、パス解析、構造方程式モデリング(SEM)を追加することにより、バイオサイエンスのみならず社会科学や他分野の方々にも活用していただける内容を目指して構成を考えました。特にパス解析やSEMは、アンケート結果に潜在する回答者の意識や気分の因果関係を仮定、検証するうえにおいて強力なツールとなります。また、主成分分析や因子分析による変数の合成・縮約は、研究、解析の幅を拡張するためのヒントを与えてくれるものと考えています。
もちろん、基本統計量の数理や正規分布を基本とする種々の分布の性質は、分野に共通した、言わば「1丁目1番地」的な事項ですので、前著から一切省略することなく掲載しています。同時に、独学で統計学を勉強しようと思っておられる方を想定しながら筆を進めました。
例題
- 40歳代男性のある血中成分zの全国平均は140 mg/dlで、標準偏差(SD) 6 mg/dlの正規分布にしたがう。これに対して、ある地域の40歳代男性36人の平均値は136 mg/dlであった。全国平均と差があるといえるか?
- 健常者20人について、朝8時と夕方5時に、ある血中成分濃度を測定したところ、朝8時の平均値は、夕方5時の平均値よりも0.14高値であった(20個の差の標準偏差=0.22)。採血時間により、平均値に差があるといえるか?
- 健康な男性20人と女性20人について、ある血中成分濃度を測定したところ、男性の平均値は2.14(標準偏差:0.44)、女性の平均値2.00(標準偏差:0.22)であった。男女で平均値に差があるといえるか?
- A群とB群で次のようなデータを得た。群間に差があるといえるか、Mann-Whitney検定を使って検定せよ。
なお、n1=n2=10の有意水準5%での有意点は23である。
A群:10・15・19・22・25・50・56・70・75・90
B群:5・11・20・21・30・55・65・71・77・78
- 総コレステロール値とHDLコレステロール値から、LDLコレステロール値を推定する。
- 年齢、性別、一般的な生化学データから「細菌性肺炎」に罹患している確率を推定する。
- 健常者臨床検査データから「肝機能因子」「筋肉疲労因子」「脂質代謝因子」を抽出、スコア化し、「飲酒度」「喫煙度」などの生活習慣との関係を解析する。
- 高フェリチン血症患者データを用いて、明らかに炎症状態にあるにもかかわらず、血清CRPレベルがさほど高値を呈さない因果関係を検証する。
目次
はじめに
1. 正規分布と基本統計量
1.1 正規分布(normal distribution)
1.2 分散と標準偏差
1.3 分散と自由度(degree of freedom;df)
1.4 正規分布における標準偏差の意味
1.5 非正規分布における標準偏差
1.6 標準誤差(Standard error; SE)
1.7 基準範囲と95%信頼区間
1.8 パーセンタイル値と箱ヒゲ図
2. 統計学的仮説検定(Statistical hypothesis testing)
2.1 統計学仮説検定とは
2.2 帰無仮説と検定のながれ
2.3 検定の原理
2.4 有意水準と2種類の過誤(エラー)
2.5 母平均の差との検定
2.6 分布の標準化
2.7 1標本t検定(paired t test)
2.8 1標本t検定の実際
2.9 独立2群の差の検定(2標本t検定)
2.10 等分散の検定(F検定)
2.11 Welch(ウェルチ)法による2標本t検定
2.12 t検定の落とし穴
2.13 一元配置分散分析
2.14 群間差指数
2.15 Mann-Whitney検定と統計量U値(ノンパラメトリック検定法)
2.16 標本サイズが大きいときのU値の分布
2.17 Mann-Whitney検定の実例
2.18 2標本t検定とMann-Whitney検定の使い分け
2.19 χ2適合度検定(カイ2乗適合度検定)
2.20 χ2分布の定義
2.21 χ2適合度検定の実際
2.22 χ2独立性の検定
2.23 l×m要因の検定
2.24 χ2分布の自由度
3.相関と回帰
3.1 相関分析
3.2 相関係数
3.3 標準化データの積の意味
3.4 回帰分析
3.5 最小二乗法(least squares method)
3.6 線形関係式(linear function relationship)
3.6.1 標準主軸回帰
3.6.2 主成分回帰
3.6.3 Deming回帰
3.7 回帰直線の比較と選択基準
3.8 <補足1>相関係数の定義式
3.9 <補足2>相関係数が-1~1の範囲の値のみをとることの証明
4. 判別特性とROC曲線
4.1 感度と特異度
4.2 陽性的中率と陰性的中率
4.3 有病率とcutoff値
4.4 ROC曲線
5. 重回帰分析
5.1 重回帰分析の目的
5.2 偏回帰係数の意味
5.3 偏回帰係数の数理
5.4 偏回帰係数の有意性と標準偏回帰係数
5.5 回帰の適合度
5.6 要因分析
5.7 ダミー変数
5.8 ダミー変数の応用
5.9 交絡
5.10 重回帰分析での注意点
6. ロジスティック回帰分析
6.1 ロジスティック回帰分析とは
6.2 オッズとオッズ比
6.3 ロジスティック回帰分析の数理
6.4 多重ロジスティック回帰
6.5 回帰係数とオッズ比;OR の関係
6.6 オッズ比の95% 信頼区間
6.7 解析実例
6.8 回帰の適合度
7. 主成分分析
7.1 主成分分析の目的
7.2 主成分分析の原理
7.3 固有値と寄与率
7.4 主成分スコア(得点)
7.5 肥満と生活習慣の解析
8. 因子分析
8.1 因子分析の目的
8.2 因子分析の原理
8.3 因子負荷量の算出
8.4 因子軸の回転
8.5 因子得点(因子スコア)
8.6 健常者臨床データの解析<共通因子の抽出>
8.7 健常者臨床データの解析<因子スコアの利用>
9. 構造方程式モデリング
9.1 構造方程式モデリングの目的
9.2 パス図
9.3 重回帰モデルへの拡張
9.4 パス解析モデル
9.5 直接効果と間接効果
9.6 構造方程式
9.7 潜在変数の導入
9.8 パス係数の検定とモデルの適合度指標
9.9 SEM の実例
付録
標準正規分布表(両側確率)
t分布表(両側確率)
χ2分布表(上側確率)
χ2分布表(上側確率)
Mann-Whitney検定表:U値の有意点(両側確率)
F分布表
参考文献