O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Rによる医療統計 前半

Rを使った医療統計 前半です

  • Entre para ver os comentários

Rによる医療統計 前半

  1. 1. Rによる医療統計 ver 2017.5 K-kajiwara 第1部 医療統計の基礎知識 1
  2. 2. ユニバーサルデザイン 可読性の⾼いユニバーサルフォント ⾊盲でも⾒やすい配⾊ 直感で理解しやすいピクトグラム ⾊々考えて作ってます
  3. 3. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  4. 4. 統計と医療 しかし,医療統計は, ① 普通の統計より 難しい ② 多くの医師は 知らない 統計 医療 あることが偶然起きるかどう か,確率で⽰す 検査の精度・治療の奏効率を 確率で考える 統計と医療は,確率を扱う点で似ている
  5. 5. EBM E・B・M !! E・B・・・ 統計を知らずして,EBMを語ることなかれ
  6. 6. EBM ① ⽬の前の患者さんの診療における 臨床的問題点を探す ② それを解決するための⽂献を探す ③ その⽂献の妥当性,信頼性,結果,臨床的意義を 検討する ④ 患者さんに説明し,⽅針を決める まずは臨床的問題点
  7. 7. ⽇常診療のギモン (Clinical Question) この新薬は,どれくらい効くの? 今まで慣例でやってきたけど、これって意味ある? 偉い先⽣はああ⾔っているけど、本当? 製薬会社はこう宣伝しているけど,嘘じゃないの? 新しい治療法を思いついたけれど,効果があるの? 臨床的問題点は,⽇常診療のギモンからでもOK
  8. 8. Evidence 医療統計 研究 Research Question Clinical Question
  9. 9. システマティック・レビュー メタアナリシス ランダム化⽐較試験 ⾮ランダム化⽐較試験 コホート研究 ケースコントロール研究 症例報告 専⾨委員会や権威者の意⾒ エビデンスレベル ⾼いエビデンスレベルには,医療統計は必須
  10. 10. 間違った 統計法で発表する医師 査読で指摘せずに載せる雑誌 商業 ベースの国内誌 企業の宣伝 ⽬的の委託研究に多い でも・・・
  11. 11. 統計処理を,製薬会社任せ? 統計の不勉強や,製薬会社との癒着は, 時に「不勉強だった」では済まない事案 を引き起こす
  12. 12. 臨床試験の弊害 参加する患者さんは,原則メリットを 受けられない. 参加する患者さん・医療者は費⽤・時間・ 労⼒などを要する. 統計の間違い・いい加減な試験デザインは 参加してくれる患者さんに失礼!
  13. 13. 医療スキャンダル D G Altman " What, then, should we think about researchers who use the wrong techniques (either wilfully or in ignorance), use the right techniques wrongly, misinterpret their results, report their results selectively, cite the literature selectively, and draw unjustified conclusions? " "Yet numerous studies of the medical literature, in both general and specialist journals, have shown that all of the above phenomena are common. This is surely a scandal." (BMJ 1994; 308: 283)
  14. 14. 統計は学⽣時代に習ったきりだし そもそも数学専⾨じゃないし 臨床で忙しいし 本を読む時間はないし 数式も分からないし・・・. ⾃分もそう. まだまだ分からないことも多いけれ ど,⼀緒に勉強していきましょう.
  15. 15. 医療統計学のつまずき所 ⽤語がややこしくてバラバラ 数式が理解できない 周りに教えてくれる⼈がいない ⽤語統⼀ 理解は後 まずは使い⽅ slideshareとか
  16. 16. 医療統計学を学ぶメリット 臨床試験が組めるようになり, ⽇常臨床のギモンを,⾃分の⼒で解決できる 他の患者さんを助けるエビデンスになる 論⽂の読み⽅が分かるようになり, エセ医学や統計を悪⽤する⼈に騙されにくくなる
  17. 17. 統計? • 犯罪者の98%はパンを⾷べている • パンを⽇常的に⾷べて育った⼦供の約半数は,テストが平均点以下 • 暴⼒的犯罪の90%は,パンを⾷べてから24時間以内に起きている • パンは中毒症状を引き起こす.被験者に最初はパンと⽔を与え,後に⽔ だけを与える実験をすると,2⽇もしないうちにパンを異常にほしがる • 新⽣児にパンを与えると、のどをつまらせて苦しがる (2chコピペより引⽤) 似たようなデータは,⾝の回りにあふれている
  18. 18. 意味のあるデータか,ないデータか • 宝くじ売り場の当選⾦額 • 占い • ダイレクトメールの広告 • 営業社員の持ってくるデータ 統計学を学ぶことは,⾃⾝の⾝を守ることにもなる
  19. 19. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  20. 20. 研究デザイン • 観察研究(observational study) データ収集のみ • 介⼊研究(interventional study) 治療などの介⼊⾏為をして,その影響を調べる いずれも「⼈を対象とする医学系研究に関する倫理 指針」に従う
  21. 21. 観察研究 横断研究(cross-sectional study) :1回だけの調査 縦断研究(longitudinal study) :複数回の調査 ケース・コントロール研究(case-control study) 病気がある⼈は,過去にある要因があるか. 肺癌患者は喫煙歴があるか,など. クロスセクショナル研究 ある時点の調査.⼀⻫アンケートなど. コホート研究(cohort study) ある要因がある⼈が,病気になるか 喫煙者が肺癌になるかどうか,など.
  22. 22. 観察研究 • 観察の時間の流れ 前向き prospective これからのデータで 後ろ向き retrospective 今までのデータで • 観察の⽅向性 順⾏forward 曝露 → 疾病発⽣ 逆⾏backward 曝露 ← 疾病発⽣
  23. 23. (⼭崎 ⼒, ⼩出 ⼤介. 臨床研究いろはにほ. ライフサイエンス出版, 28, 2015.より引⽤)
  24. 24. 横断研究 • 追跡しなくて良い分,⽐較的経費がかからない. • 曝露状況を調べるのは調査時点であり,さかの ぼって調べるよりは妥当性が⾼い. • 曝露状態が,疾病発⽣の原因なのか結果なのか 分からないときがある. (喫煙 → 肺癌 → 禁煙 の流れを⾒たときに,禁煙が肺癌のリスク因⼦に⾒ えてしまうことがある) 容易だが,因果関係を解明するには弱い
  25. 25. コホート研究 • 調査開始時点で疾病が発⽣していない集団を,曝露の有無 で分けて疾病が発⽣しないか観察していく • 順⾏,前向き • 追跡するのに,労⼒,時間,費⽤を要する • 曝露情報の妥当性が⾼い • 追跡中にdropoutしてしまうと疾病発⽣情報の妥当性が下が る.稀な疾患には向かない. • 対照群は同じ観察集団から選ぶ⽅法や,⼀般集団を対象と する⽅法がある. ⼤変だが,因果関係を解明するのは強い
  26. 26. 回顧的コホート研究 後ろ向きコホート研究 • 調査開始時までのデータベースを使って,調査 開始時(または開始後)の疾病発⽣を調査する. • 順⾏,後ろ向き • 調査開始は曝露が起こった後 • 時間を⽐較的要さない 既存のデータベースを作った先⼈の⼒を借りるコホート
  27. 27. ケース・コントロール研究 症例対照研究 (case-control study) • 現在の疾病を発⽣している群と,発⽣していない群で過去 の曝露を⽐較する.逆⾏,後ろ向き • 短期間でできる • 曝露情報は過去のものなので妥当性が劣る.稀な曝露には 向かない. • 稀な疾患に向く • 対照群は同⼀の医療機関を受診した他疾患の患者や,⼀般 集団から選ぶ⽅法がある.
  28. 28. ケースコントロール vs コホート コホートが最⾼という派閥と, ケースバイケースという派閥が ある
  29. 29. 介⼊研究 • 対象者間⽐較 (inter-subjective comparison) A薬を使う群と,B薬を使う群に分ける A薬 B薬 A薬 B薬 • 対象者内⽐較 (intra-subjective comparison) クロスオーバー研究 (cross-over study) 同じ患者でA薬を使い,薬の効果が切れた後にB薬を使う. 必要症例数が半分で済むが,エンドポイントが死亡などだと使えない
  30. 30. 研究デザイン (⼭崎 ⼒, ⼩出 ⼤介. 臨床研究いろはにほ. ライフサイエンス出版, 27, 2015.より引⽤)
  31. 31. メタアナリシス ① 条件を決めて既存の研究を集め, ② 統合解析をする 「究極の後付け解析」 システマテックレビュー • 系統的に論⽂を集め整理した総説.コクランレ ビューなど.
  32. 32. メタアナリシス 集める研究 (分からないが確かにある) 真の値 研究A 研究B 研究C 研究D 研究E 研究F 効果なし 効果あり 個々の研究は系統誤差,偶然誤差のため 真の値からズレる. もし偏った研究だけを集めれば 偏ったメタアナリシスができてしまう.
  33. 33. メタアナリシス バイアスの評価 • ⼀次研究でのバイアス • メタアナリシスを⾏う過程でのバイアス 質が低い⼀次研究 使わない 感受性分析(質が低い研究を⼊れる場合と⼊れない場合で⽐較) 選択バイアス ⾔語バイアス・・・negative dataは⺟国語の雑誌に多いかもしれない データベースバイアス・・・どこを選ぶか 出版バイアス negative dataは出版されにくい ファンネルプロット,Rank correlation test,Linear regression testで評価
  34. 34. ファンネルプロット funnel plot • funnelは「漏⽃」の意 • X軸に効果量,Y軸に研究の精度 頂点はサンプルサイズの⼤きい研究が, 底辺はサンプルサイズの⼩さい研究でばらつく 対称の三⾓形になれば出版バイアスはない
  35. 35. ファンネルプロット funnel plot 例)6⾯サイコロを振ったときに出る値の平均は? 真の値:3.5 n数が多い研究は3.5に近い値が出る n数が少ない研究は結果が偶然誤差でばらつく 効果量 (← サイコロの値の平均値) 研究の精度 (← n数) 100,000,000回振っていれば3.5に近くなる 10回しか振っていなければ結果はばらつく
  36. 36. ファンネルプロット funnel plot 効果量 研究の精度 • 対称でなければ,本来発表されるはずの研究が negative studyなどで発表されなかった可能性あり • 対称の三⾓形になれば出版バイアスはないと考える 効果量 研究の精度 発表⽌めよう
  37. 37. メタアナリシス 異質性の評価 異質性とは,複数の臨床研究で結論が⼀致しないこと • 元の臨床研究のバイアス • 偶然誤差 • 研究デザイン・患者背景の違い 異質性がない⽬安 • Cocran's Q で P> 0.05〜0.1 • I2(I統計量)で25〜50%以下 対応は層別化.
  38. 38. メタアナリシスはデータを そのまま⾜し合わせることではない A 有効 無効 有効率 治療群 9 1 90% 対照群 17 3 85% B 有効 無効 有効率 治療群 3 17 15% 対照群 1 9 10% 有効 無効 有効率 治療群 12 18 40% 対照群 18 12 60% 治療群の⽅が有効率が⾼いはずなのに? 〜 シンプソンのパラドックス 〜
  39. 39. メタアナリシス 統合⽅法 サンプルサイズが多い試験の⽅が,偶然誤差による ばらつきは⼩さい. ⇒ サンプルサイズが⼤きい試験に,より重みを置く それぞれの試験の効果量を,サンプルサイズの⼤きさ によって重み付け 効果量を統合していく
  40. 40. メタアナリシス 解析⽅法 固定効果モデル fixed effect model 変量効果モデル random effect model 全ての研究の⺟集団は同じと考える 研究の⺟集団は異なると考える ex) EGFR-TKIが効きやすい東洋⼈の⺟集 団,重症度の⾼い⺟集団 • 効果が過⼤評価されやすい ⺟集団に違いがあって効果が出ているよう に⾒えることがある • 他の⺟集団に結果を当てはめるこ とができない • 効果が過⼩評価されやすい • より普遍的な結果と考えることが できる
  41. 41. 95%CIが基準線をま たいでいない試験 は6つあるが,全体 で⾒ると差はある Maloneyの試験 は外れているの で,random effect modelで は重み付けが軽 くなっている modelによる結果 の違いはない 研究の異質性はあり ⑯を除くと異質性はなくSMDは Fixed-effect model 0.22 Randomeffect model 0.24 ⑯㉘が重みが⼤きい フォレストプロット (JAMA Intern Med; 175: 1301-9, 2015. )
  42. 42. ⾮劣勢試験 • 試験薬が対象薬に⽐べ,有効性以外の利点 がある場合,有効性が劣っていないことを 証明する. • per protocolanalysisがよい.⽚側検定でも 良い. どの程度の⾮劣性マージンかは解析者に決められることと,そもそも⾮劣性ができる だけの他のメリットがあるのかなど,問題の多い試験とされています. ⾥⾒先⽣⽈く,「いつ爆発するかわからない不発弾(「誰がそんなマージンを許容す ると決めたんだ」という患者団体からの苦情)を抱えた試験」だそうです
  43. 43. ⾮劣勢試験 臨床的に許容できる差(⾮劣勢マージン∆)を決め,差の95% 信頼区間の下限値が-∆よりも⼤きければ,⾮劣勢がある. (奥⽥ 千恵⼦. 親切な医療統計学.⾦ 芳堂 , 194, 2014.より引⽤)
  44. 44. ⾮劣勢試験 既存薬 新規薬 必要な下駄が10cmくらいだったら,君の⾝⻑は彼に劣っていないと 考えて良いよ・・・ほんとに?
  45. 45. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  46. 46. 医学統計の3⼤意義 1. 現状の把握 2. 予測する 3. 因果関係を⽰す
  47. 47. 現状の把握 • 喘息死は減ってきているか • 気管⽀喘息はどのようなサブタイプに 分かれるか
  48. 48. 予測する • この検査が陽性のとき,病気の確率は • この薬が効く確率は • 推定予後は
  49. 49. 因果関係を⽰す • タバコを吸ったら肺癌になりやすくなる • この薬を使ったら.治る確率が⾼くなる • 曝露により疾病のリスクが上がるか(疫 学)
  50. 50. 最も難しいのは,因果関係 ⾮常に難しいので 因果関係の話を中⼼に
  51. 51. ある⼈がある薬を飲んだ 効く? 効かない?
  52. 52. テレビで, 「○○を使って体重が減るか試してみまし た.その結果はなんと・・・」 世の中には統計?があふれています
  53. 53. 統計としての問題 • p値がない • 検出⼒が低い ・・・などなど 試験デザインとしての問題 • ダイエット意識が強い集団が対象 • 盲検化していない ・・・などなど バラエティなので,実際の統計や科学的には全く正しくなくても,視聴者が楽しめれば (そして売り上げや視聴率が上がれば),それで良いのでしょうが,実際の臨床試験はそ んなに簡単にはいきません. 因果関係を⽰すのは,たやすいことではない
  54. 54. 効果 薬を飲んだときの結果 薬を飲まなかったときの結果 この差が効果
  55. 55. コントロール(対照群) 「ある⼈がある薬を飲んだら効くか?」は, 時間を戻したり未来が⾒えないと無理. 代替案として,「飲んだ」「飲まなかっ た」という2群を,臨床試験で⽐べること で,擬似的に未来を予測しようとしている きりかえ式タイムスコープが開発されれば,分かるかもしれ ませんね.(藤⼦・F・不⼆雄. ドラえもん; 27: 65-74, 1983.)
  56. 56. 因果関係 原因と結果の関係(因果関係)を⽰したい 原因 結果 薬を飲んだら 治る タバコを吸ったら 肺癌になる
  57. 57. 因果関係 強固な関連 原因と結果に密な関連 ⼀致した関連 他の集団でも再現性がある 時間的な関係 原因が結果よりも先 量反応関係 原因の量が多いほど結果が多い 整合性のある,もっともらしい関連 ⽣物学などで機序を説明できる
  58. 58. 治療なし 治療あり 結果 結果 この差を 効果と考える 「薬を飲んだ ⇒ 効く」という因果関係を考えると, 処置群と対照群で,結果に影響を与える背景が同じ かどうか? 同じであれば, 効果=薬を飲んだら効くという因果関係
  59. 59. 因果関係を⽰すために • 正しくデータを観測する バイアスを除く • 原因と結果の関係を正しく評価する 交絡を除く
  60. 60. 真の値 true value 1個体の真の値 Aさんの現在の⾝⻑は,175.216165655・・・cm.値としてはあ る値があるはずだが,測定器の限界などで完全には測ること ができない. 集団の真の値 ⽇本⼈にB薬を投与すると,2週間後に体重は平均?kg減る. 値としてはある値があるはずだが,現実的に⽇本⼈全員を同 時に量ることはできない. 真の値は,確かに存在するが推測するしかない
  61. 61. 誤差 真の値と測定値の差のこと. 機械の精度,測定する時間,個⼈の体質による誤差など ランダムに起きる偶然誤差は統計学で解析できるが,真の 値よりもどちらか⼀⽅に偏って起きるバイアス(系統誤 差)は統計ではどうにもならない. (奥⽥ 千恵⼦. 親切な医療統計学.⾦ 芳堂 , 13, 2014. より引⽤) どうにもならないバイアスは,試験デザインで除く
  62. 62. バイアス • 選択バイアス ⼊院患者を対象とすると,重症例や合併症が多い 臨床試験の参加者は,アドヒアランスが良い 健康教室の参加者は,健康への興味が⼤きい 喫煙者への喫煙アンケートの回収率は悪い 対照試験で,群によって脱落者が異なる(脱落バイアス) • 情報バイアス 悪い結果は良く覚えている 嫌な質問には答えない プラセボ効果
  63. 63. バイアス • 出版バイアス negative dataは出版されにくい negatice dataの論⽂は⺟国語に多い 国際誌Aに落ちた 国内誌Bに落ちた 商業誌でいいや
  64. 64. 試験デザインで いかにバイアスを除くか?
  65. 65. 基準 • 取り込み基準(inclusion criteria) 誰でも同じようなサンプルが集められる取り込み基準が良 い. • 除外基準(exclusion criteria) 除外基準を多くすると内的妥当性が上がるが,外的妥当性 は下がり,サンプルサイズが集められなくなることもある.
  66. 66. ⼀般化可能性・⽐較可能性 ⼀般化可能性(外的妥当性) 研究対象以外の⼈にも結果を適⽤できる可能性.普遍性. 普遍性がないと,臨床試験の結果を⽬の前の患者さんに適 ⽤できる可能性が低くなってしまう ごく⼀部の限られた患者さんでは このようなデータでした
  67. 67. ⼀般化可能性・⽐較可能性 ⽐較可能性(内的妥当性) 結論が研究結果から適切に導かれたものか.再現性. 再現性のない試験は,確からしくない. メンデルは,データが綺麗すぎるという指摘もあるが, 再現性があるので評価された ランダム割り付けで,⽐較可能性↑ ⺟集団から無作為抽出で,⼀般化可能性↑ ⽐較可能性と⼀般化可能性は同時に上げられない
  68. 68. エンドポイント(評価項⽬) 真のエンドポイント 重篤な疾患,死亡などの臨床転帰. これを⽬標にしたいが,結果が出るのに時間がかかる,頻 度が少ないため症例収集が難しい. 代理エンドポイント 検査値や画像など,⼿に⼊りやすいが,真のエンドポイン トとどれだけ相関するかが問題となる.
  69. 69. エンドポイント(評価項⽬) ⼀次エンドポイント 1つの臨床試験で検証できる唯⼀のもの.これを⽬標に臨 床試験が組み,症例を集める. ⼆次エンドポイント せっかく観測された貴重なデータで他の情報が得られない か検証するもの. もともとこれを⽬標に組まれた臨床試験ではないため,参 考程度にしかならない.もし有意な結果が得られたら,次 の臨床試験の参考にする. サブグループ解析は階層をつけた解析で,結果の解釈は⼆ 次エンドポイントに近い.
  70. 70. エンドポイント(評価項⽬) ハードエンドポイント 死亡,発症など基準が明らかなもの.医師の作為が⼊らない と考えられるもの. ソフトエンドポイント ⼊院や,画像読影など,医師の作為が⼊りうるもの 複合エンドポイント いくつかのエンドポイントを合わせて解析する.発症率の少 ないイベントを解析しやすくなる⼀⽅で,ソフトエンドポイ ントの作為が⼊りやすくなるリスクがある.
  71. 71. セカンダリエンドポイントが強調されやすい有名な論⽂ • Woodcock A, et al. Efficacy and safety of fluticasone furoate/vilanterol compared with fluticasone propionate/salmeterol combination in adult and adolescent patients with persistent asthma: a randomized trial. Chest. 144: 1222-1229, 2013. • 複合エンドポイント,データのクリーニングミス,多数のセカンダ リエンドポイント・・・の論⽂は⾔うまでもなく撤回されました. この論⽂⾃体は,デザイン・内容とも良い論⽂だと思っています. 論⽂のなかで⼀部に⼩さく書いてある内容を誇張して⾔う⼈に,問 題はないのかと聞きたくなるところです
  72. 72. PROBE法 (prospectiverandomizedopenblinded- endpoint) • 前向き,ランダム化,盲検化はエンドポイント の判定のみの試験デザイン • 割り付けを知らない解析者がエンドポイントを 判定・・・でも,医師や患者は割り付けを知ってい るので,ソフトエンドポイントでバイアスが⼊ りやすい. 某臨床試験で,⼊院によるエンドポイントの差が⼤きかったというものです
  73. 73. 盲検化 こちらの群は, 頻繁に検査して 薬を追加しよう・・・ こちらの群の薬じゃ 効かないと思うな・・・
  74. 74. 盲検化 被験者,医師,データ解析者が介⼊試験の割り付け 群を知ってしまうと,治療態度や内容に影響してし まうかもしれない. これを避けるための盲検化(blinding). Double-blindは,被験者と医師への盲検化. 盲検化のために偽薬(プラセボ)を使うこともある.
  75. 75. 偽薬(プラセボ) 薬がない⽅の群に なってしまったから 効かないに違いない 薬がある⽅の群になったから 効くに違いない!
  76. 76. 偽薬(プラセボ) プラセボ効果を避けたり,盲検化のために 偽薬(プラセボ)を使うこともある. 臭い,外観,カプセルの透光性,明らかな vital変化などプラセボが作りにくいことも ある.特に漢⽅薬.
  77. 77. 疑似相関 因果関係がないのに,あたかも因果関係があるかの ように⾒える. 例) 疑似相関 背景にあるもの アイスクリームの売り上げとプールの溺死事故 気温 皇居ランナーと年収 勤務先,⽣活的余裕 ⼩学⽣の握⼒と計算能⼒ 年齢
  78. 78. 皇居ランナーは,年収が多い これは因果関係? 皇居 ランナー 年収が 多い じゃあ,⾛ったら年収上がるの?
  79. 79. 原因と結果に⾒えるものは, 本当に「原因」と「結果」?
  80. 80. 「真の」因果関係 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕
  81. 81. 交絡因⼦ • 原因と結果の因果関係(疫学では曝露と疾病発⽣)を考える にあたって,交絡因⼦が「研究⽬的とする原因」と「結果」 の両⽅に影響することで,あたかも「研究⽬的とする原因」 と「結果」に因果関係があるように⾒えてしまう(疑似相関 が現れる)のが交絡. 原因 結果 交絡因⼦
  82. 82. 交絡因⼦ • 交絡因⼦は,原因と結果の中間変数ではない. • 交絡因⼦は原因によって起きるわけではないが, 原因と関連はある. 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 中間変数 原因 結果
  83. 83. • 結果変数(従属変数):結果 • ⽬的変数(独⽴変数):原因 • 共変量:⽬的変数と結果変数のどちらにも関連のある変数. • 中間変数:⽬的変数から影響を受け,結果変数に影響を与える変数 共変量の影響を除いて,⽬的変数の結果変数への影響を調べる 交絡因⼦を,変数で説明するときに共変量と⾔います. (星野 崇宏. 調査観察デー タの統計科学. 岩波書店, 7, 2009.より引⽤)
  84. 84. 統計で因果関係を⽰すために 正しくデータを観測する バイアスを除く 原因と結果の関係を正しく評価する 交絡を除く
  85. 85. 交絡を除くために 多変量解析で説明変数に加える 背景を揃える ランダム化,層別解析,マッチング ランダム化は未知の交絡も除けるが,それ以外の⽅法は何が 交絡なのかを予測しないと解析できない.
  86. 86. 層別解析の弱点 nが⾜りなくなる 因⼦B アウトカム アウトカム 因⼦B 因⼦Aで 層別
  87. 87. 多変量解析のメリット 因⼦A 因⼦B 因⼦C 1つのアウトカムに対し,多数の因⼦を同時に評価できる. 単変量解析では分からない因果関係を⾒つけることができる.
  88. 88. 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 これが因果関係として,解析でどのように⾒えるか?
  89. 89. 単変量解析で⾒ると 多変量解析で⾒ると 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 皇居 ランナー 年収が 多い 単変量では因果関係が⾒えない 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 皇居ランナーであることが年収が多い 原因に⾒える 皇居ランナーであることは年収が多い 原因ではなく,他に原因がある.
  90. 90. 単変量解析で⾒ると 多変量解析で⾒ると 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 皇居 ランナー 年収が 多い 単変量では関連がないように⾒えて 多変量で姿を現す因⼦(抑制変数)がある 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 皇居周辺の⼤企業に勤務は年収が多い 原因には⾒えない 皇居周辺の⼤企業に勤務は年収が多い 原因である
  91. 91. 共分散分析で⾒ると 皇居 ランナー 年収が 多い 皇居周辺の ⼤企業に勤務 ランニングする だけの⽣活的余裕 ちなみに 共分散分析では因⼦ 同⼠の関係も分かる 多変量解析は因果関係を⽰すのに良い⽅法の1つ
  92. 92. ランダム化・マッチング ランダム化 ランダム割り付け マッチング • 介⼊研究で⽤いる • 調べる要因以外の背景因⼦が公 平になるように,群をランダム に割り付ける • 未測定や未知の特性もランダム 化できる • 倫理的・社会的にランダム化で きないことがある • ケースコントロール研究で⽤い る • 解析者が揃える背景因⼦を決め, データを組み合わせる • 解析から除外されるデータがあ る • 危険因⼦をマッチングさせると 危険因⼦として観察されない (オーバーマッチング)
  93. 93. ランダム化・マッチング ランダム化 ランダム割り付け マッチング 例) 年齢,性別,疾患のサブタイプ, 重症度・・・ その他全てまとめてランダム化 例) 年齢,性別,疾患のサブタイプ, 重症度は同じになるもので,2群 を組み合わせる. その他の因⼦は,揃えられない (主要な因⼦を⾒落としたり, データがないと結果が⼤きく異な る)
  94. 94. ランダム化は均⼀とは限らない ⼤数の法則 数多くの試⾏を繰り返すことで経験的確率と理論的確率が⼀致する. 例)厳密に作られたサイコロで1が出る確率は1/6だが,10回や20回振っ ても,期待値通りに1は出ない.しかし,何千,何万回と回数を増やせば, 1/6に近づく. n数が少ないと,偶然誤差が⼤きくなりやすい • 患者を1:1で振り分けても,n数に違いが出やすい • 振り分けた患者背景に差が出やすい 臨床試験のnは少ないので,ランダム化でも患者背景が均⼀に ならないことは多々あります.患者背景の⽐較が必要です.
  95. 95. ランダム化できないとき 現実の制約 n数が現実で少なすぎるとき 法律などで制限されているとき 倫理 どちらかの群が明らかに有害である場合はランダム化できな い(試験が組めない)
  96. 96. ランダム割り付け法 均等ランダム割り付け(単純ランダム割り付け) 乱数で無作為に割り付ける.簡単.ただし必ずしも同数にはならない. ブロックランダム割り付け ⼀定⼈数ごとのブロックをつくり,その中で無作為に割り付ける. 均等に割り付けやすい. 層別ランダム割り付け 性別,年齢などの要因で対象を層別に分け,各層内で無作為に割り付ける. 最⼩化法 被験者を登録する毎に,性別,年齢などの要因や,均等になるよう割り付 ける.ランダム化が強くないが,均等に群を割り付けできる. 我々は⼩規模なので,簡単な単純ランダム化法を使っています
  97. 97. ランダム化の⼿段 患者ID,Excelの乱数,乱数表,封筒法,サイコロなど ⾊々な⽅法があるが,「事前にどちらの群になるか予測で きるのは良くない」とされる. 個⼈的にはカジノで使われるものと同じプレシジョンダ イスを⽬の⾼さから⾃然落下で使っています.もちろん, ギャンブラーのように好きな⽬を出すことはできませ ん・・・(⾼橋 和希. 遊☆戯☆王 7巻. 集英社, 1998. さいふうめい,星野 泰視. 哲也. 講談社, 1998.)
  98. 98. マッチングの⼿段 完全マッチング 患者背景(例えば年齢・性別・重症度など)が⼀致する患者同⼠をマッチ ングする.共変量が多いとマッチングが困難になり(次元の呪い),マッ チングできない例による検出⼒低下(サポート問題)がある. 傾向スコアマッチング Propensity score matching 例えば,患者背景から処置群になる確率を傾向スコアとして,傾向スコア が近いもの同⼠をマッチングさせる. 簡便だが,未知の背景因⼦を揃えられない,サンプルサイズの計算が困難. ⽋損値で解析できない症例を減らす多重補完法multipul imputationがある. 傾向スコアマッチングでは,完全マッチングと⽐べて1次元になるので次元の呪いから 解き放たれ,サポート問題も減ります.構造⽅程式モデリングと⽐べ,モデル設定を⾏ わなくても良いこと,モデルの誤設定に強いのが特徴です.
  99. 99. 傾向スコア Propensity score • ある対象者が,共変量の値のもとで処置群に割り当てら れる確率. • ロジスティック回帰分析で求められることが多い. • 例えば,「肺炎の際にシベレスタットを使うかどうか, その確率は何によって決まっているか? 年齢,性別, APACHEⅡスコア,肺炎の病型,腎不全,・・・これらの患 者背景のとき,シベレスタットが使われる群になる確率 は○○%」と考える. 統計学的には「第i 被験者の共変量ベクトルをx i ,割付変数の値をz i とするとき, 群1へ割付られる確率e i = P r(z i = 1 | x i )を第i 被験者の傾向スコアという」で す
  100. 100. 傾向スコアの 解析に必要な共変量 • 理論上調整が必要な変数、または先⾏研究で関連が指摘 されている変数.下図の(a).中間変数は除く. ⼀流紙に掲載された論⽂で,どのような共変量が使われたかをまとめた表があり ます.(星野 崇宏, 岡⽥ 謙介.傾向スコアを⽤いた共変量調整による因果効果の推 定と臨床医学・疫学・薬学・公衆衛⽣分野での応⽤について. J.Natl.Inst.Public Health, 55:230-243, 2006 ) (星野 崇宏. 調査観察デー タの統計科学. 岩波書店, 119, 2009.より引⽤)
  101. 101. 強く無視できる割り当て • 回帰分析,Propensity Scoreでは「強く無視できる 割り当て」の条件を仮定する. • 「処置群と対照群のどちらに割り振られるかは, 共変量だけで予測できる」という仮定. • この仮定が成り⽴っているか直接証明する⽅法は ない.間接的に⽰す⽅法として,c統計量>0.8. 統計学的には,「割り当てはあくまで共変量にのみ依存し,結 果変数には依存しない」という仮定です.
  102. 102. 傾向スコアによるマッチング 例えば,年齢や基礎疾患により薬剤を使⽤している確率を傾向スコアと して,傾向スコアが近いもの同⼠をマッチングさせる マッチできない症例は,調査労⼒がかかっていても解析できず. 結果が誰にでも適応できる可能性(⼀般化可能性・外的妥当性)が下がる (新⾕ 歩. 今⽇から使える医療統計. 医学書院,111, 2015.より引⽤)
  103. 103. 傾向スコアの逆数によるマッチング 少ないスコアの部分の1つのデータを,まるで複数のデータのよう に扱うことでデータ損失を減らす. ⼀票の格差ってやつです (新⾕ 歩. 今⽇から使える医療統計. 医学書院,112, 2015.より引⽤)
  104. 104. • intent to treat(ITT)解析 ランダム割り付けを重視.中途脱落は治療効果なしとして初めに割り付け た群で解析する.脱落例は脱落直前の値や,最悪のアウトカムとみなして 計算する.ITTが良い. • per protocol分析(PP)解析 試験を完遂した例のみを解析.ランダム化が崩れ,治療効果を過⼤に評価 しやすい. • Full analysis(FAS)解析 全く薬を服⽤していない患者や研究開始後のデータが全くない場合など, よほど極端な例のみ除外. 効果は出たけど中途脱落が多い薬は,何か理由があって脱落しており⼀般化妥当性が低 いと考えられます.また,per protocol分析を悪⽤すると,都合の悪いデータを消して, 効果を過剰に評価することができてしまいます. 脱落例の扱い
  105. 105. ITTの向き・不向き • per protocolは,ランダム化が崩れることによる差が 出やすい • ITTはランダム化を優先するので,差が出にくくなる. • 差が出ることを⽬標にする通常の試験にはITTが良い. • 差が出ないことを⽬標にする試験(⾮劣勢試験)は, Per Protocolが良い. 「論⽂を出したい」気持ちからは逆にしたくなりますが,学問的に 考えてみましょう
  106. 106. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  107. 107. それぞれ医療統計で使うところが違うので,順に ⾒ていきましょう (涌井 良幸,涌井 貞美.中学数学で分かる統計の授業,⽇本実業出版社,017, 2013.より引⽤)
  108. 108. 記述統計 代表値 • 平均値(mean) • 中央値(median) • 最頻値(mode) 散布度 • 範囲(range) • 平均偏差 • 分散(variance) • 標準偏差(standers devition) 統計として 観測されたデータ(変数)を測定項⽬ごとに集計し てグラフなどを⽤いて特性を整理し記述する. 医療統計として 患者背景や概要を表すことができる.
  109. 109. Patients' characteristics Baseline Drug:V Non-ARB SBP 157 ± 14 157 ± 14 DBP 88 ± 11 88 ± 11 mean ±SD 概要の表はどの論⽂にもありますね PMID: 23376450
  110. 110. グラフ 最低値(または10%値) 25%値 75%値 最⾼値(または90%値) 中央値 箱ひげ図 ヒストグラム 散布図 ⾼⾎圧 あり ⾼⾎圧 なし 喫煙あり a c 喫煙なし b d クロス集計表 棒グラフ エラーバーは 標準偏差 記述統計には様々なグラフが⽤いられます
  111. 111. 代表値 • 平均値= データの総和 / 標本数(n) 偏っていないデータは平均値で⽰す • 中央値= ⼤きさ順位が中央の値 偏っているデータは中央値で⽰す • 最頻値= 最も頻度が多い値 アンケート項⽬,多数決など
  112. 112. 1 2 3 4 5 6 7 7 8 平均値 = (1+2+3+4+5+6+7+7+8)/9 = 4.7 中央値 = 5 最頻値 = 7 偏っていなければ平均値と中央値はほぼ⼀致し, 平均値を使います 偏っていない場合の代表値
  113. 113. 偏っている場合の代表値 例)架空のZ企業の年収 Aさん 300万 Bさん 600万 C さん 700万 D社⻑ 10,000万 偏っている場合には中央値の⽅が実態を 反映していますね 中央値 650 万 平均値 2900 万
  114. 114. データのばらつき 散布度 (涌井 良幸,涌井 貞美.中学数学で分かる統計 の授業,⽇本実業出版社,36, 2013.より引⽤) • 範囲(range) • 分散(variance) {(個々のデータ ー 平均値)2 の総和}/n • 標準偏差(SD:standers devition) √(分散)
  115. 115. データの範囲 • 範囲「[最低値〜最⾼値]」で⽰す. 最低値=最⼩値 最⾼値=最⼤値 • 標準偏差 偏っていないデータは「標準偏差」で⽰す. ⼤きいほどばらついている. • 4分位範囲(liter-quartle range) 偏っているデータは(25%値 - 75%値)」で⽰す. 4分位範囲には厳密にはいくつか定義があります
  116. 116. 最頻値 ヒストグラム 階級 度数 相対度数 10-20 4 0.02 20-30 8 0.04 30-40 22 0.11 40-50 14 0.07 50-60 26 0.13 60-70 54 0.27 70-80 44 0.22 80-90 28 0.14 この場合は年齢 この場合は⼈数 全体を1としたときの割合 度数分布表
  117. 117. 正規分布 • 「偏っているか」というのは,統計⽤語では「確率分布 が正規分布にしたがうかどうか」 • データが正規分布かどうかで解析法が変わる. • 平均±SDに約70%が,平均±2SDに約95%の対象者が⼊る. • 医療データは対数をとると正規分布することがある. (⻄内 啓.世界⼀やさしくわか る医療統計.秀和システム,66, 2011.より引⽤)
  118. 118. 医療統計の解析には様々な分布が使われているのですが,名前を覚える必要まではな いと思います (栗原 伸⼀. ⼊⾨統計学. オーム社; 26; 2011.より引⽤) 確率分布
  119. 119. データの表現法 最低値(または10%値) 25%値 75%値 最⾼値(または90%値) 中央値 箱ひげ図棒グラフ エラーバーは標準偏差 正規分布するデータ 正規分布しないデータ 「平均値(標準偏差)」 「平均値 ± 標準偏差」は使わない⽅ が良い 「中央値 (25%値 - 75%値) [最低 値〜最⾼値] 」
  120. 120. クロス表・リスク・オッズ 無効 有効 リスク (無効率) オッズ プラセボ a c p1=a/(a+c) p1/(1-p1) A薬 b d p2=b/(b+d ) p2/(1-p2) A薬(処置群)の,プラセボ(対照群)に対する リスク⽐(相対危険度 relative risk)=p1 / p2 リスク差(寄与危険度 attributable risk)= p1-p2 オッズ⽐ odd ratio={p1 (1-p2)] / {p2 (1-p1)} 本によってa〜dの順番が違っているので気をつけましょう
  121. 121. (落合 隆志. 世界⼀分かりやすい医学統計シンプルスタイル プラス. SCICUS, 174, 2010.より引 ⽤) MRが⾔うのは,⼤体リスク⽐です.リスク差やNNTも含めて, 効果を判定しましょう.
  122. 122. コホート 健康な ○○例を追ったら, 10年後に肺癌はa+b例になった 有病率が分かる! ケース・ コントロール 肺癌のa+b⼈と,肺癌ではないc+d ⼈を集めた 有病率は・・・分からない a+b⼈とc+d⼈を有病率の通りに均 等には集められない
  123. 123. コホート研究のリスク・オッズ 症例 ⾮症例 曝露 a b ⾮曝露 c d ⺟集団からランダム抽出して経過を追った結果なので, 有病率 = a+c/a+b+c+d リスク⽐ =(暴露群の発⽣率)/(⾮暴露群の発⽣率) =(a/a+b)/(c/c+d) オッズ⽐は意味が乏しいので⽰さなくて良い コホート研究で右のような表が 得られたとき,
  124. 124. ケースコントロール研究の リスク・オッズ 先にa+cとb+dを抽出して前を振り返った結果なので, 有病率 = 不明 リスク⽐ =(暴露群の発⽣率)/(⾮暴露群の発⽣率) =(a/a+b)/(c/c+d) と⼀⾒計算できるように⾒えるが,a+cとb+dを有病率に 従って抽出していないため,正確な値が出ないので オッズ⽐(=ad/bc)で出す 症例 ⾮症例 曝露 a b ⾮曝露 c d a+c b+d ケース・コントロール研究で右 のような表が得られたとき,
  125. 125. リスク・オッズ ケース・コントロール研究(case-control study) オッズ⽐で⽰す. 稀な疾患の場合のみ,オッズ⽐≓リスク⽐となる コホート研究(cohort study) リスク⽐(相対危険度),リスク差(寄与危険度)で⽰す ランダム化⽐較試験 リスク⽐(相対危険度),リスク差(寄与危険度),治療必要数 (NNT: Number need to treat)で⽰す NNT:何⼈治療すると1⼈の発症/死亡を防げるか 1に近く⼩さいほどよい NNT = 1/(リスク差の絶対値)
  126. 126. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  127. 127. 推測統計 ⺟集団 標本 標本がこれだから、 ⺟集団はこんな感じ かなぁ・・・ 統計学として 標本をランダムに抽出して要約値を調べるこ とで,⺟集団の要約値を推測する⽅法. 医療統計として 症例報告よりも上のエビデンスの論⽂に必須
  128. 128. ⺟集団と標本 ⺟集団 標本 ⺟集団 population は, 全⼈類の肺癌患者 ⽇本の成⼈喘息患者 など調べたいものによって様々. ⺟集団全てを調べることは現実的に難しい なので,n数の標本sampleを調べることで, ⺟集団の要約値(⺟平均や⺟分散)を調べ る. 国勢調査,⼈⼝動態統計は滅多にない全数調査です
  129. 129. 検定(test) • 仮説検定 推定(estimation) • 点推定(不偏推定) • 区間推定 区間で⺟数を推定する.95%信頼区間 など.
  130. 130. 点推定(不偏推定) 標本集団の要約値から⺟集団を推定する. • 不偏平均 = 標本平均 • 不偏分散 2 ={(個々のデータ ー 平均値)2 の総和}/n-1 • 不偏標準偏差 = √(不偏分散) 不偏推定量のギリシャ⽂字の上についているのは「ハット」といいます. 点推定は⺟集団のあくまで推定値で,nが少ないとズレも⼤きくなります.
  131. 131. (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解析・実験計画法まで. オーム社, 46, 2011. より引⽤) 観測された標本の統計量から,⺟集団に関する統計量を推測します. 点推定で推定した値が,不偏推定量です.
  132. 132. 信頼区間 • 信頼区間(confidence interval)は真の値の範囲を表す 際に⽤いる. • 推定値が⽐であれば,信頼区間が1をまたいでいなけれ ば差は有意と判定される • パラメトリック検定で求められる ⽇本⼈の平均⾝⻑は, 100〜200 cmの中にあります 信頼区間を⾒ると,その結果にどのよ うな意味があるのかが分かります
  133. 133. 信頼区間 • 95%信頼区間は,「標本を抽出して信頼区間を求めるこ とを何回も繰り返せば,その95%は真の値を含む」と⾔ うこと. • 「真の値」は知り得ないがどこか1つなので,⼿元の信 頼区間が「真の値」を含んでいる確率は0か1. (奥⽥ 千恵⼦. 医療系はじめまして!統 計学,⾦芳堂 , 154, 2015 .より引⽤)
  134. 134. 95%信頼区間の誤解 (誤)「95%の確率で信頼区間の中に真の値を含む」 (正) 「標本を抽出して信頼区間を求めることを何回 も繰り返せば,その95%は真の値を含む」 ⼊⾨書では,分かりやすさを優先して厳密には間違った 説明をすることがあります.ただし,この間違った解釈 をしても,臨床上では⼤きな問題にはなりません
  135. 135. 仮説検定とは 差がない 差がある どちらか 概 ね 差 が な い 差 が な い こ と も な い ⼀ 部 の⼈ が 差 に 気 づ く 多 く の ⼈ が 差 に 気 づ く ど ち ら か と い う と 差 が な い 差 を ⽰ す こ と は 困 難 こんなことはなく,事実は⼀つ
  136. 136. 仮説検定 帰無仮説 H0 帰無仮説はタテマエで, 間違いだと疑っているもの もし帰無仮説が正しいなら,観測され たデータを得る確率は少ないことがわ かった! 対⽴仮説 H1 それなら対⽴仮説の⽅が 正しいじゃないか! 仮説の⽭盾を証明する,いわゆる背理法です.統計学的には「⺟集団に 関する仮説を⽴て」,「観測された結果から統計量を計算し」,「帰無 仮説が正しいと仮定したもとで,観測された結果が起きる確率を計算」 し,「その値が有意⽔準未満であれば帰無仮説を棄却し,有意⽔準以上 なら帰無仮説を棄却できない」となります.
  137. 137. P値(p values)とは (誤)「帰無仮説が正しい確率」 p値は帰無仮説を真としたときの値なので,帰無仮説が正し い確率は1 (正) 「帰無仮説が真であるとすれば,サンプルから 観測された値が起こる確率」 ⼊⾨書では,分かりやすさを優先して厳密には間違った 説明をすることがあります.ただし,この間違った解釈 をしても,臨床上では⼤きな問題にはなりません
  138. 138. p値の表現 Annals of international Medicine の場合 0.2< p のとき 0.01< p< 0.2 のとき p<0.001 のとき ⼩数点以下第2位まで記載 ⼩数点以下第3位まで記載 p < 0.001 と記載 国際誌にアクセプトされる医学論⽂ の場合 p<0.001 のとき 通常 p < 0.001 と記載 ⼩数点3桁まで 他にも論⽂の記載の約束はいろいろありますが,詳しくは 「Thomas A.Lang, Michelle Secic. わかりやすい医学統計の報告. 中⼭書店, 2011.」がお勧めです.
  139. 139. 両側検定 ⽚側検定 • 原則は両側検定 例えば「A群とB群は同じではない」という対⽴仮説を⽴ てて両側検定を⾏う. • もし,明らかにどちらの⼤⼩が予測できる場合は⽚側検 定で, p値がより低く出る. 例えば「A群はB群より低い」という対⽴仮説を⽴てて⽚ 側検定を⾏う. あらかじめ「結果が分かりすぎている」介⼊⽐較 試験を組んではいけないという医療倫理に気をつけましょう. ⽚側検定をして良い場合はほとんどありません
  140. 140. p値と差の⼤きさ • p値が低いことは,差の⼤きさを⽰さない ⾎圧差が20mmHgでも差が出るときと出ないときがある • 統計学的に有意差あり(p<0.05)でも, 本当に差があるのか,それが臨床的に意 味のある差かどうかは分からない. ある薬を使うと⾎圧が3mmHg下がったのは,臨床的に意味があるのか? 5%の確率で,有意差がないのに差があると判定していないか? 差を評価するには「95%信頼区間」や「効果量」 という⽅法もあります
  141. 141. P<0.05の 0.05って何? • 臨床試験・統計解析の前に,p値がいくら以下 なら「偶然ではなく有意」として帰無仮説を棄 却するか決めておく. • それが有意⽔準・危険率 α(significant level) • αを0.05 (5%)にすること,信頼区間を95%にす るのはただの慣例 「臨床試験のための統計的原則」では,⽚側2.5%, 両側5%と取り決めてい ます.0.05はFisherが定着させたとも⾔われています(American Psychologist. 1982; 37: 553-558.)
  142. 142. p=0.049 と p=0.051の間 • 解析前に有意⽔準を0.05にしたのなら,0.049は 有意であり,0.051は有意ではない. • p< 0.05のときに,「統計的に有意な傾向があ る」というのはダメ.差の信頼区間などを表記 する • p値⾃体はn数で変わるため,p=0.049であろう が,p=0.051であろうが,臨床的に意味のある 差があるかどうかを考える.
  143. 143. αエラーとβエラー 真理 検定 結果 差がある 差がない 帰無仮説を棄却 (差がある) 正しい判断 第1種の過誤 α 帰無仮説を棄却で きない (差があるとはい えない) 第2種の過誤 β 正しい判断 • 第1種の過誤は、本当は「差がない」のに「差がある」 と判定する誤り あわてもののαエラー • 第2種の過誤は、本当は「差がある」のに「差がない」 と判定する誤り ぼんやりもののβエラー
  144. 144. αエラーとβエラー • αエラーとβエラーは,両⽅同時に⼩さくするこ とはできない • エラーした場合にどちらがマシかを考える • 効果があるかもしれない薬を⾒落とす? 探索的試験は,α⼤ β⼩に • 副作⽤が多い薬を⾒落とす? 検証的試験は,通常通り
  145. 145. p値と差の⼤きさ • 何度も⾔うが p値が低いことは,差の⼤きさを⽰さない • nさえ増やせば,⼩さな差でもp値はどんどん下がっていく 要因2あり 要因2なし 要因1あり 10 9 要因1なし 10 5 要因2あり 要因2なし 要因1あり 100 90 要因1なし 100 50 p=0.01p=0.64 p=0.61 ⽐はそのまま nを8倍に p=0.12
  146. 146. 効果量 effect size • 単位やnの⼤きさにかかわらず,差の⼤きさ を⽰す • p値と異なり,他の論⽂とも⽐較できる • 事前設計のサンプルサイズの計算,事後の差 の⼤きさを⽰す,メタアナリシスに使われる.
  147. 147. (⽔本 篤, ⽵内 理. 研究論⽂ における効果量の報告のた めに. 英語教育研究; 57-66, 31, 2008. より引⽤) これらの数値は絶対的なもの ではなく,著名な先⽣⽅が決 めたものだが,特に改訂なく 使われている様⼦
  148. 148. 効果量・α・β・n 効果量 検出⼒ 1-β 標本数 n 有意⽔準 α 4つのうち,3つが定まれば 残り1つは計算で求められる 事前に,効果量,α,βを決めて,サンプルサイズを出す 事後に,効果量を計算で求めてから, 効果量,α,nから,事後の検出⼒を出す
  149. 149. p>0.05で 帰無仮説を棄却できなかったとき • 帰無仮説が棄却できなければ「差があるともないとも⾔えな い」 • 同等性を⽰したいのであれば,近いものは⾮劣勢試験だが, かなりのn数が必要. • 差があっても⼩さいと⽰唆するには,効果量を⽰す p>0.05であり,同等と考えられました という間違った評価をする⽅が後を絶ちま せん・・・.
  150. 150. 帰無仮説を棄却できなかったときに 考えること βエラーが⼩さい 効果量が⼩さい 効果量が⼤きい 検出⼒が⾼かったのに差が 出なかった 臨床的な差が少ないのでは. 本当は臨床的な差があるかも しれない.もし,あと何例あ ればp<0.05になっただろう 事後検出⼒はnegative dataでは⾮常に低く出るので, 事後解析にあまり意味がないとする意⾒もあります (数学いらずの医科統計学)
  151. 151. 1. なぜ,医療統計が必要か 2. 研究デザインについて 3. 医療統計のキホン 4. 医療統計学 記述統計 5. 〃 推測統計 6. 〃 その他
  152. 152. 感度・特異度 検査 陽性 陰性 疾患あり a 真の陽性 c ⾒落とし 疾患なし b 過剰診断 d 真の陰性 感度 a/a+c 疾患ありを陽性と判定する 特異度 d/b+d 疾患なしを陰性と判定する 偽陽性 b/b+d 疾患なしだが検査陽性と誤判定する 偽陰性 c/a+c 疾患ありだが検査陰性と誤判定する 陽性尤度⽐ 感度/(1-特異度) 検査陽性だった場合に,検査陰性と ⽐べ疾患がある可能性が何倍か 陰性尤度⽐ (1-感度)/特異度 検査陰性だった場合に,検査陽性と ⽐べ疾患がある可能性が何倍か
  153. 153. 陽性的中率・陰性的中率 検査 陽性 陰性 計 疾患あり 有病率×n 疾患なし (1-有病率)×n 計 n 実臨床で知りたいのは,例えば「腫瘍マーカーの感度が何%か」ではなく, 「腫瘍マーカーが陽性なら癌の可能性は何%か」である まずは全体をnとし,有病率から表をうめていく 検査 陽性 陰性 計 疾患あり (有病率×n)×感度 (有病率×n)×(1-感度) 有病率×n 疾患なし (1-有病率)×n×(1-特異度) (1-有病率)×n×特異度 (1-有病率)×n 計 n 検査の感度,特異度を⼊れていく 陽性的中率=検査陽性のとき疾患ありの確率 =有病率×感度 / 有病率×感度+ (1-有病率)×(1-特異度)
  154. 154. ROC曲線 検査の閾値(カットオフ値)を決めるための曲線. 感度を縦軸に,特異度を逆の横軸にする 閾値を⾼くすると,感度↓ 特異度↑ 閾値を低くすると,感度↑ 特異度↓ 左上の⽅の点が,カットオフと して⽤いられやすい. ただし,疾患の性質によって感 度・特異度を適宜調整する.
  155. 155. ⽣存時間解析 ⽣存時間曲線・カプラン・マイヤー曲線(Kaplan- Meier curve) 観察の 打ち切りあり ⽣死不明の対象(Drop out),研究の終了時点で⽣存 (⽣存期間が観察できなかった) 観察の 打ち切りなし 研究期間中に死亡(⽣存期間が観察できた) 打ち切りは悪い印象に聞こえるが, 打ち切るのは患者さんではなく, データを打ち切ると⾔うこと.
  156. 156. 打ち切りが多いと,推定精度が どんどん落ちてしまう もしリスクが⾼い⼈が死亡前に転院などで打ち切りとなってしまうと, ⽣存割合が⾼く算出されてしまいます ⽣存期間中央値は,⽣存曲線で 縦軸の割合が50%となるところ
  157. 157. カプラン・マイヤー曲線の書き⽅ 例えば イベントを死亡.打ち切りをDrop out・研究の終了時点で⽣存とする. イベントが発⽣毎に, ⽣存率=(イベント発⽣直前の⽣存率) ×{1- (そのイベント⼈数/イベント発⽣直前までの⽣存数)} 打ち切りはイベントではないので,⽣存率はそのまま.
  158. 158. アンケートの作り⽅ • 回収率の良いアンケートを作る • 標本抽出法,調査⽅法,量的調査と質的調査について詳しく知りた い場合は,「⾼橋 信. マンガでわかる統計学 因⼦分析編, オーム社, 2006.」,「スティーブンB.ハリー,スティーブンRカミングス, 医 学的研究のデザイン, メディカル・サイエンス・インターナショナ ル」を参照 • 問診票は「実態」「意識」「属性」の順に聞く. プライバシー関係はできるだけ後に. • ⼀つの質問に,2つ以上意味を持たせない.1つの質問に1つの意味 (×)○○や××は良かったですか? 診察前後に⾏うアンケートは,かなりの⾼い回答率 を得ることができます
  159. 159. アンケートの作り⽅ • 質問に前振りをつけて誘導しない. • ⾃由回答よりも選択回答式に. • 段階評価(リッカート法)は5段階程度に.偶数で真ん 中を含めないと,回答者への⼼理的負担が⼤きくなる. • 順位付けは回答者の負担になるので避ける (×)これらを,⼤事と思う順に順位をつけてください アンケートの信頼性を評価するのにクロンバックの α係数がありますが,本稿では割愛します
  160. 160. カッパ(Κ)係数 • 2つの定性検査の,偶然によらない⼀致率. • 例えば,同じ測定者が同じ対象者に対して測定を繰り返 したときに,どれだけ⼀致した結果を得ることができる か.画像所⾒の複数の読影医師の⼀致率などに使われる. Κ 〜0.4 低い⼀致度 0.4〜0.6 中等度の⼀致度 0.6〜0.8 かなりの⼀致度 0.8〜1 ⾼い⼀致度 他にも測定値や調査票の結果の⼀貫性を⽰すのに,級内相関係数,ケ ンドールの⼀致係数を求める⽅法もありますが,本稿では割愛します
  161. 161. Rによる医療統計 第2部 統計法の選び⽅ 2
  162. 162. 1. 統計ソフト任せ? 2. 仮説検定の統計法の選び方 3. 仮説検定の統計法 4. 多変量解析
  163. 163. 統計ソフトの得⼿・不得⼿ • 得意なこと 煩雑な計算,図表作成 • 苦⼿なこと(=医師の仕事) どの統計法 を使えば良いのか どんな仮説を⽴て,結果をどう解釈するか 握力低下C 1.0 2.0 3.0 4.0 0 10 20 30 40 0.0 0.2 0.4 0.6 0.8 1.0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 吸入数C 高齢女性C 0.0 0.2 0.4 0.6 0.8 1.0 0 10 20 30 40 発症後年数C 0.0 0.4 0.8 0.0 0.4 0.8 0.0 0.4 0.8 0.0 0.2 0.4 0.6 0.8 1.0 副鼻腔炎C
  164. 164. 統計法の間違い あるある • ⾮常に少数なのにパラメトリック法 • 検定の多重性の補正をしていない • 対応がないのに,対応がある検定を⾏う • 事前のサンプルサイズの設計がされてい ない 統計ソフトの怖いところは,間違った統計法を 選んでも,p値が出てしまう.なので,間違いに 気づかない
  165. 165. 1. 統計ソフト任せ? 2. 仮説検定の統計法の選び方 3. 仮説検定の統計法 4. 多変量解析
  166. 166. 検定法を決める • データの尺度 • ⽐較する群の数 • 対応があるか • 正規分布か(パラメトリックか,ノンパラ メトリックか) • 等分散か これらが決まれば⼤体の検定法が決められます
  167. 167. データの尺度 質的尺度 カテゴリデータ 名義尺度 順序尺度 量的尺度 数量データ ⽐率尺度(⽐例尺度) 間隔尺度 データの尺度によって解析⽅法が異なる. 名義尺度のみをカテゴリデータと呼ぶ場合もあります
  168. 168. データの尺度 順序 等間隔 四則演算 名義尺度 例)性別,ID,住所,⾎液型 2種類の値しかとらないものは2値変数 例)性別,疾患の有無,2択アンケート × ○ × 順序尺度 例)良い・悪い,主観的評価,Gafky, Performance Status ○ ○ × 間隔尺度 温度など ○ ○ 加減 ⽐率尺度(⽐例尺度) 絶対的な0を意味する0点がある 重さ,⻑さ,濃度など ○ ○ 加減乗除 20℃は10℃の2倍ではなく,0℃は絶対的な0ではないですよね.
  169. 169. データの尺度の変更 名義変数を,数値に 統計解析時は,名義変数を0と1で表現して解析している. これをダミー変数という. 例)「はい」⇒ 1 「いいえ」 ⇒ 0 「A型」⇒ 1, 0, 0 B型 ⇒ 0, 1, 0 AB型 ⇒ 1, 1, 1 O型 ⇒ 0, 0, 0 数量データをカテゴリデータに カットオフは解析者が決める.データの持つ意味は減る. 例)「2.5cm」⇒ T1b 「6cm」⇒ T2b 順序尺度のカテゴリデータを数量データと「みなして」解析したり,間 隔・⽐率尺度を順位尺度に変換して解析することもあります
  170. 170. 正規性の検定 本当はこのように単純にパラメトリックとノンパラメトリックを使う わけではありません.ヒストグラムを⾒るのが良いとされています. どんな検定? 標本が正規分布かを検定する 検定 シャピロ・ウィルクスの検定(Shapiro-Wilks test) コルモゴロフ・スミルノフの適合度試験(Kolmogorov- Smirnov test of fit) 何に必要? 正規分布かどうかでその後の検定が異なる 正規分布ならパラメトリック法 正規分布でないならノンパラメトリック法 (の⽬安になる)
  171. 171. パラメトリック 正規分布する数値の検定法 間隔・⽐率尺度,(⼀部の)順序尺度 ノンパラメトリック 正規分布しない数値の検定法 間隔・⽐率尺度,順序尺度 順位付けで検定する もし,パラメトリック検定ができる場合にノンパラメトリック検 定を使うと,p値が⾼く出る(検出⼒が落ちる)傾向があります.
  172. 172. 正規性の検定のパラドックス 正規性の検定でp<0.05のとき • nが⼤きいほど,正規性の検定でp<0.05になりやすい(正規分布で はないと判定されやすい) • しかし,nが⼤きければパラメトリック検定をしても良い 正規性の検定でp≧0.05のとき • nが⼩さいほど,正規性の検定でp≧0.05になりやすい(正規分布と 判定されやすい) 本末転倒な感じがする正規性の検定ですが,この検定がパラ メトリックか,ノンパラメトリックかを絶対的に決めるもの ではないと⾔うことです.
  173. 173. どこからパラメトリック? パラメトリック ノンパラメトリック • 明らかに正規分布に従う • サンプルサイズが⼗分に ⼤きい(各群24以上) • 対数変換をして正規分布 に従う場合 • 順位・スコア • いくつかの値が測れない ほど極端 • 明らかに正規分布に従わ ない場合 ⼗分なnがあれば,正規分布でなくてもパラメトリックを使っても頑健性のため⼤ きな問題にはならず,ノンパラメトリックを使ってもパラメトリック法と検出⼒は わずかに下がる程度です. パラメトリックに必要なnは,各群20〜24以上(数学いらずの医科統計学 ),各群15以上(今⽇から使える医療統計)など多少⾒解に違いはあります
  174. 174. 対応がある 同⼀被験者が反復測定を⾏なっている場合などは「対応があ る」.⼀卵性双⽣児や遺伝的に統制されたマウスも「対応が ある」とすることがある.対応がある検定の⽅が,p値が低 く出やすい. 例)同⼀被験者の薬剤投与前、投与後の⾎圧 <類義語> 対応がある Paired 繰り返しの⽐較 Repeated measures 郡内の⽐較 Intragroup 対応があるか,ないかで解析法が変わる
  175. 175. 対応がない 例)薬剤投与群と、薬剤⾮投与群の⾎圧 n数が違うことがあり得る 患者背景に差があるかどうかの検定が必要 <類義語> 対応がない Unpaired 繰り返しのない⽐較 Non-repeated measures 郡間の⽐較 Intergroup
  176. 176. 等分散の検定 • F検定(F-test) • データのばらつき・分布に差があるか (涌井 良幸,涌井 貞美.中学数学で分かる統計 の授業,⽇本実業出版社,36, 2013.より引⽤) バートレット検定は正規性の仮定が必要,ルビーン検定(レーベン検 定)は正規性の仮定は不要です.
  177. 177. 等分散の検定 (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解析・実験計画法まで. オーム社, 123, 2011. より引⽤) 統計学的には,⺟分散が同じかどうかを調べています
  178. 178. 検定⽅法の選び⽅ Gold standard (Daniel W.Byrne,M.S. 国際誌にアクセプトされる医学論⽂, メディカル・サイエンス・インターナショナル, 76, 2010.より引⽤ )
  179. 179. ⼤雑把な検定⽅法の選び⽅ 2群の差を⽐較する場合 ⽐率・ 間隔・ 順序尺度 対応あり 正規分布する 対応のあるt検定 正規分布しない ウィルコクソンの符号付き順位検定 対応なし 正規分布する 等分散ならt検定 等分散でなければWelch t test 正規分布しない マン・ホイットニーU検定 3群以上の差を⽐較する場合 ⽐率・ 間隔・ 順序尺度 対応あり 正規分布する 反復測定分散分析 多重⽐較 正規分布しない フリードマン検定 対応なし 正規分布する ⼀元配置分散分析 正規分布しない クラスカル・ウォ リス検定
  180. 180. ⼤雑把な検定⽅法の選び⽅ 相関を調べる場合 2変量とも正規分布 ピアソンの相関係数 いずれかの変量が正規分布 しないか,順位尺度 スピアマンの相関係数 2×2の表で差を調べる場合 名義 尺度 通常 χ2(カイ⼆乗)検定 データの中(上表のa〜d)に 10以下の数値がある イエーツ補正χ2検定 データの中(上表のa〜d)に4 以下の数値がある場合や, n<20 フィッシャー直接確率試験
  181. 181. ⼤雑把な検定⽅法の選び⽅ ⽣存曲線を調べる場合 群間に差があるかを調べる ログランク検定 ⽣存期間を,因⼦から予測する コックス⽐例ハザード回帰分析
  182. 182. 1. 統計ソフト任せ? 2. 仮説検定の統計法の選び方 3. 仮説検定の統計法 4. 多変量解析
  183. 183. 2群の平均の差の検定 統計学的には,2群の平均の差があるかどうかは,同じ⺟集団の2群 かどうかを調べています.等分散の検定も同様です. (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解析・実験計画法まで. オーム社, 111, 2011. より引⽤)
  184. 184. 対応のないt検定 unpaired t test, student t test 使⽤条件 パラメトリック 対応がない2群 平均値の差を調べる 等分散でなければWelch t test 例 対象を2群に分け,それぞれA薬とB薬を投与し、使 ⽤後のバイタル(間隔尺度)を⽐較 A薬 B薬 等分散の前提に頑健なので,等分散でなくてもt検定をする⽅法もあります.
  185. 185. マン・ホイットニーU検定 使⽤条件 ノンパラメトリック 対応がない 2群 例 対象をA群とB群に分け,それぞれA薬とB薬を投与 し、使⽤後のアンケート(順序尺度)を⽐較 A薬 B薬 ウィルコクソン順位和検定ともいいます.ウィルコクソン符号付き順位検定とは別物です.
  186. 186. 対応のあるt検定 paired t test 使⽤条件 パラメトリック 対応がある 2群 平均値の差を調べる 例 対象にA薬を投与し,使⽤前と後のバイタル(間隔 尺度)を⽐較 A薬
  187. 187. ウィルコクソン符号付き順位検定 使⽤条件 ノンパラメトリック 対応がある 2群 平均値の差を調べる 例 対象にA薬を投与し,使⽤前と後のアンケート(順 序尺度)を⽐較 A薬
  188. 188. 分散分析 統計学的には,帰無仮説H0:要因効果なし(各群の⺟平均に差はない)対⽴仮説 H1:要因効果あり(各群の⺟平均は差はある)として,データの変動をみて,要因 による変動が,誤差による変動よりも⼤きいかどうかをみています.⼆元配置分散分 析の場合は,それぞれの要因効果と,要因の交互作⽤の有無をみています. (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解析・実験計画法まで. オーム社, 131, 2011. より引⽤) 3群以上の平均の差を検定する⽅法.
  189. 189. 分散分析 ① 群の間に有意差があるかどうか 有意差なし:全ての群に差がない 有意差あり:群の間のどこかに差がある ② どの群の間に差があるか 多重⽐較 「①,②両⽅で有意差がないと意味がない」とする派と,「②のみでも良い」とする 派があります. (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解 析・実験計画法まで. オーム社, 148, 2011. より 引⽤)
  190. 190. 検定の多重性 分散分析で要因効果があるとき,複数の群の2つだけを抜き出 して,2群間の⽐較を複数回⾏うと,「差がないのを差があ る」αエラーが増えてしまう. 多重⽐較や,Bonferroni補正を使う. (「もし20回測って5%の偶然が1回も起きない確率」は36%しかない). v v 症例数を増やして追加検定をする⽅法も多重検定になるのでダメ です.もし中間解析をする際には有意⽔準が調整されます.
  191. 191. 多重⽐較 パラメトリックの場合 通常は対照群と治療群の⽐較なので,ダネット検定か,ボンフェローニ補 正が良い. • ダネット検定(Dunnett's test):対照群との⽐較 • シェッフェ検定(Schffe test):全ての群を⽐較 • チューキー検定(Turkey test) :全ての群を⽐較 • ウィリアムズ検定(Williams test):単純な増減の場合 • ボンフェローニ補正(Bonferroni correction) ノンパラメトリックの場合 • ボンフェローニ補正(Bonferroni correction) • シェッフェ検定(Schffe test):全ての群を⽐較 (栗原 伸⼀ . ⼊⾨ 統計学 −検定から多変量解 析・実験計画法まで. オーム社, 157. 2011. より 引⽤)
  192. 192. Bonferroni補正 • 2群間の⽐較を使うが,⽐較する回数で危険率を 割る(またはp値に⽐較する回数をかける) 3回検定のとき,0.05/3= 0.017以下で有意差ありとする または,p値を3倍にして記載する. かなり検出⼒が落ちる⽅法で,他にもホルム法があります.
  193. 193. 対応がない3群以上の⽐較 (対⾺ 栄輝.医療系研究論⽂の読み⽅・まとめ⽅―論⽂のPECOから正しい統計的判断まで,東京医書,119, 2010.より引⽤) 等分散の検定を⾏わない流派もあります
  194. 194. 対応がある3群以上の⽐較 (対⾺ 栄輝.医療系研究論⽂の読み⽅・まとめ⽅―論⽂のPECOから正しい統計的判断まで,東京 医書,120, 2010.より引⽤)
  195. 195. ⼀元配置分散分析 one way analysis of variance, one way ANOVA 使⽤条件 パラメトリック 対応がない 3群以上 例 対象を3群に分けそれぞれにA薬,B薬,C薬を投与し, 使⽤後のバイタル(間隔尺度)を⽐較 B薬 C薬 A薬
  196. 196. クラスカル・ウォリス検定 Kruskal Wallis test 使⽤条件 ノンパラメトリック 対応がない 3群以上 例 対象を3群に分けそれぞれにA薬,B薬,C薬を投与し, 使⽤後のアンケート(順位尺度)を⽐較 B薬 C薬 A薬
  197. 197. 反復測定分散分析 repeated measures analysis of variance, repeated measures of ANOVA 使⽤条件 パラメトリック 対応がある 3群以上 例 対象を3群に分けそれぞれにA薬,B薬,C薬を投与し, 使⽤前と後のバイタル(間隔尺度)を⽐較 B薬 C薬 A薬
  198. 198. フリードマン検定 Friedman test 使⽤条件 ノンパラメトリック 対応がある 3群以上 例 対象を3群に分けそれぞれにA薬,B薬,C薬を投与し, 使⽤前と後のアンケート(順位尺度)を⽐較 B薬 C薬 A薬
  199. 199. 対応のない⼆元配置分散分析 two way analysis of variance, two way ANOVA 使⽤条件 パラメトリック 対応がある 2要因の分散分析 例 薬と運動療法の2要因で,⾎糖値が要因による効果 があるかを調べる 運動療法あり 運動療法なし A薬 100 150 B薬 120 180 C薬 120 200
  200. 200. ⾃由度 (df: degree of freedom) • 「独⽴に分布する変数の数」-「推定パラメータ数」 • 論⽂に記載が必要なときがある. • Rでの計算結果に出てくるので,⾃分で計算しなくてもOK 検定法 ⾃由度(df) 対応があるt検定 n-1 (nは各群で同じになる) 対応がないt検定 各群のnの和-2 m×nカイ⼆乗検定 (m-1)×(n-1) ※ 2×2ならdf=1 対応がない分散分析 第1⾃由度 = (m-1) 第2⾃由度 = 各群のn-1の総和 ※ mは群数 対応がある分散分析 第1⾃由度 = (m-1) 第2⾃由度 =(m-1)×(n-1) ※ mは群数
  201. 201. 使⽤条件 2値データ,カテゴリデータ 2✖2の表 例 χ2(カイ⼆乗)検定 例 男 ⼥ 喫煙あり a c 喫煙なし b d データの中(上表のa〜d)に10以下の数値がある場合は, イエーツ補正カイ⼆乗検定にする データの中(上表のa〜d)に4以下の数値がある場合は, フィッシャー直接確率試験にする
  202. 202. 相関の検定 どんな統計法? 2種類の順序・間隔・⽐率変数の間に何らかの関係 があるかの相関係数(correlation coefficient, r) を求める 何ができる? 何らかの直線的な関係があるかどうかは分かるが, 因果関係があるかは分からない. 検定 パラメトリック(2変量とも正規分布)のとき,ピ アソンの相関係数(Pearson's correction coefficient) ノンパラメトリック(いずれかの変量が正規分布し ないか,順位尺度)のとき,スピアマンの相関係数 (Spearman's correction coefficient) 相関係数に意味があるかを調べる無相関検定もありますが,そこまでしなくても良いと 思います
  203. 203. 相関の検定 (奥⽥ 千恵⼦. 医療系はじめまして!統計学,⾦芳堂 , 96, 2015.より引⽤) まずは散布図で概要をみる
  204. 204. 相関分析では分からないグラフ • 曲線関係や,特殊な直線 • 外れ値の影響を強く受ける (The American Statistician; 27: 1: 17-21, 1973.)
  205. 205. 偏相関 交絡を取り除く⽅法の1つ 発展させると,構造⽅程式モデリング 観測変数X 観測変数Y 観測変数Z 中学⽣の 年齢 中学⽣の 体重 中学⽣の 学⼒ 「中学⽣の体重」は,「中学⽣の学⼒」と相関 があるように⾒えるが,偏相関で「中学⽣の年 齢」の影響を取り除くと, 「中学⽣の体重」は, 「中学⽣の学⼒」の相関はなくなる. 偏相関 観測変数X 観測変数Y 観測変数Z 偏相関 影響を取り除く
  206. 206. 統計的因果推論 相関の検定で分かるのは,何らかの直線的な関係が あるかどうか.因果関係は分からない. そもそも相関関係は因果関係の必要条件の1つ. 相関関係 ≠ 因果関係
  207. 207. 必要条件・⼗分条件 因果関係ならば相関関係 (真) 相関関係でなければ因果関係ではない(対偶も真) 因果関係は,相関関係というのに⼗分(⼗分条件) 相関関係は,因果関係というのに必要(必要条件) 相関関係 因果関係
  208. 208. 相関の検定(名義変数の場合) どんな統計法? 名義変数同⼠の間に何らかの関係があるか を求める 何ができる? 県と疾患の関連があるか,など 検定 クラメールの関連係数(クラメールのV,独⽴係 数) 計算法と評価の仕⽅は「⾼橋 信. マンガでわかる統 計学, オーム社, 2004.」を参照 A県 B県 C県 疾患A a c e 疾患B b d f
  209. 209. ログランク検定 log rank test 使⽤条件 ⽣存曲線が群によって差があるか 例 肺癌を2群に分け,それぞれA薬とB薬を投与し、⽣ 存曲線を⽐較 解析法 それぞれの⽣存曲線のイベント発⽣数のズレを,全 てのポイントで併合する どこか⼀点ではなく,曲線全体で⽐較する ⽅法です.⼀般化Wilcoxon検定という⽅法 もあります. 左のように時間軸の中央付近で交差する⽣ 存曲線ではログランク検定は適しません.
  210. 210. その他の検定⽅法 ユールのQ Yule's Q,ファイ係数 2×2の質的変数の関連性 マクニマーの検定 mcnemar's test 2×2のクロス集計表で,対応がある場合 コクランQ検定 Cochran's Q test m×nのクロス集計表で対応がある場合 本稿では取り扱わないので、成書を参照ください.
  211. 211. 1. 統計ソフト任せ? 2. 仮説検定の統計法の選び方 3. 仮説検定の統計法 4. 多変量解析
  212. 212. なぜ多変量解析か • 1つのエンドポイントに対し,多数の因⼦ の効果を同時に評価できる. 年齢・性別・・・層別化しなくて良い • 交絡を調節して因果関係を⽰しやすくな る. • 相関関係だけでは分からない交絡因⼦を ⾒つけることができる.
  213. 213. 多変量解析でできること 予測 回帰分析 あるデータから, ある量的データを予想 判別 判別分析 ロジスティック分析 あるデータから, ある質的データを予想 要約 主成分分析 因⼦分析 縮約するのが主成分分析 背景にある因⼦を⾒つけるの が因⼦分析 数量化Ⅰ類〜Ⅳ類は割愛します. 予測と判別は「外的基準のある分析」,要約は「外的基準のない 分析」とも⾔います
  214. 214. 回帰分析 どんな 統計法? ⽬的変数(結果変数,従属変数)を,説明変数(独⽴変数)を 使って数式に当てはめる 1つの説明変数から予測するのが単回帰分析(2変量解析) 複数の説明変数から予測するのが重回帰分析(多変量解析) y=a1X1+・・・の形で表すのが線形単回帰分析,線形重回帰分析 Logの形で表すのがロジスティック回帰分析など. (⾼橋 信. マンガでわかる統計学 回帰分析編, オーム社, 105, 2005.より引⽤)
  215. 215. 線形単回帰分析 どんな 統計法? 変数を,1つの独⽴変数を使って単純な数式に当てはめる. 使⽤条件 従属変数も独⽴変数も量的尺度(数量データ). 従属変数と独⽴変数が直線関係にあると考えられる. 何ができる? 1つの独⽴変数の結果から,従属変数を予測できるように なる 説明変数 (独⽴変数) 結果変数 (従属変数) ?
  216. 216. 線形単回帰分析 単回帰式 y=ax+b y:従属変数 x:独⽴変数 a:偏回帰係数 b:切⽚ (涌井 良幸,涌井 貞美.中学数学 で分かる統計の授業,⽇本実業出 版社,181,2013.より引⽤) 厳密には回帰⽅程式のyは予測値であり, とハットを つけ,実際の実測値yと分けて書くことがあります.
  217. 217. 線形単回帰分析 求めた単回帰式は,どの程度精度があるのか? 決定係数R2 • 0≦ R2 ≦1 • 1に近いほど単回帰式の精度が⾼い
  218. 218. 線形重回帰分析 どんな 統計法? 従属変数を,複数の独⽴変数を使って単純な数式に当ては める. 何ができる? 複数の独⽴変数から,従属変数を予測できるようになる 説明変数 (独⽴変数) 結果変数 (従属変数) ? 重回帰式 y=a1x1+a2x2+・・・+b y:従属変数 x:独⽴変数 a:偏回帰係数 b:切⽚ 説明変数 (独⽴変数) (加藤 剛. 本当に使えるようになる 多変量解析超⼊⾨. 技術評論社, 172, 2013.より引⽤)
  219. 219. 線形重回帰分析 うわっ・・・私の年収、 (平均年収=200×職業+5×年齢 +2×為替市場+3×株価+10×部下の数+・・・) 低すぎ・・・?
  220. 220. 線形重回帰分析 求めた重回帰式は,どの程度精度があるのか? 決定係数R2 は,役に⽴たない説明変数を⾜しただ けでも上がってしまうので,⾃由度で調整する. ⾃由度調整済み決定係数 R2(adjusted R2 ) • 1に近いほど重回帰式の精度が⾼い
  221. 221. ロジスティック回帰分析 logistic regression analysis どんな統計法? ⽬的変数と説明変数のロジスティック回帰式を求める 使⽤条件 説明変数は数量データでもカテゴリカルデータでも良 い 何ができる? ⽬的変数を死亡や発症とし,それが起きる「確率」を 予測できる logにすることでyを0〜1の範囲で確率にすることができ ます. (⾼橋 信. マンガでわかる統計学 回帰分析編, オーム社, 154, 2005.より引⽤)
  222. 222. ロジスティック回帰分析 logistic regression analysis y=1/1+e-(・・・) ・・・0.8×前の返球⽅向+0.5×打球の速 度+0.1×スライス+0.2×フォアハンド +0.2×相⼿のコートのX座標+0.15×⾃ 分のコートのy座標+0.1×・・・ 右へストレートの可能性 90%! ちなみに,2打⽬トップスピンストレート,3打⽬ショートクロス・・・と考えていく とベイズ統計になります(許斐 剛. テニスの王⼦様, 集英社, 2000.)
  223. 223. 主成分分析 どんな統計法? 説明変数の「総合⼒」である主成分zを新たに⾒つけ出 し,それぞれの説明変数が与える影響の度合いをみる. 変数を「要約」する⽅法の1つ. 何ができる? 例えば総合評価基準などに使える (⾼橋 信. マンガでわかる統計学 因⼦分析編, オーム社, 101, 2006.より引⽤)
  224. 224. 主成分分析 • 主成分は解析者の意向に関わらず求められる.説明変数は, 解析者が決める. • 第1主成分が何を意味するかは,解析者が判断する. 例)英・数・理・国・社の1学期末テストの点数から求められる第1主成分は,お そらく試験の総合⼒.でも「5教科っつったら、国・英・社・理,あと、家だ ろ!」と家庭科を説明変数にしても良いし,第1主成分を暗殺の成功率と考えても よいかもしれない(松井 優征, 暗殺教室, 集英社, 2012) • 主成分は説明変数の個数だけ求まるが,通常は第2主成分ま で求める. • 第2主成分までの累積寄与率(第1主成分の寄与率+第2主 成分の寄与率)が50%以上になるのが望ましい解析.
  225. 225. 因⼦分析 どんな統計法? 観測変数を縮約・分解する⽅法の1つ. いくつかの⽬的変数の背景にある,説明変数を⾒つけ, その因⼦負荷量を求める. 因⼦の求め⽅に,解析者の意向が⾮常に強く⼊る. 何ができる? 患者背景や⾏動⼼理学などの調査 (⾼橋 信. マンガでわかる統計学 因⼦分析編, オーム社, 136, 2006.より引⽤)
  226. 226. 因⼦分析 • Rでは最尤法で計算されている • 回転法は,バリマックス法などの直交回転,プロマックス法 などの斜⾏回転がある. 因⼦間の相関がないと考えるなら直交回転だが,通常は判別 困難なので,両⽅とも解析して説明しやすい⽅を選んで良い. (⾼橋 信. マンガでわかる統計学 因⼦分析編, オーム社, 174, 2006.より引 ⽤)
  227. 227. クラスター分析 どんな統計法? データを,種類や性質が近いもの同⼠で集めていく 何ができる? 例えば,気管⽀喘息のサブタイプを調べる (加藤 剛. 本当に使えるようになる多変量解析超⼊⾨. 技術評論社, 46, 2013.より引⽤)
  228. 228. 判別分析・決定⽊ どんな統計法? 判別分析は,あるデータがどちらの群に属するかを判 別する⽅法. 決定⽊は,単純な⽅法で分類のルールを決め,枝分か れのようにデータを分別していく⽅法 何ができる? 決定⽊は,⼤まかなカットオフの線を引ける 多変量解析のような正確さではなく,ざっくり 単純な⽅法で分けるというのが決定⽊です.
  229. 229. コックス⽐例ハザード回帰分析 Cox proportional hazard regression analysis どんな統計法? ⽣存曲線に対する多変量解析. ハザード⽐が常に⼀定であるのが使⽤条件 例 ⽣存期間が,性別や組織型などで変わるかどうか 内科的治療や外科的治療のように,時期によってハザード⽐が変わるような組み 合わせ(カプラン・マイヤー曲線が中央付近で交差するなど)では前提が成り⽴ たず解析できません.
  230. 230. その他の検定⽅法 コレスポンデンス分析・対応分析 2つの変数の間のプロット図を作成し,関連を⾒る⽅法 共分散分析ANCOVA あるデータに2つの要因が影響するとき,その2つの要因に共通して影 響する因⼦があった場合、それを取り除いて2つの要因を⽐較する⽅ 法 本稿では取り扱わないので、成書を参照ください
  231. 231. 構造⽅程式モデリング SEM: Structual Education Modeling • SEMは共分散構造分析(CSA: Covariance Structure Analysis)を含む. • 共分散は,標準化された2つの変量の相関係数と⼀致す る. • 因⼦分析と重回帰分析を同時に⾏なうような解析で,観 測変数を縮約してから因果関係を調べることができる. • 適合度(モデルとデータがどの程度合致しているか)は 情報量基準(Akaike's Information criterionやBayesian I.C. など)が使われる.
  232. 232. SEMの⽤語あれこれ ややこしくて挫折しそうになります. 使われる記号 観測変数 調査で観測された,⽬に⾒える変数 χ 潜在変数 ⽬に⾒えない変数 F, f 誤差変数,残差 説明変数で説明しきれない残り. 潜在変数に含まれる. e 因果係数 因果関係を調べた偏回帰係数 λ(ラムダ) 外⽣変数 モデルの中で⼀度も他の変数の結果 となっていない(⽮印が刺さってい ない)変数. 内⽣変数 モデルの中で⼀度は他の変数の結果 となっている(⽮印が刺さってい る)変数.
  233. 233. パス図 • 変数の関係を表した図 • 観測変数は四⾓で囲む • 潜在変数は円で囲む • 誤差変数は囲まない • 因果関係は「 →」,相関関係は「↔」 解析はR SEMパッケージやlavaanパッケージでできます
  234. 234. パス図 観測変数X 観測変数Y パス係数a 誤差e 解析はR SEMパッケージやlavaanパッケージでできます 変数Xが影響⼒aで変数Yに影響を与える.それ以外の影響は誤差e 観測変数X 観測変数Y 共分散a 変数Xと変数Yは共分散aで相関する.

×