社会人なら知らないとまずい因果推論(Hillの基準)

スポンサーリンク
Other
初心者に人気のプログラミング言語Pythonは独学可能か?
Pythonは非常に人気のあるプログラミング言語で、まったくの初心者でも独学が可能と言われています。 Pythonはさまざまな目的に使える、汎用性のあるプログラミング言語です。 プログラミングは「独学が難しい」と言われていま...

世の中にある情報でもっとも重要な情報は「因果関係」です。
因果関係とは、原因と結果の関係のことで、原因を変化させると結果が変わります。別の言い方をすると、結果を変えたい場合は、原因を変えればいいということです。
たとえば、

  • 雨が降ると服が濡れる
  • タバコを吸うと肺がんになる
  • 商品を値下げするとよく売れる

などです。
上記のような因果関係がわかれば、どう行動するでしょうか?

  • 服を濡らしたくなければ、傘をさす、屋根のある建物に入る
  • 肺がんになりたくなければタバコを吸わない
  • 商品の売り上げ個数を上げたければ値下げする

原因を変えることで、結果を変える事ができます。
では、このような疑問が湧いてくるはずです。

  • 感染症が蔓延する原因は?
  • 顧客満足度の原因は?
  • 仕事の時間効率が悪い原因は?

など、物事の原因を知りたいことは多いはずです。
巷には因果関係があるような言い回しを、していることが多いです。因果関係があると思って行動しても、結果が変化しないことも多いはずです。
そこで、因果関係について詳しく考えてみましょう。

統計学、エビデンスの観点からビジネス書を批判的吟味で読み解く

ビジネス書を科学的に読み解く「AI分析でわかった トップ5%社員の習慣」編

Hillの基準

因果関係を知るためには、ある程度の基準があった方が分かりやすいです。Hillの基準は因果関係のフレームワークとしてもっとも引用されてい基準です。

このHillの基準の中から、分かりやすく、重要なものについて説明して、因果関係の理解を深めていきます。

ちなみに、Hillの基準は9つありますが、すべてを満たさないといけない、この基準に達していないと因果関係は証明できない、といったものではないです。

この9つの項目を確認していき、因果関係があるかどうかを慎重に判断するためのフレームワークといった意味合いで使っていけばいいです。

      1. 一致性
      2. 強固性
      3. 特異性
      4. 時間性
      5. 整合性
      6. 生物学的用量反応勾配
      7. 妥当性
      8. 実験的研究
      9. 類似性

1 一致性

だいたい同じことが起こる
異なる研究者によって、異なる地域・条件・時間に関連性が繰り返し観察されること。時期や地域、状況が異なっていても、研究の結果が一致していること。

2 強固性

要因同士の関連が強い
店舗の清潔さが客数と強い相関があると、客数の原因は清潔さになりうるということです。
関連はあっても相関が非常に少ないと、因果関係とは呼べないです。統計的な優位なだけではダメ。

3 特異性

因子間に特異的な対応が存在すること。
ある特定の因子Aと因子Bの関係で、因子Aが変われば因子Bが変わるような関係がある場合は、因果関係が存在する可能性が高いです。

4 時間性

原因が結果より時間的に先行する
原因における結果への影響を調べたいので、時間差がある縦断研究が必要です。時間的変化がない、横断研究のみでは因果関係は証明できないです。

5 整合性(一貫性)

観察された関連性が、既知の事実と一致すること。
今まで証明された事実からは説明のつかないものは、因果関係とは呼べない可能性があります。
「新型コロナには水道水を飲めば、治ります」などです。水道水でウイルスが撃退できた他の事例はありません。

新型コロナワクチン(ファイザー)の効果と副反応を論文で確認してみた

6 生物学的用量反応勾配

原因に対して大量に変化させると、結果である反応も大きくなるということです。
店舗をキレイにすればするほど、客数も多くなれば、因果関係の可能性が高いです。

7 妥当性

現在の医学的、生物学的常識などからみて、もっともらしいこと
新しい知見は、常識に矛盾するかもしれないです。ここでいう常識は、社会的な一般常識ではなく、論文などで実証済みである医学的な常識のことです。「5 整合性」と近い考え方ですね。

8 実験的研究

実験によって、実際に原因を変化させて、結果がどうなるかを確認します。結果が変化すれば、因果関係の強力な証左になります。
この場合は、基本的には、ABテストのようなランダム化比較試験のことです。

9 類似性

類似した関連性が存在すること。
今っまではウイルスの対応するレセプターを閉じてしまえば、ウイルスに感染しない。だから、今回のウイルスも、レセプターを閉じてしまえば、感染しないということです。

以上がHillの基準です。
全ての厳密に確認することは難しいので、手っ取り早いのは、やはり「8 実験的研究」をすることです。高品質な研究はその他の基準を満たしていますので、実験の結果から因果関係を推論していけば良いでしょう。

因果関係は気軽に使っている場合が多いですが、結構厳密なものです。おそらく因果関係を証明できているものはほとんどないです。とはいえ、それでは何もできないので、便宜上、強い仮説を事実としてみなしているのが現状です。

重要な意思決定の場合は、気軽な因果関係を要注意です。因果推論の参考にHillの基準を使ってみて下さい。

モンティ・ホール問題|説明されても納得できない?これが分かればデータサイエンスのセンスあり

ゼロ知識の初心者がデータサイエンスを完全無料で学習する方法5選
データサイエンスの知識や技術、またはPythonについて学びたい。でも「大学に行くほど本気度がない」、「スクールに行くほどお金がない」、なんせ「時間がない」という方も多いはずです。というよりほとんどの方がそうだと思います(当然わたし...

 

コメント

タイトルとURLをコピーしました