因果関係を逆転させると理不尽なことになる

2019/12/22

統計を扱う上で注意が必要な事柄の 1 つに因果関係があります。因果関係はその扱い方を誤ると理不尽なことを引き起こしかねないです。

消防士の数と火災の規模

wikipediaに乗ってる内容です。

火災現場に出動する消防士が多いほど、火災の規模は大きい。 したがって、出動する消防士が多くなることが、火災が大きくなる原因だ。

全国の消防士に謝れって話ですよ。実際のところは、火災の規模が大きいから多くの消防士が消化活動に当たるわけです。

捕食者と被捕食者

よくある話ですが、数が減っている生物(被捕食者)とその生物を捕食する生物(捕食者)の関係について考えてみます。被捕食者の生存率と捕食者の個体数の関係を実際の現場で調査して次のような結果得られたとします。

直観的に考えると、「捕食者の個体数が増加すると被捕食者の数が減少する」と結論づけてしまいそうです。この因果関係が正しいのであれば、捕食者を駆除しその個体数を減少させれば、被捕食者の生存率が上がることになります。本当にそうなるんでしょうか。

例えば、より詳細な調査進めて「捕食者は被捕食者の死骸しか食べない」ことが分かったとします。こうなってくると話が変わってきます。つまり、「被捕食者の数が減少したので捕食者の個体数が増加した」という逆の因果関係が正しい可能性もでてきます。もしこちらが正しいのであれば、被捕食者の駆除は見当違いな対策になってしまいます。

どちらの因果関係が正しいのかは、(僕の知る限り)現場での調査をもとに判断するしかありません。

検量線

化学系の方ならご存知検量線。ここにも因果関係の注意が必要です。

検量線は、物質の量とその測定値の関係を表した線です。つまり、「物質の量がxxなので測定値はyy」という因果関係にあります。したがって、y=f(x)y=f(x)という形で回帰を行うのが一般的です。

ただ、検量線を引く場合は物質の量xxを推定したいという場合が多いです。そのため、x=g(y)x=g(y)という形で回帰したくなります。しかしこれは「測定値がyyなので物質の量はxx」という逆向きの因果になっています。もはや"測定"ではなく物質の量を"決定"してしまっています。さながら神様にでもなった気持ちになれます。

最後に

正しく統計を扱うには「因果の向き」ときちんと向き合う必要があります。そして、因果の向きを判断するには対象への深い理解が必要になります。対象への理解が浅いと間違った結論がポンっと出てきてしまいます。統計を扱うときは注意しなくてはいけませんね。難しい...

logo

たまおさ

釣りとか登山とか好きです。(@tamaki_osamu)