MENU
まつよい
はじめまして!
文系・知識ゼロから分析を勉強して
WEBマーケティングリーダー、分析人材の育成を担当している「まつよい」と言います!

文系でも仕事に活かせる「データ分析の始め方」をわかりやすく解説していきます!
【Youtube始めました!】

【今さら聞けない】「因果」と「相関」って何? データ分析の際に気をつけるべき3つのポイントを解説

記事内に商品プロモーションを含む場合があります
数字が嫌い

因果と相関ってよく聞くけど、いまいち違いがわからないんだよね…

こんな方向けの記事です。

データ分析をしていると

上司

このデータは、相関や、因果関係はあるの?

こんな指摘を上司からもらうことがあります。

データ分析の初心者はもちろんですが、ある程度分析ができる人でも、相関と因果、実はよくわかってないんだよね…という方も多いのではないでしょうか。

まつよい

解説していきますので、相関と因果、しっかり覚えましょう!

目次

【今さら聞けない】「因果」と「相関」って何? データ分析の際に気をつけるべき3つのポイントを解説

「相関」はデータの関係性、「因果」は原因➡結果のつながり

「相関」はデータの関係性、「因果」は原因➡結果のつながり

相関と因果とはざっくりこんなかんじ。

  • 「相関」:2つの出来事の間になんらかの関係があること
  • 「因果」:2つの出来事が原因と結果でつながっている関係性

「Aのデータが増加するとBのデータも増加する(もしくは減る)傾向がある」ような、2つの出来事の間に何らかの関係性があることを相関関係があるといいいます。

そして、相関関係があるもののうち、一つの要素が「原因」で、もう一つの要素が「結果」となっている関係性のことを因果関係があるといいます。

まつよい

「相関」は「因果」の前提条件であるということを抑えておきましょう!

データ分析では、因果関係をもとに「Aを増やせばBが増えるはず」と施策をうっていくことが多いです。

しかし、相関関係だけで施策を打つのは危険です。

例えば、商品Aの売上が高い場合、Bの売上が高い場合でも、そこに因果関係がないと「たまたま」かもしれないからです。

A→Bの因果関係がないと、Aをもっと売ればBの売上も上がるかはわかりません。

まつよい

相関関係を見つけても、因果があるか確認することが必要です

「因果」と「相関」データ分析で気を付けるべき3つのポイント

気をつけるべきポイントは3つです。

  1. 「相関」があっても「因果」があるとは限らない
  2. 他の要因が紛れ込んでいる可能性がある
  3. 因果関係が特定しきれないものもある
まつよい

順番に解説していきます。

ポイント①:「相関」があっても「因果」があるとは限らない

ポイント①:「相関」があっても「因果」があるとは限らない

例えば、「地域の交番の数」と「地域の犯罪発生数」に相関関係がありそうだということが分かった場合

交番の数が多い地域は犯罪が多い! ➡ 交番の数を減らせば、犯罪件数が減るはず…!

まつよい

…とは、ならないですよね。

この場合は因果関係が逆で

犯罪発生数の多い地域 ➡ 交番の数を多くしているということになっているはずです。

データ分析で相関関係のある因子が見つかったとしても、原因➡結果の関係性になっているか、をしっかり確認する必要がります。

まつよい

原因➡結果につながるかをチェックしましょう!

ポイント②:他の要因が紛れ込んでいる可能性がある

ポイント②:他の要因が紛れ込んでいる可能性がある

例えば、「英語の成績が良い生徒は、数学の成績もよい」という例を見てみましょう。

一見正しそうにも見えますが、実は、「名門進学校の場合」という第3の因子があったとしたらどうでしょう。

まつよい

学力が高い生徒であれば、英語の成績も数学の成績もよい…というのが正しそうですね。

もう一つ、「冬には肉まんの売上が上がる」というのはどうでしょうか。

これも一見正しそうに見えますが

そもそも「肉まんは冬にしか陳列されていない」ということを考えると因果関係はなさそうです。

まつよい

アイスなんかは年中売っているので、「気温が上がるとアイスが売れる」は因果関係がありそうですね。

一見、因果関係がありそうな組み合わせでも、よく考えると「第3の因子」があり、実は因果関係がない…ということも多々あります。

他の理由がないかはしっかり考えましょう。

まつよい

人と話しながら考えると、「でもこれって●●ってこともない?」という意見がもらえたりするのでオススメです。

ポイント③:因果関係が特定しきれないものもある

ポイント③:因果関係が特定しきれないものもある

原因→結果の関係が因果でしたが、原因と結果の関係性がデータ上特定しきれないものもあります。

例えば「クレジットカードの利用が高い人」が「ポイントを利用率が高い」という場合と、
「ポイント利用率が高い人」はポイントを使いたいから「クレジットカードの利用率が高い」という場合のように、A→Bでも、B→Aでも成り立ちそうな場合があります。

この場合は手元のデータだけでは判断が難しいことが多いです。

経験上、この手の分析を踏まえて施策を構築しようとすると

上司

因果関係がわからないから、まずは因果の特定をしよう

…という上司が現れてしまい、特定しきれない因果の検証に時間が取られてしまう(割に成果に繋がらない)ので、筋が悪いです。

そうなった場合は、別路線で検討したほうが建設的ですのでこの罠に陥らないように注意が必要です。

まつよい

分析の目的はあくまで問題の改善。因果を研究したいわけではないのでドツボにハマらないよう注意が必要です!

相関と因果を使いこなして、データ分析に役立てよう

相関と因果を使いこなして、データ分析に役立てよう

難しく思われがちな相関と因果ですが、ポイントを押さえれば問題ありません。

データ分析においては、「まぁ、たしかにそうだよね、やってみようか」という納得感が非常に重要です。

相関関係だけでは「それって本当なの?」「因果があるのか?」、と議論が遠回りしてしまいますので
「相関関係」だけはなく、「因果関係」をしっかりと考えて施策に繋げて行ってください。

因果と相関をもっと詳しく学びたいならUdemyでの学習がおススメ

因果と相関をもっと詳しく学びたいならUdemyでの学習がおススメ

因果と相関について、もっと詳しく勉強したい場合は、オンライン動画サービスUdemy(ユーデミー)でのオンライン学習がオススメです。

スマホで通勤中などのスキマ時間に効率的に学習ができます。

詳しくはこちらの記事でも解説しています。

因果と相関について、詳しく解説しているオススメ講座はこちら。

引用:Udemy
価格2,400円(税込)
学習時間約1時間30分
講師mick @data analyst 様

データ分析の基本を動画で学ぶことができますので、更に詳しく知りたい方はこちらの講座がおススメです!

まつよい

時間も短く、価格も安めなので入門編としておススメです!
ぜひ基本を抑えて、自身のデータ分析に生かしていってください!

5/23までセール実施中!


参考になったらシェアをお願いします!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次