ウェブ解析をしていると、「個々の広告の直帰率は下がっているのに、なぜか全体の直帰率が上がっている」という不思議な現象に出会うことがあります。
たとえば、次のようなデータを見たとき、違和感を覚えませんか?
広告Aも広告Bも、2月の直帰率は1月より低くなっているのに、なぜか全体の直帰率(広告A+広告B)は2月の方が高くなっている ー これは一体どういうことなのでしょう?
GA4を日常的に使っているウェブ解析担当者の皆さんも、このような現象に遭遇する可能性があります。本記事では、この統計的な逆転現象「シンプソンのパラドックス」について、具体例を交えながら分かりやすく解説していきます。
シンプソンのパラドックスとは、「個々のグループのデータを合計すると、各グループでの傾向とは逆の結論が導かれる」という統計的な現象です。
今回のケースでは、
広告Aと広告B、それぞれの直帰率は2月の方が低い(改善している)
しかし、全体(広告A+広告B)の直帰率は2月の方が高くなってしまっている
この逆転現象は 入口回数の比率が変わったこと によって引き起こされています。
全体の直帰率は、各広告の 入口回数の割合 に影響を受けます。
このデータを見ると、2月は 直帰率の低い広告Aの割合が減り、直帰率の高い広告Bの割合が増えている ことが分かります。その結果、個々の広告では直帰率が下がっているのに、全体の直帰率が上がってしまうのです。
このような統計的な逆転現象が発生すると、データを単純に解釈すると誤った結論を導いてしまう可能性があります。そこで、次の点に注意しましょう。
個々のグループごとにデータを見る
直帰率やコンバージョン率を単純に合計するのではなく、セグメントごとに分析する
割合の変化を確認する
入口回数の比率が変わると、全体の傾向が変わることがある
ウェブ解析ツールのデータを慎重に解釈する
GA4では、セグメントやフィルターを活用して詳細な分析を行う
この現象に名前を付けたのは、イギリスの統計学者 エドワード・H・シンプソン(Edward H. Simpson) です。彼は1951年にこの統計的な逆転現象を論文で発表しました。
シンプソンのパラドックスは、医学、社会学、経済学などさまざまな分野で重要な役割を果たしており、特にビッグデータを扱うウェブ解析の世界でもよく見られます。
シンプソンのパラドックス は、個々のグループで見ると傾向があるのに、全体のデータでは逆の結果になる統計現象
入口回数の割合の変化 によって、全体の直帰率が逆転することがある
GA4などのウェブ解析ツールでは、細かいセグメント分析が重要
この現象を理解しておくことで、データの見方をより深め、正しい結論を導くことができます。データを解釈する際は、必ず個々のグループの傾向と全体の割合の変化を確認するようにしましょう!