Election forecasts may create a false sense of security among some citizens about the odds of their side winning, which ultimately causes them not to vote because they feel it’s not necessary. | Eduardo Munoz Alvarez/AFP via Getty Images
選挙予測は、有権者に、支持する候補が当選する可能性について誤った安心感を抱かせる可能性があり、投票の必要がないと感じて投票に行かない結果を招くかもしれない
ジョー・バイデンの大統領選出馬が危ぶまれ、世論調査ではドナルド・トランプに大差をつけられていることが明らかになっていたにもかかわらず、選挙予測サイト538では依然としてバイデンが当選する可能性が高いと予測していた。それは奇妙なモデリング仮定に基づく結論であり、サイトの創設者であるネイト・シルバーは538モデルを「明らかに壊れている」と宣言し、同サイトの新しい責任者は、カマラ・ハリスの立候補に伴いモデルの調整を認めるに至った。
このエピソードは、ライバルの予測者同士の小競り合いというだけでなく、注目に値する。なぜなら、こうした予測にまったく価値がないことを明らかにしたからだ。
筆者は政治学者であり、予測のような機械学習法を政治問題に応用している。大統領選の予測にこれらのモデルが有効かどうかを知るには、データが十分ではない。さらに、入手可能なデータは、これらのモデルが投票率低下という悪影響を及ぼす可能性を示唆している。
世論調査のデータを集約し、各候補者の当選確率を推定する統計モデルへの人気が高まっている。その支持者たちは、11月に何が起こるかを偏りのない予測で示し、口先だけの政治評論家による場当たり的な予測に対する解毒剤になると主張している。もちろん、誰が当選するのかは誰もが知りたいところだ。
しかし、実際には、予測者の主張するほど正確ではなく、専門家による憶測がはるかに多い。
選挙予測は政治学において長い歴史があるが、2008年と2012年の選挙におけるシルバーによる正確な予測により、選挙予測が政治の主流となった。現在では、ニュース機関が確率的な予測を提供しており、それらのモデルを使用して、候補者が獲得する選挙人団の票数と当選の確率を予測している。
こうした確率計算は信頼できるだろうか? 現時点では、わからない。 ペンシルベニア大学のディーン・ノックス教授とダートマス大学のショーン・ウェストウッドと筆者が共同執筆した新しい論文では、予測者に非常に有利な仮定を置いても、答えを数十年、数世紀、あるいは数千年先まで知ることができないことを示している。
その理由を理解するため、予測評価の方法である「キャリブレーション」について考えてみよう。ある出来事が起こる確率の推定値が、その出来事が実際に起こる頻度と一致している場合、その予測はキャリブレーションされているとみなされる。つまり、あるモデルがハリス候補の当選確率を59パーセントと予測した場合、キャリブレーションされたモデルでは、100回の大統領選挙のうち59回は彼女(または他の候補者)が勝利すると予測することになる。
筆者たちの論文では、最良のシナリオにおいても、ある予測が別の予測よりもキャリブレーションが優れているかどうかを判断するには28年から2,588年かかることを示している。モデルが予測した候補者が実際に当選したかどうかという正確性に焦点を当てても、必要な時間を短縮することはできない。州レベルの結果に焦点を当てても、結果は高度に相関しているため、あまり役には立たない。
また、最良のケースを想定した場合でも、あるモデルが別のモデルよりも州レベルで優れているかどうかを判断するには、少なくとも56年かかる。場合によっては、4,000回以上の選挙に相当する期間が必要になる。
大統領選挙の予測評価にこれほど長い時間がかかる理由は明白だ。大統領選挙は4年に1度しか行われないからだ。現在は米国史上60回目の大統領選挙を迎えている。
大統領選挙の予測に利用できる情報を、株価予測、天気予報、オンライン広告のターゲット設定に利用される情報量と比較してみよう。これらの状況では、予測者は通常、ほぼ連続的に収集された数百万件の観測値を使用する。この違いを考慮すれば、他の状況における予測者が、より優れたパフォーマンスを発揮するモデルを簡単に特定できることは驚くことではない。
結果データの不足により、選挙予測者は統計モデルの構築方法について経験則に基づく推測をしなければならない。
世論調査情報を予測者がどのように使用しているかを考えてみよう。彼らはしばしば世論調査結果の移動平均を算出する。この平均を算出するため、予測者は世論調査会社に重み付けを行い、発生しそうな世論調査の誤差の種類について仮定を立て、さらに、その誤差が州間でどのように相関しているかについても仮定を立てる。あるいは、予測者が「ファンダメンタルズ」をどのように使用しているかを考えてみよう。ファンダメンタルズとは、経済状況、現在ホワイトハウスにいる政党、大統領の支持率などの要因だ。予測者は、モデルにどの要因を含めるか、また、モデルに適合させるためにどの大統領選挙が関連しているかを決定しなければならない。
結果データが不足しているため、これらの仮定は、予測者が妥当であると考えるものに基づいて行われる。つまり、過去のデータに基づくか、あるいは今回の選挙で一見役に立ちそうな予測を生み出すものに基づくか、どちらかである。いずれにしても、これらは予測者が行う選択である。
統計モデルは、予測者がこれらの仮定について明確にできる機会を提供する。一方、専門家による仮定は、明示されないか、または判断が難しいものとなる。しかし、仮定が較正や正確性にどのような影響を与えるかを評価するデータがなければ、一般市民は、ある予測者のモデリングの決定が他の予測者のモデリングの決定より優れているかどうかを知ることは不可能だ。
確率論的予測が正確であるという証拠はないが、予測が混乱を招き、有権者が投票所に行かなくなる可能性がある確かな証拠がある。
ニューヨーク大学のソロモン・メッシングとペンシルベニア大学のイプタハ・レルケス、そしてウェストウッドによる大規模な調査実験では、予測がアメリカ国民を深く混乱させていることが示されている。
彼らの実験では、モデル予測(例えば、勝利の確率が58パーセント、あるいは100分の58の確率)を目にすると、誤って候補者が58パーセントの得票率で当選すると考えることが分かった。実際、彼らは「候補者の当選確率を投票率と同一と推定する人が3分の1以上おり、両方のタイプの予測を見た後では、平均して人々は当選確率よりも投票率に近い確率を推定している」と書いている。
また、こうした選挙予測は、一部の有権者に「自分たちの側が勝つ可能性が高い」という誤った安心感を抱かせる可能性もある。その結果、有権者は「投票の必要はない」と感じ、最終的に投票に行かなくなる。
ウェストウッド、メッシング、レルケスは2回目の実験で、架空の選挙への参加を決める際に人々がどのような情報を利用するかを特定した。彼らは、参加者に確率で情報を提供した場合、参加者は非常に反応的になることを発見した。そして、自分たちの側が勝つ可能性が高いと示されると、投票に行く可能性は低くなることが分かった。しかし、同じ情報を得票率で示すと、参加率にはほとんど違いが見られなかった。
結論: 確率的な予測はしばしば誤解を招き、有権者が投票に行かなくなる可能性がある。
それでも、こうした予測が大統領選挙の結果を予測する最善の方法になる可能性は残されている。しかし、現時点では、こうしたモデルが特に正確であるかどうかはわからない。また、候補者が当選する確率のわずかな変動が、モデル化のエラーや無意味なランダムな変動以外の何かを表しているかどうかは、まったくわからない。■
ジャスティン・グリマーは、スタンフォード大学政治学部モリス・M・ドイル公共政策教授およびフーバー研究所上級研究員。
Don’t Trust the Election Forecasts
The data doesn’t support the obsession with presidential prognostications.
https://www.politico.com/news/magazine/2024/09/03/election-forecasts-data-00176905
コメント
コメントを投稿
コメントをどうぞ。