许多机构、媒体在研究美国选举时,为图省事,往往直接引用538的数据和预测结果。538的预测模型本身是个“黑盒”,并不开源,只给出预测结果,但不少机构仍然趋之若鹜。
然而,Blackstone全球金融主管River Tam近期发现,538的模型有着严重的问题,逻辑不通。
538的预测输入有三个部分。第一,是未调整的民调。第二,是调整后民调。第三,是基本面分析。
输入这三个部分后,会给出三个预测。一是选举当日的民调预测,二是不基于民调、纯粹基于基本面的预测,三是综合考虑民调和基本面的预测。
按理说,综合预测应该介于民调预测和基本面预测之间。但是,在实际应用中,538出现了严重问题。以威斯康星州为例,目前特朗普的民意调查平均领先+1.2。538预测选举日当日的民意调查领先优势将是特朗普+2.7。“仅基本面”模型认为拜登领先+0.1。但不知何故,“完整预测”是拜登+1.2获胜,优势比基本面和民调的都大。
还有另外四个州另有四个州(马萨诸塞州、俄亥俄州、南达科他州、西弗吉尼亚州)也出现了类似的结果。538给出的最后预测,拜登的优势比单独民调和单独基本面的优势都大。特朗普的优势比单独民调和单独基本面都小。
最后,通过插值拟合,如果将拜登的优势标记为负数,特朗普的优势标记为正数,我们可以用一个最简单的线性回归模型得到538的“最终预测” (MSE仅为0.000006):
因此,我们可以说,至少在上述五个州,538的预测严重偏向民主党。
River Tam认为538是纯粹的草台班子,胡乱预测。值得一提的是,他的雇主Blackstone今年倒向特朗普,首席执行官苏世民(Stephen Schwarzman)已向特朗普捐款,但River Tam本人是共和党温和派,并不支持特朗普。
笔者认为还有另外一种可能性。除去上述5个州外,538在其他45个州并未表现出“严重偏向民主党”。也许538掌握了什么玄机,认为这5个州相对民调和基本面可能还会出现左倾。
这五个州中,只有威斯康星州是摇摆州。威斯康星州在去年的选举中的确出现了严重左倾,自由派法官候选人珍妮特·普罗塔塞维茨(Janet Protasiewicz)以11个百分点的巨大优势击败保守派对手丹尼尔·凯利(Daniel Kelly),使该州最高法院15年来首次朝着进步的方向倾斜。因此,538不惜牺牲模型信度,也要暗中调整最后预测结果。