实验室文章:迈向冲突预测的新时代

实验室文章:迈向冲突预测的新时代

Journal Article , 2013

文章摘要

在冲突研究的领域中,虽然预测分析的重要性不言可喻,但是却一直没有受到足够的重视。我们认为,预测不仅具有实质公共政策参考的能力,另一方面也能用来检证既有理论模型、避免统计上过度配适(overfitting)且降低确认误差(confirmation bias),藉以建构出更可靠的冲突预测。在本篇文章中,我们回顾了学界在冲突预测研究中有哪些进展,发现由于这五十年来学科在资料搜集和运算能力的进步下,研究者得以从事过去所难以企及的预测研究工作,尤其在自动化的编码程序辅助下,快速的搜集数字化的新闻讯息成为可能,冲突研究得以应用以每日、每周、每月为单位的事件解析数据(disaggregated event data)来进行国家层次以下,有关政府与反抗团体的个体活动资料进行及时性的冲突预测工作。

为了呈现冲突研究在过去几年的重大进展,本文重新检视Fearon and Laitin (2003)这份奠定冲突研究基础的文献,从而比较和凸显预测分析在近几年的进展。结果发现,虽然Fearon and Laitin的研究中有很多的解释变量具有统计上的显著性,但是模型对于样本外事件的预测精确度却不高,这因为利用观察型的资料建构出具有统计上显著变量的模型,并无法回答像是何时、何处会发生内战这种决策者所关注的预测问题。

站在修正Fearon and Laitin的基础上,我们利用年度层次以下的事件时间解析数据来建构冲突预测模型,并且运用层级模型(hierarchical model)来追踪估计变量在不同国家属性群集中的变化。具体而言,我们利用CRISP事件数据库,建构从1997到2011以每个月为基础的冲突模型来预测UCDP数据库的内战发生事件。这里简要说明内文中两张图表来显示预测模型的效果。图一用分离图(separation plot)说明样本内及样本外模型的配适度,这两个图示说明在预测机率间离散的范围和程度,以及预测机率相应的真实事件的离散程度说明模型的配适度。另外,它依照所有国家年度的内战发生机率从左边最低到右边最高依序排列,在中间的黑色线条表示这个机率,那些实际发生内战的国家是红色,白色是那些没有发生内战的国家。在左边的红线表示负向的错误预测(false negative),但在右边白色表示正向的错误预测(false positive),一个高配适度的预测应该会有比较多的红色部分(事件发生)在图的右侧。这个图说明了:(1)有实际内战的事件是那些有比较高预测机率的,以及(2)如我们所料,样本外预测的配适度比样本内预测的配适度稍微差一些,不过仅管是样本外,模型与数据仍算相当的配适。

另外表五则呈现双元模型配适度的标准表现统计(假设以0.5为分割点)。样本外的配适度一样在所有个别的估计中都略逊于样本内的配适度,但除了低估实际内战的次数之外,仍然算是很不错的估计。样本内的表现则是相当精准的,所有具有最高预测机率事件都实际发生了内战,而拥有最低预测机率的国家则是没有发生任何的内战事件。

对于社会科学常见的批评指出,像是国际冲突这样的复杂社会现象是无法用任何方法进行预测的。但正因为政治冲突的内在理路十分复杂,我们更应该找寻背后的解释机制来试图对它进行解释与预测。我们在这篇文章中凸显了冲突模型对于了解不同国家背景下政治冲突的功用,内战的统计模型不论在样本内或是样本外都可以是高度精确的,而且在新数据不断涌现的世界,我们得以利用模型建构外的数据回头来检验预测模型的可靠性,这样的模型评估黄金法则对于学科统计方法上也有深远的贡献。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: