第二十八章定量方法

爱德华·D.曼斯菲尔德/乔恩·C.佩弗豪斯

过去半个世纪中，国际关系领域开展的定量研究的数量一直在大幅增长。因而本研究中所涵盖的问题领域范围也扩大了。虽然国际关系中的早期统计性研究主要集中于国际安全，尤其是战争的起因和后果，近来的研究探讨了范围相当广泛的一系列议题并很好地阐明了（也制造了）该领域争论最为激烈的议题。

本章的目的是为了对国际关系中的定量研究进行调查，追踪其发展并对该类文献做出的贡献进行评估。我们不会假装能对这类文献做出全面的调查，也不企望能对某些特定的统计技巧进行解释。相反，我们旨在对定量研究在国关领域的某些关键论争中的影响进行分析。

1 为什么要采用定量方法来研究国际关系？

研究者依靠统计技巧研究国际关系的一般性原因有许多（有关该问题参见，例如，Bueno de Mesquita 1985; Braumoeller and Sartori 2004）。第一，在对大量的观察进行分析时这些技巧特别有用。国际关系中的很多关键问题涉及对不同时间点的全球体系范围的比较；其他问题则涉及对横跨不同地区或国家的比较。结果是，国际关系中的经验研究需要对大的数据集进行分析。第二，学者们往往希望以一系列案例为基础对许多国际事务进行总结。通过对代表性样本以及可能性定律进行分析，统计研究有利于人们做出有关更多人口的推论。

第三，各种统计性技巧允许研究者对这一方向以及不同关系的力度进行评估。出于对理论测试的目的，理解某个理论明确指定的关键自变量是否与该因变量共变显然就非常重要了。定量技巧有助于研究者对这种共变的程度进行判断。这些技巧也有助于处理自变量与因变量之间因果关系的指向性，确保自变量对因变量任何可观察到的影响并不会真正来自因变量对自变量的影响。此外，这些技巧也可以对自变量对因变量影响的规模进行说明，这一问题非常重要但常常被人们忽视。第四，也是相关的一个方面，某些定量方法非常适合于对某个既定后果的相互竞争的解释进行测试。例如，多元模型使研究者能够对相互竞争的各理论所强调的元素的影响进行比较。这些模型还使研究者对可能与核心的自变量和因变量相关联的各种变量的影响进行解释，从而减少人们观察到它们之间的伪关联的可能性。

然而，除了这些优点和其他优点，定量方法也有一些人所共知的局限。批评人士们指责说统计模型中包括的变量有时候缺少内部或外部有效性。他们认为现有的对诸如政治权力、冲突、利益和偏好等某些中心概念的测量在最好的情况下也不过是大而化之，而在最坏的情况下则是失于谬误。其他人则坚称某些国关理论中的重要变量，如规范或理念等，是根本无法测量的，因而也不可能对这些理论进行定量测试。批评人士还指责说有时候国关领域的定量测试会违反某些关键的统计学主张，因而令人对这些测试的结果产生怀疑。最后，各类观察者仍然坚持有些定量研究并不具备坚实的国关理论基础，它们太专注于对各种变量是否彼此互联的确定而不够重视这种互联背后的原因。

逐渐地，研究者对很多这类批评越来越重视，试图改进测量技巧、开展敏感性分析并更好地将理论与统计学模型相联系。此外，研究者应该时刻对测量问题保持敏感，而这并不是仅与定量研究相关的问题。所有实证分析，不论是定量的还是定性的，都需要对概念和变量的操作和测量。定量研究的一个优点在于有关测量的判断往往尤其透明和可复制。如果某个学者不认可某个编码或测量方案，他或她都可以随时对该方案进行相应的复制和调整。

2 对冷战期间国际关系的定量研究

一直以来国际关系领域的定量研究特色受到各种趋势的影响。首先，该领域绝大部分的定量研究都集中于国际安全，这基本上是该学科专注于有关冷战问题而造成的结果。近来，定量研究涵盖的议题更加广泛，尤其是那些与国际政治经济和国际制度有关的议题。其次，很多最初的定量研究成果在其导向上都是系统性的：它们将国家作为单一行为体而对国内政治很少重视。这两种趋势在冷战末期开始改变，这一事件有助于拓宽人们一直采用定量研究技巧进行分析的问题的范围。

直到大约半个世纪前，有关国际关系的定量研究实际上是不存在的。这一点随着卡尔·多伊奇（Karl Deutsch）有关一体化和其他议题的开拓性研究（例如Deutsch et al. 1957）以及 J. 戴维·辛格（J. David Singer）战争相关性项目（COW）的出台发生了改变。后者的研究始于20世纪60年代早期。从那时起，它已经促成了数百项有关国际关系的定量研究。在该项目出台最初的几十年中，它依靠相对简单的二元和多元技巧来揭示战争中的模式以及国际安全中的其他方面。在其他地方有对该项目及其对国际关系研究贡献的详细记录，因此我们在此不探讨这些问题（Vasquez 1987; Singer 1990）。然而，我们还是有必要记住本章所涉及的多项研究都依赖该战争相关性项目带来的数据。

该研究项目大多专注于对来自国际关系现实主义理论中的假设进行验证（有关现实主义理论，见Waltz 1979; Jervis 1999）。出于保持这一对现实主义的专注，冷战期间的定量研究在其导向上大体是系统性的而且倾向于将国家视为单一行为体。[129]在这类成果中，有关军备竞赛分析的影响力特别大。的确，有一项国关领域开拓性的定量研究对军备竞赛与战争的关联进行了研究。在《致命争吵的统计学》一书中，刘易斯·理查森（Lewis Richardson 1960），一位受过专门训练的气象学家，试图对各国开展失控的军备竞赛的环境以及各国因厌倦这种竞争而促成和平解决方案的条件进行建模。由于受到冷战军备竞赛步伐加快和程度加剧的刺激，学者们开展了数量可观的统计学研究，他们采用了理查森的基本模型对军费开支以及各大国之间更为一般性的冲突和合作模式进行了调查（Goldstein and Freeman 1990）。

很多系统性理论认为全球后果模式受到了国际体系的塑造而该结构的变异因应全球权力分配的变化而发生。在部分意义上，由于肯尼思·沃尔兹（1979）的研究很有影响，定量研究者常常依据极——一个（霸权性的或单极的）、两个（两极的）或多个（多极的）特别强大的国家是否存在——来衡量全球的权力分配。有关该问题的相当大部分的定量研究集中于解决由来已久的有关极是否会影响国际战争的爆发的论争。然而，定量研究无论在这一关系的力度方面还是本质方面都没有达成共识（Levy 1984; Hopf 1991; Mansfield 1994）。在某种程度上，这些分歧来自人们对极的定义和衡量，说明了为什么重视实证结果对关键变量的衡量和操作是否敏感特别重要。

不过，极并非该体系结构的唯一维度。另外一个维度在于体系内权力的集中度，它取决于主要大国的数量以及这些国家之间权力的相对不平等（Singer, Bremer, and Stuckey 1972）。专注于集权而不是极具有很多优点（Mansfield 1994），人们为了对集权与战争爆发之间关系进行评估做出了各种努力。在对此类文献的一篇综述中，兰多夫·西沃森（Randolph Siverson）和迈克尔·沙利文（Michael Sullivan）暗示低程度的集权（即更为统一的权力分配）与更多的冲突有关。最近，爱德华·曼斯菲尔德（Edward Mansfield 1994）发现这一关系呈现一个倒置的U形：在集权的低端和高端大国战争发生的概率最低。在集权的中端此类战争发生的频率最高。

除了该体系的结构之外，现实主义理论还极其重视政治军事联盟。众多冷战时代的定量研究都试图将联盟的创建、运行、凝聚力以及解体与国家间冲突相关联。在一篇早期的此类研究中，J. 戴维·辛格及麦尔文·斯莫尔（Melvin Small 1968）做出论断，指出联盟与战争之间的关系以所分析的时间阶段为条件——联盟数量的增加与19世纪的和平相关，而与20世纪的战争相关。其后西沃森和沙利文（1983）在研究中发现联盟对战争的影响取决于其焦点在主要大国身上还是少数大国身上。在战争相关性项目所做的研究综述中，约翰·瓦斯克斯（John Vasquez 1987）认为联盟看似与战争有关，但二者不存在因果关系。有关该议题的最新一轮定量研究因各自探讨的联盟类型的不同而各具特色。例如，布雷特·阿什利·利兹（Brett Ashley Leeds 2003）指出联盟协议是否规定为各成员国提供防卫、提升某个进攻性成员国的进攻能力或在敌对事件发生时保障中立，对于它阻止还是鼓动进攻具有影响。防务公约倾向于约束冲突而进攻性或中立条约倾向于穷兵黩武。

尽管该综述无意穷尽所有，它确实暗示了早期定量研究成果的某些特征：接受单一行为体主张、重视结构性理论并专注于安全问题。此外，在每一个此类研究领域中，最初的结果都导致了相当多的论争。这些分歧促使研究者对曾采用过的测量和测试进行改良并专注于某个理论得以立足的特定条件。这样，定量分析就推动了该领域的各理论论争。

2.1 国际政治经济学

在冷战期间很多定量研究对安全问题进行探讨的同时，少数研究开始对国际政治经济学的系统理论进行分析。部分成果集中于对霸权稳定理论进行验证，该理论认为19世纪大部分时间以及第二次世界大战后相对自由的国际经济有助于英国在前期、美国在后期所拥有的权力优势（Kindleberger 1973; Gilpin 1987）。为了验证这一理论，人们开展了大量的统计学研究，但其结果一向千差万别。例如，约翰·科尼比尔（John Conybeare 1983）对国际权力分配与1902年和1971年因为众多的经济、政治和军事因素而管控的制造业商品名义关税水平之间的关系进行了评估。他发现没多少证据能够证明权力关系对国家关税水平具有影响，因而断定霸权稳定理论并未对贸易政策做出恰当的解释。相似的是，蒂莫西·麦基翁（Timothy McKeown1991）对与霸权有关的变量与1880年至1989年期间一系列先进工业国家进口与国民收入的比率之间的关系进行了时间序列分析。以多个变量对权力的分配进行测量后，麦基翁发现这些测量对进口与国民收入的比率的影响着实有限，这使他与科尼比尔一样对霸权稳定理论的阐释力持有怀疑。

然而，其他一些研究找到了对霸权会影响全球贸易体系这一观点更多的支持。例如，罗伯特·帕雷（Robert Pahre 1999）提出了仁慈和恶性霸权时期之分。他发现一般来说霸权对国际政治经济具有恶性的影响。此外，拥有更多敌人而不是朋友的霸权倾向于仁慈，但恶性霸权能引发国际体系中其他国家的合作行为。

最后，曼斯菲尔德（1994）分析了霸权以及全球贸易层面能力集中的影响，视其为1850年至1965年间全球生产的一部分。他发现霸权是否能够促进全球贸易极其依赖于人们对霸权的定义和衡量。此外，能力的集中和全球贸易之间存在一种U形的关系。当能力集中水平相对较高和相对较低时全球贸易与全球生产之比是最高的，而当集中处于中等水平时这一比率是最低的。除了对霸权的影响进行分析外，有关冷战期间国际政治经济学及其直接后果的定量研究也专注于国家安全的政治经济学。有一部分研究对政治军事联盟对贸易模式的影响进行了探讨。联盟对贸易的影响当中，处于中心位置的是来自海外商务的效率增益，它增加了每个贸易伙伴的国民收入并能够被用于提升每个国家的军事力量。乔安尼·戈瓦（Joanne Gowa 1994）认为各国能够通过更加自由地与自己的盟友而不是（事实上的或潜在的）对手进行贸易来处理对外贸易的安全影响。为了对这些主张进行检验，戈瓦和曼斯菲尔德（1993; Gowa 1994）对联盟对于20世纪期间各大国之间贸易流量的影响进行了统计学分析。他们发现有强有力的证据证明盟友的贸易范围要比其他国家广泛。随后的大量研究基本上确认了这一研究结果，这些研究涵盖了更多国家也跨越了更多年份，而且采用的是为横断面的和时间序列的数据而设计的统计学技巧（Morrow, Siverson, and Tabares 1998; 1999; Gowa and Mansfield 2004）。

有一部分相关研究专注于政治军事冲突对贸易的影响。其中一系列研究专注于政治合作和冲突对双边贸易流量的影响。在两篇颇有影响力的文章中，布莱恩·波林斯（Brian Pollins 1989a；1989b）发现合作性政治关系大大增加了贸易的流动。另外一系列的研究考量了政治军事冲突对贸易的影响。有些研究发现战争使全球性的以及各参战国之间的贸易大大减少（Gowa 1994; Mansfield 1994）。然而，其他一些研究断定包括战争和其他一些低烈度政治冲突在内的冲突对贸易伙伴的影响很小，因为各贸易方可能会预料到冲突并相应地对其海外业务关系进行调整（Morrow, Siverson, and Tabares 1998; 1999）。

3 对20世纪90年代中期以来国际关系的定量研究

自20世纪90年代中期以来，定量国际关系研究中发生了大量的急剧变化。第一，它们变得更具渗透性。例如，近来的一项调查发现权威国际关系期刊中依赖统计学分析的论文比率从20世纪70年代末的大约25%增加到了20世纪90年代末的大约45%（Sprinz and Wolinsky-Nahmias2004, 7）。第二，这一研究变得越来越复杂，涉及种类更多的研究技巧。

虽然早些时候的研究非常依赖于单纯的二元相关或普通的最小二乘回归模型，近来的研究已经开始利用过去几十年中统计学分析中的许多创新。

第三，很多当代研究所涵盖的实质性话题范围比以前大得多。与主要专注于对系统理论的验证不同，很多最近的定量研究对国内政治对国际关系的影响进行了分析。此外，专注于系统理论的当代统计学研究往往被用于对新自由主义的乃至建构主义的方法而不是现实主义理论进行检验。第四，也是与此密切相关的一点：最近的很多定量研究涵盖了包括经济制裁、货币政策、人权和环境政治在内的种类繁多的问题领域，而这些领域在冷战期间的统计学研究中受到的重视很少。过去十年左右时间中国际关系领域定量研究的快速增加做何解释呢？我们臆测有若干力量在发挥作用。人们对于在博士项目中开展定量方法培训越来越重视、其他政治科学子学科（比如美国政治学和政治经济学）中定量研究的总数不断攀升、计算成本下降的同时对更加复杂的模型进行评估的计算能力的提升以及更加便捷可用的数据集（尤其是通过互联网可获取的）等，这些方面都有助于定量研究在该领域的扩散。

不仅定量研究的总数量得到了扩展，而且研究方法的类别也得到了扩展。这一发展的动因非常多。首先，相关领域，尤其在经济学和社会学领域，取得了重大进步，其中包括：时间序列建模和持续期模型的改进；小概率事件、同步关系、内生性和非随机选择分析；以及对时间序列兼横断面数据的分析等。次，冷战结束后不久国际关系领域经历一次重大的理论转变，人们对现实主义和新现实主义模型不再那么重视了。当然，人们并未抛弃现实主义。按照这一理论传统所开展的研究仍有很多，按照其他传统开展的很多统计学研究对现实主义者强调的变量进行了非常慎重的阐释。不过，冷战的结束使很多观察者质疑现实主义是否是最适于观察国际关系的理论透镜。

研究者们开始越来越多地转而采用其他研究方法。在系统理论中，建构主义的兴起以及人们对新自由制度主义凸显的兴趣一直是当今时代的标志。[130]在其他方法中，有关国内政治和国际关系成果的快速增长一直是这一时代的标志（Milner 1997）。此外，尽管国关领域的研究——定量的和定性的研究——在冷战期间大致集中于国际安全，这一时期的结束促使人们对国际政治经济学、国际制度以及各种其他实质问题产生了越来越大的兴趣。这些发展对于该领域的统计学研究已经产生了重大的影响。

3.1 自由和平论

冷战后不断变换的理论潮流导致了兼具横断面性和时间序列性的各种数据集的出现。通常情况下，横断面单位是国家（一种“一元的”研究设计）或成对的国家（一种“二元的”设计）。几乎在所有情况下，国际关系学者们感兴趣问题的数据报告每年更新一次，这样，时间单位一般是年份。例如，我们可以考虑一下那些有关民主和平论的研究成果，我们会发现它们的数量浩如烟海。20世纪80年代末期，学者们对民主国家之间的关系尤其具有合作性尤其和平（Doyle 1986）这一主张表现出了越来越大的兴趣。的确，以至杰克·列维（Jack Levy 1989）将民主国家很少甚至从不会彼此开战这一观点作为国关领域所拥有的最接近于规律的东西。虽然此前有过零星的针对该主张的验证，20世纪90年代以及21世纪初才涌现出了数量巨大的有关该议题的研究，而其中绝大部分都是统计学方面的（例如，Russett 1993; Russett and Oneal 2001）。

往往有关民主和平论的定量研究都依赖于一种二元研究设计。数据的编制依据的是成对的国家在尽可能长的时期内的情况，通常这一时期指二战后这一时代，不过（取决于可获得的数据）有时指整个19世纪和整个20世纪。这些研究中的因变量是冲突的爆发，人们通常将其定义为国家间的军事化冲突（Jones, Bremer, and Singer 1996），但有时也将其定义为战争。

20世纪90年代期间，人们对民主和平论的兴趣逐渐增加。例如，布鲁斯·拉西特（Bruce Russett）和约翰·奥尼尔（John Oneal 2001）对更具普遍性的自由和平论是否存在进行了分析。借用伊曼努尔·康德（Immanuel Kant）和其他人长期以来的观点，他们假设民主、高层次的经济互相依赖与对国际组织的参与形成合力，阻止国家间的冲突。这些发展造就了很多传统模型，在这些模型中关键的自变量并不仅是政权类别，而且还有每个二分体（通常因其国民收入得以正常化以构建对互相依赖的测量）中各国之间的贸易流量以及它们在政府间组织的参与程度（Russett and Oneal 2001; Pavehouse and Russett 2006）。

最初的统计学研究为民主和平论以及更具普遍性的自由和平论提供了相当大的支持，不过这些研究也引发了各种批评。有些观察家质疑民主和平论是否纯属偶然（Spiro 1994），而其他人则指责说民主的影响出自各民主国家针对国际事务共有的相似兴趣和偏好（Gartzke 1998;Gowa 1999）。还有人对用于验证自由和平论的统计学技巧发起了挑战。对于这些数据集中的时间依赖性（Beck, Katz, and Tucker 1998）、来自某个特定国家或二分体所特有的历史文化因素的数据中可能具有未观测到的异质性这一事实（Green, Kim, and Yoon 1998）或国家间冲突是一种小概率事件（King and Zeng 2001）这一事实，人们应该如何处理呢？虽然绝大多数研究都确认民主二分体比其他两个国家之间开战的可能性要小，但这些担心促使研究者采用很多不同的技巧并对自由和平论的某些方面产生疑问。[131]

与自由和平论有关的一个关键问题是国际贸易是否对政治军事冲突的爆发具有影响。大部分现有证据都表明日益增强的互相依赖会阻止冲突的发生（Russett and Oneal 2001），这一结果与商业自由主义者提出的观点是相符的。绝大部分这类研究都使用国际贸易与国民收入的比率作为对互相依赖衡量的手段。然而，大量采用其他的互相依赖衡量手段的研究对这一自由主义立场（例如 Barbieri 2005）都没找到多少支撑。同样地，尽管绝大部分有关该议题的研究都视互相依赖为外生物，有些近来的研究却认为它是内生物。当人们以这种方式对待互相依赖时，它反而与冲突有关的证据就脆弱得多了（Keshk, Pollins, and Reuveny 2004）。

从部分意义上，由于这些发现模棱两可，有些学者对日益增强的互相依赖阻止敌对的特定条件进行了研究。例如，曼斯菲尔德和佩弗豪斯（2000）认为只有当贸易伙伴属于相同的优惠贸易安排，广泛的贸易关系才能抑制冲突。约瑟夫·格里科（Joseph Grieco）和克里斯托弗·格尔皮（Christopher Gelpi 2003）声称这一关系受到了有关国家政权类型的影响：由于对于私人贸易商施加的政治压力，民主政府比其他政府更为敏感，民主国家所感受到的增强贸易所具有的和平影响力比非民主国家更为强烈。这样，互相依赖的影响可能比之前的理论研究或实证研究所暗示的更加复杂。

在有关美国动用武力的定量研究成果中也有对于国内政治和国际安全之间关联的研究。此类成果出现于冷战时期的后半段（Ostrom and Job 1986），而这一研究大部分于近期展开而且集中于国内进程对美国总统动武动机的影响。正如此处所回顾的每个领域的成果一样，其中出现了很多分歧和断裂。最初此类成果的作者暗示国内经济情况直接塑造了领导人卷入冲突的动机（Ostrom and Job 1986）。不过，近来有些作者提出国内环境仅对人们对威胁的看法具有影响，而其他人则声称国内因素在该进程中不起作用（Gowa 1998）。此外，关于特定国内制度，比如国会等，是否会直接影响武力使用倾向（Howell and Pevehouse 2005），人们进行了许多辩论。有关方法论的辩论也接踵而来，其中有人暗示现有模型苦于对因变量的挑选（Meernik 1994）而且对于时间序列动态不够重视（Mitchell and Moore 2002）。

在所有这些更为新颖的研究领域，有关测量、边界条件和评估技巧的论争都有其理论和实证影响。实质上，这些论争更多的是关于某个理论会做出怎样的预测、人们期待该理论能够立足的条件以及互相竞争的理论是否提出了有关证据的令人信服的解释。尽管将这些成果中的论争视为本质上完全是统计学意义上的论争也许很容易，它们对于我们如何依据证据对理论进行重构非常关键，我们在结论部分会再探讨这一问题。

3.2 国内政治、国际制度和国际政治经济学

人们对于国内政治如何影响国际事务的兴趣从未局限于国际安全研究。相反的，有关国内因素对贸易和货币关系、外国直接投资（FDI）、外国援助和经济制裁的影响的定量研究成果正蓬勃而出。例如，威廉·伯恩哈德（William Bernhard）和戴维·莱布隆格（David Leblang）对国内政治与市场行为的关系进行了研究，他们尤其重视民主竞争对货币、债券及产权投资市场变化的推动以及这种变化如何对民主政治家保住其职位能力的影响。同样的，也有相当多的定量研究对党派、政府中“否决点”的数量、国家的政权类型以及其他国内政治因素对对外贸易关系（Lohmannand O'Halloran 1994; Mansfield, Milner, and Rosendorff 2000; 2002; Milner and Judkins 2004; Henisz and Mansfield 2006）的影响进行了分析。此外，近来的统计学研究也对国内政治对外国直接投资的影响进行了探讨。例如，李全（Quan Li）和亚当·雷斯尼可（Adam Resnick 2003）发现民主对发展中国家的外国直接投资具有混合影响。强有力的产权会促进外国直接投资，而在民主国家这些权利要比其他国家更强大。不过，民主的直接影响是不同的：在产权力度不变的情况下，20世纪最后几十年中民主国家收到的外国直接投资要少于其他国家。相反地，基于对大致同一时期内的发达国家和发展中国家的分析，内森·詹森（NathanJensen 2006）却发现民主国家吸引的外国直接投资多于其他国家。更多的有关国内制度与对外直接投资关联的定量研究或可改进这些发现并明确这些实证关系能够立足的条件。

有关对外经济关系的国内政治的定量研究还专注于制裁。丽莎·马丁（Lisa Martin 2000, ch.4）考察了党派之争对施加制裁决定的影响。她发现，在美国，如果政府是“一体的”（也就是说，如果同一个政党同时控制了行政和立法部门），其行政部门往往率先发动制裁，而如果政府是“分裂的”（也就是说，这些部门为不同的政党所控制），国会则会率先发动制裁。

许多其他有关经济制裁的定量研究考量了非随机选择的影响，这一问题已经引起了整个国关领域的注意。在其中一项研究中，T. 克里弗顿·摩根（T. Clifton Morgan）和瓦莱丽·施韦巴赫（Valerie Schwebach 1997）对发起制裁国未采用武力而促使目标国改变其政策的条件进行了审视。他们采用了加利·赫夫鲍尔（Gary Hufbauer）、杰弗里·肖特（Jeffrey Schott）以及金伯利·安·埃利奥特（Kimberly Ann Elliott 1990）有关制裁的数据对自己的观点进行了检验，但他们意识到，如果对某些国家是否会卷入制裁有影响的相同因素对制裁的结果也具有影响，单纯地依赖这些数据可能会造成选择偏差。为此，他们用一系列国家间危机对有关制裁数据进行了补充，在这些危机中这些国家并未被强加制裁。摩根和施韦巴赫发现对于这类冲突制裁既没有重大的统计学影响也没有大的实质性影响，而且制裁对于哪些危机会升级为战争也没有影响。

在一项相关研究中，丹尼尔·德泽尔（Daniel Drezner 2000）认为，很多观察家都没有认识到制裁的有益之处，原因就在于选择偏差。德泽尔声称，最成功的制裁是那些发出了制裁威胁但从未实施的制裁，因为制裁使发起国和目标国都要付出成本。德泽尔利用统计学方法说明当制裁威胁发出后大量的制裁企图在制裁实施之前就结束了，因为这些行动的目标顺从了发起国的要求。同样地，目标国方面做出妥协的案例比制裁被切实实施的案例要多，这证明其中存在一种研究者们需要特别当心的选择效应。

选择效应绝不限于经济制裁。例如，詹姆斯·弗里兰（James Vreeland 2003）对国际货币基金组织（IMF）的项目是否成功地促进了增长进行了剖析，这一议题相当重要而且一直众说纷纭。他认为现有的有关该议题的实证研究颇有瑕疵，因为它们既没有说明促使各政府与国际货币基金组织达成协议的因素，也没有说明这些协议随后对增长的影响。弗里兰建立了一个模型来阐释非随机选择并用它对国际货币基金组织协议的影响进行评估。他发现当外汇储备薄弱时，政府会求助于国际货币基金组织，但它们也是为了抵消国内对改革计划的反对。此外，弗里兰还发现，对驱使各国求助该基金的条件进行控制后，国际货币基金组织的项目会使经济增长减缓而且参与这些项目也会加剧各国内部的收入不平等。过去十年中，非随机选择问题在国际政治经济学领域之外也引起了人们越来越多的注意。例如，对于国际安全的研究开始强调冲突的爆发与冲突的加剧之间的区别。此外，学者们承认某些相同因素可能对二者的结果都会产生影响，从而形成潜在偏差的一个源头。为了解决这一问题，威廉·雷德（William Reed 2000）、保罗·胡思（Paul Huth）和托德·阿利（Todd Allee 2003）等曾经采用过一些选择模型，用以说明对国家是否会卷入某个争端具有影响的因素，可能对于这些争端是否会加剧也具有影响。在某些情况下，如果对这两个冲突的阶段单独建模而采用一个统一的选择模型对这两个阶段进行分析，有关变量的影响会发生变化。例如，雷德（2000，88）发现，在一方控制其对冲突爆发的影响之前，政权类型对敌对的升级具有重大的统计学意义上的影响。这一研究途径有助于人们提出一个更广义的方法论观点，这一观点与人们需要对国际关系领域中的选择进程进行说明有关。[132]

最近，研究者们对国际条约的形成和实施中是否存在选择效应进行了剖析。在有关遵守国际制度（Downs, Rocke, and Barsoom 1996）的研究成果中理论论争的鼓舞下，很多学者开始研究选择加入国际条约的国家是否因为打算遵守那些条约才加入。如果是的话，这些条约对于遵守条约或国家行为的其他方面的独立影响可能很小。在近来的一项定量研究中，亚娜·冯·斯坦（Jana von Stein 2005）发现加入国际货币基金组织条约的国家都有意向采取符合这些条约的措施。在她看来，这一证据暗示国际制度有助于将“守约”型国家与“违规”型国家相区分。如此，加入某个国际制度有助于某个国家表达其遵守自己海外承诺的意愿。[133]

更笼统一点讲，关于国际制度是否是内生的，国关领域内一直有很多争论。人们可以使用各种众所周知的统计学技巧（包括工具变量回归和其他相关的两阶段估值）对制度是否确实是内生的进行探究，如果是的话，在评估制度对国际关系的影响时就将制度建模为内生性的。这一部分所讨论的方法论方面的担心不仅仅是对统计学上细微差别的担忧。事实上，它们对于该领域的理论之争至关重要，反映出人们关心理论到底能做出什么预测以及如何对那些预测进行充分的验证。

4 结语

在本章，我们回顾了一些国关领域正在快速出现的运用定量研究技巧的文献。关于对这些方法的使用，我们做出三点观察。第一点，正如漫不经心的观察者也能明显观察到的，如今定量分析在该领域越来越普遍。对于统计学技巧的使用始于冷战期间，不过因应超级大国敌对的终结而来的是定量研究数量和这一研究所专注议题的急剧增加。看起来这两种趋势都可能会持续下去。

第二点，继该学科中统计学方法的崛起以及冷战的终结之后，研究者对国内政治和国际制度塑造全球后果的作用越来越感兴趣。而且，定量分析所涉及的问题范畴持续扩大。例如，近来有关国际安全的定量研究相当重视国家失败（Goldstone et al. 2002）、内战和种族灭绝（Valentino,Huth, and Balch-Lindsay 2004; Doyle and Sambanis 2006）、人权（Poe andTate 1994; Poe, Tate, and Keith 1999; Hafner-Burton and Tsutsui 2005）以及环境（Midlarsky 1998; Neumayer 2002）。

第三点，也是最重要的一点，虽然有些人继续将定量方法指责为非理论的，国际关系领域的统计学研究还是提升了我们的实证认识并推动了理论边界的设定。没有大样本研究所带来的知识，当前有关自由主义、新古典现实主义或人类安全的理论化是很难想象的。定量研究并非仅仅对理论所假定关系的先入之见进行确认，它们在帮助人们厘清各种关系得以立足的条件的同时还为我们带来了新的见解。

定量研究的兴起已经对国关领域产生了重大影响。有些定量分析的批评人士将自相矛盾的发现、衡量问题以及操作化问题指斥为统计学方法的缺点。不过，尽管实证研究（定量的或定性的）必须以理论为指导，有关衡量、操作化和方法的论争迫使学者们对理论加以考量。确切地说，某个既定理论能做出什么预测呢？哪些变量对该理论的预测至关重要呢？人们预测的关系是无条件的还是有条件的呢？好的理论能够指导好的实证分析，但理论的更新和细化需要好的实证分析。定量技巧是强大而有价值的实证分析工具，而国关领域是人们运用这些技巧的富饶之地。

参考文献

第二十八章 定量方法

第二十八章定量方法