二、关于“杀一儆百”的实证根据

关于“杀一”能否“儆百”,即死刑是否有最大的遏制力,绝不仅仅是个理论论证问题。近年来,随着计量经济学、统计学等学科的发展,人们逐渐抛开抽象空洞的理性思辨,将注意力集中到有关死刑遏制力的实证研究上。这便使得有关死刑遏制力的争辩,不仅在思想观念层面上出现对垒,而且在科学实证的层面上展开交锋。

(一)实证研究方法

对死刑遏制力的经验性研究,由于正反双方采取的不同方法、材料等而显现出不同的结果。其中,方法的差异尤为突出。即使是就同一材料,由于双方切入的视角、取样的范围及分析的范式的变化,也完全可能得到迥异的结论。

总的来说,主要的研究方法有两种。一种是横向的研究,或者称为跨地域的比较研究。它是对两个或多个不同地域在同一时间上的比较,当然比较的范围和目标是围绕死刑的遏制力。这样的方法又可具体细分为以下三种操作策略:第一,针对废除了死刑或根本就不曾存在死刑的国家(或地区)与保留死刑的国家(或地区),进行犯罪率的比较。第二,针对特定时期死刑执行率高的国家(或地区)与死刑执行率低的国家(或地区),进行犯罪率的比较。第三,针对因定死罪而被处决的可能性大的国家(或地区)与被处决的可能性小的国家(或地区),进行犯罪率的比较。应当说,第一种策略是对死刑方法的威慑力的研究,而第二、三种策略则是对死刑执行的威慑力的研究。

跨地区比较研究,因天性脆弱,受到了激烈的批评。因为,不同国家或地区具有不同的情势和特点,此种差异性的数量和规模甚至可以无穷大。而且,客观地讲,犯罪率升降的影响因子也非常之多,除了刑罚本身的影响之外,风土、人情、德性甚至地形、气候无不会对犯罪率施加影响。因此,很难分辨不同国家犯罪率的差异,到底是因为死刑存废因素的影响所致,还是其他因素使然。换言之,人们很难把死刑对犯罪率的可能影响,从其他因子施加的可能影响之中分离出来。当然,地域交叉研究中选择的区域,很可能是临近的、社会情势相近的法域。但是,尽管这样可以减少误差的几率和程度,但仍然无法根本解决上述的弊病,因为毕竟无法找到两个社会情况完全相似的法域。

另一种是纵向研究。基于横向研究的不足,另一种研究方法即纵向研究应运而生。纵向研究是对同一区域不同时间序列的研究。与横向研究一样,纵向的研究也可以分别就立法与执行两个方面展开:立法上的研究,通常是研究同一法域在废除或恢复死刑前后的犯罪率变化,而执行上的研究,则是就同一区域在死刑实际执行前后的犯罪率进行比较。应该看到,纵向研究较好地克服了横向研究在效度和信度上的不足,使死刑的存废与实际犯罪率之间的客观联系明显地凸显出来,有效地隔离和过滤了其他因素的可能影响,因而较之横向研究更具有优越性,也为更多的学者所采用。同时,为了加强和巩固结论的可靠性,学者们还经常增加考察的样本,对多个国家或地域进行纵向研究,以便相互对照和印证。

(二)实证研究成果

围绕死刑是否具备最大的威慑力,学者们付诸了异常艰辛的努力,但得出的结论却五花八门。下面我们根据实证研究的进程和研究主体的变换,进行一个简单地梳理。应该交待的是,之所以没有按照研究的结论予以简单分类,是因为那样做虽然在逻辑上明快简洁,但却无法呈现方法与观点之间的批判与反驳,更无法反映整个实证研究本身的发展与演进历程。

1.兰托尔的研究

早在19世纪30年代,美国马萨诸塞州的一位名叫小罗伯特·兰托尔的立法者,便开始了对死刑遏制力的实证研究。兰托尔在各种集会上展示了他所收集的关于死刑遏制力的证据资料,并受到公众和学界的一致注目。兰托尔考察了许多欧洲国家犯罪率的长期趋势,并发现,正好与遏制理论预言相反,死刑处决与定罪之间的比例较低的国家,其杀人率稳步下降。兰托尔还进行了短期的抽样,并发现,随着大量处决的时期来临,杀人的发生率却稳步上升。兰托尔的研究,由于其覆盖面广且长、短期样本俱全,因而显得极为周到和精致,在死刑遏制研究史上树立了一块里程碑。有关兰托尔成果的具体研究和讨论,可参见Bowers and Pierce:“Deterrence or Brutalization:what is the Effect of Execution? ”, 26 Crime and Delinq., 1980. p. 453。

2.赛林的研究

在20世纪初美国第二次“改革”的时代里,社会科学家开始表现出对死刑遏制力的浓厚兴趣。在为期50年的时间里,社会科学家对死刑进行了详尽的研究,但这些研究主要还集中在思辨层面。赛林对这50年的研究动向予以了清理,特别是就这些社会科学家零星片断的经验研究进行了归纳。最后,赛林得出了这样一个结论:“死刑在法律上或实践中的存在,不影响杀人致死的比率。”T.Seller,“Capital Punishment”, 25 Fed. Probation, Sept. 1967, p. 138.

3.恩利克的研究

20世纪70年代,一些学者开始强烈怀疑“死刑不具有遏制力”的最新结论,并对前50年的经验研究重新进行深刻的反省。他们的批评主要集中在以下三个方面:其一,总的杀人率并非敏感到足以获得遏制效果;其二,使用相邻法域或前后比较的方法,是一种不完全对照的方法,这一方法很可能掩盖了影响遏制作用的所有其他因素;其三,人们的反映没有被纳入研究者的考虑范围。人们可能对死刑法律的出现或废除完全没有反应,即使这种变化截然不同于其他临近的区域。

正是以上的批评,促成了新的研究方法的诞生。其中,最为重要的方法是多重回归统计法。这一方法试图在杀人率的任何可观察的变化中,筛选和断定哪些可归因于死刑的存在和实际执行,哪些不归因于此,而是归因于诸如年龄结构、社区变化等其他非死刑的因素。恩利克率先采用了多重回归统计法来研究死刑的遏制力。通过使用美国从1933年到1970年的杀人资料的统计,恩利克分析了处决的概率对于杀人率的作用。恩利克还对照了大量其他因素,包括失业、年龄分布以及人均收入等等。奠基于这一分析之上,恩利克得出结论说,处决犯人确实有某种遏制作用,具体地说,是每起处决遏制了7—8起杀人。Ehrlich,“The Deterrent Effect of Capital Punishment: A Question of Life and Death”, 65 Am. Econ. Rev., 1975, p. 397.恩利克的研究,是支持死刑具有遏制力的为数不多的成果之一,同时它也为死刑政策的制定提供了某种合法性的论证,因而引起了在朝、在野者广泛的兴趣。

4.扬克的研究

几乎就在恩利克进行研究的同时,另一位学者扬克也得出了支持死刑具有遏制效果的结论。扬克考察了每年的处决数量与随后3年的杀人率之间的关联性,从而得出结论:“每一起处决能遏制156起谋杀。”Yunker,“Is the Death Penalty a Deterrent to Homicide: Some Time-Series Evidence”, 1 J. Behav. Econ., 1976, p. 45.这一研究成果不仅印证了恩利克的研究,甚至还大大强化了他的结论。

5.罗夫亭的研究

虽然恩利克的研究,在死刑政策制定者那里很有市场,但是,有学者使用相似或者同样精致的方法,对他的成果进行了深刻的批评。罗夫亭使用相似的方法,试图复制恩利克的研究,但却没有得出相同的结论。罗夫廷对美国的犯罪率与社会特点做了一种煞费苦心的生态分析。当对诸如贫穷、教育、家庭结构之类的社会、经济变量进行对照分析之后,罗夫廷的研究没有或极少找到支持死刑遏制力的证据。Loftin,“Alternative Estimates of the Impact of Certainty and Severity of Punishment on Levels of Homicide in American states”, in Indicators of Crime and Criminal Justice.

6.布里尔、范伯格的研究

布里尔、范伯格也是对恩利克结论持批评态度的学者之一。与罗夫廷相似,布里尔和范伯格使用多变量和经济学的分析方法来测试死刑的遏制力问题。他们通过对死刑实际执行的经验研究,比较了死刑执行带来的遏制力和残酷化两种趋向,最后得出结论:“恩利克在1975年研究中所提出的论点,得不到证据的支持。”Brier and Fienberg,“Deterrence or Brutalization: What is the Effect of Execution? ”, 26 Crime and Delinq, 1980, p. 453.

7.贝利的研究

在对死刑遏制力的经验研究中,学者们提出了一个不可回避的问题,即总的杀人率是否可以敏感地反映死刑的遏制力。这是因为,在美国,只有一种杀人——一级谋杀,才能受死刑惩罚,对于二级谋杀和非预谋的故意杀人,通常应受监禁的惩罚。然而,问题是,当时在美国全国范围内,没有按等级和种类分解的有关各类杀人的统计数据,而只有一个笼统的杀人统计数据。因此,这一总的统计数据成为学者们唯一可以利用的经验素材。然而,这样的一种研究显然建立在一个假设之上,即总的杀人与一级谋杀的比例完全一致,以至于有关总的杀人的统计数据,能够恰当地反映一级谋杀的情况。然而,这一假设能否成立,却始终是一个问题。同时,它还决定性地影响着学者们各种研究的可信性与有效性。萨斯兰就曾经怀疑这样的假设,并声称“从杀人率的变化中得出关于谋杀率的变化,这样的结论在通常的逻辑惯例上是无效的。”Suthland,“Murder and the Death Penalty”, 15 J. Am. Inst. Crim. L. and Criminology, 1925, p.522.

为了测试这一决定性的假设,贝利进行了艰苦卓绝的工作。他从相当数量的州级法院系统中,收集了有关一级谋杀和二级谋杀未经捏合前的原始资料。其后,他用与赛林相似的方法考察了死刑和谋杀率之间的联系。贝利的研究,最为重要的特点便是,其资料直接来源于司法系统,并且是对判处死罪的谋杀的直接研究,因而可以忠实地展现死刑与死罪谋杀之间的客观联系,而不受其他二级谋杀、非预谋故意杀人的影响。最后,贝利得出结论,没有发现任何支持死刑存在遏制作用的证据。

此外,贝利的研究也曾受到哈格的批评。哈格指出:“杀人率并不是比其他任何犯罪率更专门取决于刑罚。影响犯罪的趋向的一些条件,无论是人口统计的、经济的还是社会的……都可能影响杀人率。”Van den Haag,“on Deterrence and the Death Penalty”, 78 Ethics, 1968, pp. 280, 285.作为回应,贝利进一步对死刑的遏制力作了横向交叉研究。他对有死刑和没有死刑的州作了比较,同时对照了两个社会经济学上的变量和五个人口统计学上的变量,以便保证原因论意义上的因素的全面和稳定。结果,贝利发现,不管包括了哪些对照性的变量,保留死刑的州的谋杀率要高于废除死刑的州。Bailey,“Murder and the Death Penalty”, 65 J. Crim. L. and Criminology, 1974.结论再一次地与遏制肯定论背道而驰。

8.皮尔斯和波恩斯的研究

在新近的一些研究中,开始涌现了一些明显与遏制论相悖的“反遏制论”研究。由皮尔斯和波恩斯进行的研究,仔细分析了美国纽约州从1907年到1963年间杀人率的变化,并且发现,每执行一起死刑判决后1个月的时间里,平均有2起杀人案件增加。这一发现,使皮尔斯和波恩斯大胆地假设了一种与遏制论针锋相对的“反遏制效果”,亦即死刑执行具有“残酷化”效应,处决罪犯可能增加杀人,而不是遏制杀人。Bowers and Pierce,“Deterrence or Brutalization: What is the Effect of Execution? ”, 26 Crime and Delinq., 1980, p. 453.

9.英国“皇家死刑委员会”的研究

20世纪30年代初,英国“皇家死刑委员会”广泛听取了代表欧洲和联邦国家的专家证人的证据。奠基于这些可以利用的证据,该委员会得出结论说:“死刑在我国可以废除,而不会危及生命或财产或损害社会安全。”而在20年后,英国又重新组建了该委员会,旨在对死刑问题进行更为广泛的、为期4年的考察。新的委员会经过认真细致的研究,重新肯定了该委员会以前的结论:“在我们所考察的任何数据中,没有明确的证据证明死刑的废除导致了杀人率的上升,或者死刑的恢复导致了杀人率的下降。”Great Britain Royal Commission on Capital Punishment, Final Report, 1953, p. 23.

10.嗄特内尔和贝特尔的研究

在最近的研究中,遏制肯定论者提出了一些更为精致的遏制假设。这些假设主要有三种:第一,“犯罪遏制”。是指死刑对于可以适用死刑的犯罪应该具有的最直接的遏制作用。这意味着,死刑对于死罪,亦即为了遏制而施加处决的犯罪,有其最可以感知的作用。而对于其他较轻微的犯罪,死刑的遏制作用则不可预测。第二,“残余遏制”。是指在死刑废除后,由于公众的无知,人们在较长时间内仍然因为过去死刑的严厉性而遭到遏制,就好像死刑仍然存在。第三,“代理遏制”。是指即使在本区域已经废除死刑,但是生活在这一区域的人们,仍然可能受到邻近法域存在的死刑的遏制。Van den Haag,“on Deterrence and the Death Penalty”, 78 Ethics, 1968, p. 286.

嘎特内尔和贝特尔对遏制肯定论所提出的上述三种假设进行了验证。他们利用“比较犯罪资料文件”,这一囊括了110个国家和44个主要国际城市,自1900年以来的犯罪统计的权威资料,抽取了其中14个废除死刑国家的犯罪资料,进行纵向的时间序列上的比较研究。结果发现,不但未能找到与遏制论及其派生假设一致的证据,相反,事实一再地与这一命题相矛盾。在这些跨国抽样中,在废除死刑之后,更经常地不是杀人率随之绝对下降。无论比较是就短期、中期还是就行得通的最长的时期作出的,这两个发现都适用。〔美〕嘎特内尔、贝特尔:《杀人与死刑——对一个遏制假设的一种跨国比较》,载邱兴隆著译:《比较刑法(第一卷):死刑专号》,人民检察出版社2001年版,第368页。于是,无论是有关死刑具有遏制力的一般假设,还是从其派生出来的残余遏制、代理遏制的假设,都遭至了严峻的挑战和彻底的颠覆。

11.莱斯特尔和菲利普斯的研究

新近的两条线索,逆潮流而动地产生了符合遏制假设的结论。莱斯特尔的研究表明,一个特定州在本年度杀人率下降的可能性,与该州在上一年是否处决了罪犯相关。当然,这种可能性还与该州在上一年处决的数量相关。该年如果有9—16起处决,它们产生的杀人数量的下降的可能性(69%的可能性)比8起或者更少的处决(52%的可能性)要意义大得多。但是,一个州在特定一年的处决如果超过16起,杀人率在第二年下降的可能性便只有61%,这与其他两个百分比并无重大不同。Lester,“Deterrent Effect of Executions on Murder as a Function of Number and Proportion of Executions”, 45 Psychological Rep. 1979, p. 598.

另一项研究则产生了一种不同类型的遏制模式。菲利普斯从遏制力应该在紧随处决的几周内最强这一假设着手,分析了伦敦、英格兰从1858年至1921年的22起广为宣传的处决,并对处决前后的杀人率变化进行了研究。他认为,杀人率随着这些处决,在处决后的两周中每周均下降了大约35%。他还发现,报纸对一起处决的宣扬越广泛,杀人率的下降便越大。但是,在处决执行后的第3周到第5周,杀人率又回到了原来的基线之上,最终抵消了前两周的遏制效果。Philips,“The Deterrent Effect of Capital Punishment: New Evidence on an old Controversy”, 86Am.J.SOC., 1980, p. 139.

12.麦克法兰德的研究

为了验证莱斯特尔和菲利普斯的研究结论,山姆·G.麦克法兰德对于美国近年来的4起处决的效果进行了分析。在美国,每周的杀人率只有在1972年以后才有资料可考。麦克法兰德考察了从1977年以来美国发生的4起处决,最后得出结论,死刑根本不存在短期遏制其后反弹的效果。〔美〕麦克法兰德:《死刑是对杀人的一种短期遏制吗?——对美国近来的四起处决的效果的研究》,载邱兴隆著译:《比较刑法(第一卷):死刑专号》,人民检察出版社2001年版,第372页以下。

(三)“杀一儆百”缺乏实证根据

上述围绕死刑遏制力问题的实证研究,在理论意旨上,无疑是想将前人的逻辑思辨转换为经验考察,将形而上探讨拉回到形而下求证,将抽象分析还原为具体争辩。然而,我们发现,与这样的理论意图相背,本来以为一经具体考察便将真相大白的问题,却复杂得超出我们的想象,像一张普洛透斯般的脸庞,变幻莫测而又扑朔迷离。

由此,“杀一”能否“儆百”的问题,即死刑是否具有最大遏制力,成为刑法学理论中的哥德巴赫猜想,真是剪不断、理还乱。对于遏制假设的经验性研究,总是因为采用了不同的方法、迥异的资料和分殊的设计,显现为相距万里的结论。甚至,有时即使是就同一材料,由于学者们切入的视角、取样的范围及分析的范式的变化,也极有可能得到完全不同的结果。在笔者看来,要想从经验上,以科学方法对死刑是否具有遏制力的问题做出量化的研究,几乎是不可能的事情。之所以得出这样的判断,主要是源于以下几点考虑:

第一,方法上的不足。横向研究的方法,由于其先天缺陷,向来被学者所诟病。因为,横向的地域性交叉研究,必然要求选择两个或更多可供比较的法域。而要比较其威慑力的差异,又必然要求这些法域在除死刑之外的其他状况上,如社会地理、文化习俗、宗教习惯等因素,必须非常近似。唯此,方能凸显出死刑威慑力对犯罪率的影响,而不至于与其他因素的可能影响相互混淆。但是,客观地讲,要选择出这样的可供比较的法域,在概率上几乎不可能。因为不同的国家或地区毕竟会有众多独特的社会情势和不可复制的特点,不可能完全雷同。而只要存在这样的差异点,我们便势必难以将死刑对犯罪率的可能影响,从其他因子施加的可能影响之中分离出来。相对而言,纵向的研究方法可能更为可靠,因为它不涉及两个不同的法域,不存在取样上的这类尴尬和困难。然而,问题是,纵向研究方法也有自己的边界和不足。纵向研究是就同一地域的不同时间序列进行的比较。其重点在于考察同一地域在死刑废除前后或死刑实际执行前后,犯罪率上可能出现的变化。它虽然成功地回避了横向研究的弊病,隔离了不同国家的不同国情可能给犯罪率带来的影响,但却完全可能导致另一新的问题。也即,即使是同一国家,在不同的时间段里仍然可能出现社会情势的变更。我们甚至可以说,这样的变化是绝对的,而且可能变化的因子是无穷多的。质言之,此时的国家不同于彼时的国家。因此,我们也很难分辨,犯罪率的前后变化,到底是由于死刑存废或执行导致,还是由于其他因素的变化导致。尽管纵向地域研究可以增加多个国家或地区的样本,在一定程度上相互对照和印证,以适当加强和巩固自己的结论,但是,想完全化解这种效度和信度上的强烈质疑,却是不可能的。整体而言,由于实证研究方法论上的不足,要想将死刑的可能威慑效果完全从其他因素中隔离出来,实在是极度困难。

第二,遏制对象的不可清查性。死刑的一般预防对象包括了被害人及其家属、潜在犯罪人及其他守法公民。但一般而言,死刑威慑的对象则是潜在犯罪人。然而,潜在犯罪人具有隐蔽性的特点,我们根本无法查清这样一个群体的具体数量。进一步地,死刑究竟遏止了多少个犯罪,换言之,潜在犯罪人中究竟有多少人没有犯罪,是因为畏惧死刑,还是由于其他因素影响,更是难以测量。另一方面,潜在犯罪人不仅具有隐蔽性的特点,而且具有可转换性的特征,他与其他守法者的界限很难区分。只要有合适的机会和诱因,我们便不能排除某些人由守法公民向潜在犯罪人转化的可能。当然,如果有牢固的制度保障和教化更新,我们也不能排除潜在犯罪人向守法公民转换的可能。所以,潜在犯罪人与守法公民之间界限模糊,这便更进一步增加了测定潜在犯罪人范围和数量的难度。

第三,心理感知的不可探明性。刑罚威慑效应的发生过程是一种心理影响的过程。无论是法律上死刑的存在,还是死刑的实际执行,要现实地产生遏制犯罪行为的后果,都必须首先被潜在犯罪人所感知。这就好比一个信号要产生反馈,必须其传播过程和渠道保持畅通,并最终被信号的接收者所感知。如此一来,一国对于死刑政策和立法,通过各种媒体充分宣传,便显得异常重要。而且,这种宣传的力度和广度,也将直接影响死刑遏制力的发挥。然而,到底有关死刑的信息,在多大程度上传达到了潜在犯罪人,则是非常难以探明的问题。更毋论,这些信息在到达受众之后,将在多大程度上影响受众的心理感受,则更是一个隐蔽、潜在的心理过程。而要查证死刑的遏制力,则必须首先查明到底有多少潜在犯罪人了解死刑的存在,了解将要实施的犯罪会施以死刑,同时还必须查明其中到底有多少潜在犯罪人,是因为感知到死刑的存在而放弃所欲实施的罪行。这无疑是相当困难的。

正是基于以上方方面面的困难,笔者以为,要对死刑的遏制力进行一种量化的、实证的、客观的研究,几乎是不可能的事情。但是,无论怎样,却可以说,“杀一儆百”之说是夸大其词,缺少科学的实证根据。自从人类社会有了死刑以来,保守的估计,被判处死刑的人应以百万单位来统计,如果杀一能够儆百的话,那么,犯罪现象岂不是早已在人类社会上消亡了。