文章详细

刑事侦查讯问博弈论研究

123发布时间:2017年3月28日 大连经济刑事律师  
获得诺贝尔经济学奖的 robert aumann 教授认为,博弈论是研究互动决策的理论。所谓互动决策,即各行动方(局中人)的决策是相互影响的,每个人在决策时必须将他人的决策纳入自己的决策考虑之中,同时需要把别人对于自己的考虑也要纳入考虑之中,如此进行决策,选择最有利于自己的战略。刑事侦查讯问是法律赋予侦查机关进行犯罪侦查的国家司法职能,也是刑事诉讼的必经程序。这一过程中,既有侦查机关与犯罪嫌疑人之间进行较量的复杂博弈过程,也有共犯或者对合犯情形下犯罪嫌疑人之间集体理性与个人理性相互斗争的过程,同时还有犯罪嫌疑人与国家法律和道德思想的博弈过程,这一系列特征为博弈论应用于刑事侦查讯问提供了可能性。 一、博弈论运用于侦查讯问的基础 经济学一般理论认为,博弈论至少应该具有三要素:第一,在一场策略互动中必须有参与者或者局中人;第二,每个参与者都必须有可以选择的几种策略或者行动;第三,每个参与者在各种决策下都会获得相应的利益,也称为得益。① 侦查讯问中的博弈应该具备博弈论的基本要素,同时又因其领域的特殊性及其法律程序的严肃性,侦查讯问博弈还需具备一些特有的因素作为理论基础以及法律因素作为法律基础。(一)博弈论在侦查讯问中得以有效运用的理论基础 1.犯罪事实和证据信息的可获知性。信息的可知性是进行任何博弈决策的基础。侦查讯问的过程是一个侦控方与被控方不断获得对方信息并进行相关决策的过程。侦查机关只有在掌握犯罪嫌疑人的相关信息(无论多少)后,双方在讯问过程中才具有可博弈性。国际有关侦查讯问程序都明确规定了禁止先行讯问原则,即检察官和警察不应在侦查案件一开始时就讯问犯罪嫌疑人,而应当在收集了相应的物证或认证、积累了一定的能证明被讯问人有犯罪嫌疑证据时才进行讯问。侦查机关在这样的讯问博弈中占据主动地位而不至于盲目讯问。② 2.犯罪信息的不完全性。信息不完全又称为信息不对称,往往指交易双方由于所掌握的产品信息在数量、真实性、可靠性上不完全一致,从而导致交易中逆向选择和道德风险的发生。在侦查讯问中,如果侦查机关与犯罪嫌疑人双方所掌握的信息完全,则说明事实已清楚、证据已充分。侦查机关此时有两种策略选择:一是依法申请检察院提起公诉,二是撤案并释放犯罪嫌疑人。信息完全情形下进行侦查讯问没有博弈论上的意义。侦查机关与犯罪嫌疑人之间的信息不对称,以及犯罪嫌疑人之间的信息不对称是侦查讯问得以进行有效博弈的基础。正是信息不完全赋予了侦查讯问博弈的魅力所在。 3.犯罪嫌疑人具有心理理性。犯罪嫌疑人理性是侦查讯问博弈得以有效的基本前提。只有理性的犯罪嫌疑人在面对侦查检控时会为获得惩罚后果最小化和利益最大化而明哲保身。一名精神病患者或者任何一个非理性嫌疑人是不可能对法律作出正确理解并在讯问过程中进行合理决策的。非理性因素会导致博弈失灵,侦查询问博弈是理性人之间的游戏。 4.侦查机关与犯罪嫌疑人之间的互动可能性。侦查机关与犯罪嫌疑人之间的互动是相互获得信息的基础,无互动则无博弈。无论是以获取犯罪嫌疑人口供为目的的大陆法系职权主义强制侦查模式,还是以保障嫌疑人相关权利为出发点的英美法系当事人主义的平等对抗式侦查模式,都规定犯罪嫌疑人作为被讯问者的地位,区别在于对抗式侦查模式下当事人可选择沉默。 5.侦查机关与犯罪嫌疑人之间的相互获益性。获得利益是参与者进行博弈的终极目的。在侦查讯问中,侦查机关以获得口供、侦破犯罪作为其所获得的利益;犯罪嫌疑人在讯问中得到侦查机关关于量刑情节的承诺是其获得的利益。双方正是在这样一种法定辩诉交易的利益激励下使得侦查讯问博弈得以实现,得益是侦查讯问博弈的基本条件。(二)博弈论在侦查讯问运用中的法律基础 依法讯问、合理讯问是侦查讯问博弈的法律基础,否则任何违法博弈获得的证据都有可能被“非法证据排除规则”所排除。讯问博弈的法律基础有刑法基础和刑事诉讼法基础。 1.刑法基础。刑法总则的自首立功制度、共犯理论、缓刑制度、减刑假释制度以及“坦白从宽、抗拒从严”的量刑政策是博弈论在侦查讯问中得以有效实施的刑法基础,也是侦查机关与犯罪嫌疑人辩诉交易的法律依据。刑法分则中对身份犯、对合犯等规定了不同的定罪和量刑标准,使侦查机关占据了讯问博弈中的制高点。如在行贿受贿案件讯问中,行贿者若主动投案交代案情,可以免于刑事处罚,而受贿者却没有与之相应的待遇。集体理性容易被分化并且易被个人理性所替代,这是立法者为犯罪嫌疑人设置的“囚徒困境”。 2.刑事诉讼法基础。我国刑事侦查采取的是职权式侦查模式,侦控方对于犯罪的侦破有着极大的制度优势。我国 1996 年修改后的刑事诉讼法并没有采纳美国刑事诉讼著名的“米兰达原则”,犯罪嫌疑人不享有沉默权,犯罪嫌疑人须无条件地配合讯问,刑事诉讼法为侦查询问互动性提供了法律保障。同时,刑事诉讼法明确规定了非法证据排除规则以对侦查机关的博弈手段进行限制,主要体现在禁止侦查讯问过程中进行刑讯逼供,或采取威胁利诱的手段诱供,侦查讯问博弈必须体现程序正义。 二、博弈论在刑事侦查讯问中的应用 侦查讯问博弈可分为静态博弈和动态博弈。在侦查讯问过程中,犯罪嫌疑人若被及时采取强制措施并与外界完全隔离其由于缺乏信息来源,不清楚侦查机关掌握证据情况和与同案犯的同盟关系是否瓦解以及自己是否遭到背叛,此时博弈的主动权掌握在侦查机关手中,这种情形即为侦查讯问的静态博弈,也常表现为羁押式讯问博弈。犯罪嫌疑人若未被羁押或者因取保候审等特殊原因,导致其与同案犯串供或掌握其他信息,或者犯罪嫌疑人了解侦查人员掌握证据的情况,并以此作为应对侦查机关的依据,这样便形成讯问中的动态博弈。除此之外,讯问过程中还存在犯罪嫌疑人与法律及道德情感之间的博弈。(一)侦查讯问中的静态博弈 1.侦查讯问中犯罪嫌疑人之间的静态博弈。我国 1996 年刑事诉讼法仍采取职权主义的强制侦查模式,羁押式讯问导致的静态博弈是常态。侦查讯问中将共同犯罪嫌疑人进行隔离审讯是静态博弈的基本条件,这一前提决定犯罪嫌疑人之间的关系容易从一种同盟的合作博弈状态转变为利己的非合作博弈的状态。根据犯罪主体的不同,侦查讯问中犯罪嫌疑人之间的静态博弈又可分为对合犯间的静态博弈和共犯间的静态博弈。 (1)对合犯嫌疑人之间的静态博弈。笔者以典型的彼此异罪的对合犯进行分析。假设检察机关抓到两个贿赂犯罪的嫌疑犯(同一案件中的行贿者与受贿者),分别关在两个审讯室里,两名嫌疑人失去了相互串供的机会并与外界隔绝。侦查员单独对每个犯罪嫌疑人说,如果有人认罪,而另一个人拒绝交代,两者会面临不同的刑法惩罚。根据刑法规定,若行贿者交代事实则可以减轻处罚(获刑 1 年)或免予刑事处罚,若不交代则可能面临 5 年的有期徒刑;受贿者若交代事实将面临 7 年的有期徒刑,不交代则会面临高达 10 年的有期徒刑。在此情形下,两个犯罪嫌疑人都知道,如果两个人都不认罪,在侦查机关没有发现其他非口供证据情况下,羁押期限届满时两人都会被释放;但若检察机关搜集到其他证据并以零口供提起公诉时,两人将分别被判刑 10 年和 5 年。因此,就行贿者来说,上策是交代犯罪事实,因为按照刑法规定可能免除刑事处罚;就受贿者来说,上策是不交代犯罪事实,因为在侦查机关没有掌握其他证据时将不得不将其无罪释放。然而,理性促使两个犯罪嫌疑人最后都选择了主动认罪这种行为,原因是受贿者知道行贿者在面对免于刑事处罚的诱惑时,理性会促使其供述受贿者的罪行,若受贿者拒绝交代将会多 3 年徒刑(10-7=3)的惩罚,因此两人都交代是全面并且严格的优势策略。③ 犯罪嫌疑人在面对惩罚时总是理性地希望出现最好的结果,害怕出现最坏的结果,这便是经济学意义上的纳什均衡,④ 也称为囚徒困境。 (2)共犯嫌疑人之间的静态博弈。在刑事犯罪中,共同犯罪的情形较之对合犯要广泛得多。如何在共犯的静态博弈中找到纳什均衡点,关系到侦查机关讯问的成败。假设侦查机关刑事拘留了两名共同盗窃犯罪嫌疑人,两人在犯罪前和犯罪中已经形成战略同盟。被抓捕后侦查机关对两人分别审讯,侦查员对每个嫌疑人说,如果有人认罪,而另一个人拒绝交代,则前者可只判 6 个月,后者将判刑 10年。两个嫌疑人也都知道,如果两个人都认罪,都将被判刑为 8 年,如果两人都不认罪,都将被判刑2 年。就两个嫌疑人的总体利益来说,上策是两人都拒不认罪,因为此时每个人都只判 2 年刑,而在其他情况下,每人平均判刑都在 5 年以上。然而两个嫌疑人往往都选择了主动认罪这种行为,因为不管对方采取什么策略,交代对自己总是有利的。交代较之不交代是全面严格的优势策略,交代获得的最好结果是只判刑 6 个月,而不这样做的最坏结果是判刑 10 年。由于隔离后犯罪嫌疑人之间失去了沟通联系,而侦查机关与犯罪嫌疑人双方的信息是不对称关系,事先的集体理性将逐渐淡化,个人理性将逐渐加强,只要审讯策略科学,共犯间的集体理性很容易被彻底转化为个人理性。 2.侦查机关与犯罪嫌疑人之间的静态博弈。与共犯嫌疑人之间非合作的博弈模式相比,侦查机关与犯罪嫌疑人进行的往往是一种合作式的动态博弈。如果侦查机关在确认有犯罪事实和证据后及时抓捕嫌疑人,那么嫌疑人串供的机会微乎其微,无法了解侦查人员对自己罪行的掌握情况,证据和信息优势向侦查机关倾斜,从而导致出现两种情形和四种选择结果。 第一种情形,侦查机关如果并未充足掌握其他犯罪证据,只有通过讯问犯罪嫌疑人以获得供述。这种情形可能产生两种策略选择:第一,犯罪嫌疑人在讯问过程中交代事实、态度诚恳,从而可能在讯问笔录中获得酌定量刑情节,获利为 5;侦查机关得以较低成本迅速结案,获得的利益为 10。第二,犯罪嫌疑人拒不交代事实,犯罪嫌疑人被释放,获利为 10;侦查机关为搜集其他证据(但是不充足)花费了一定成本,并且没有获得口供证据,获利为-5。第二种情形,侦查机关在已搜集充足的其他犯罪证据前提下讯问犯罪嫌疑人,也会产生两种策略选择。第一,犯罪嫌疑人为获得宽大处理积极坦白认罪,从而可能得到酌定量刑情节,获利为 5;侦查机关获得了口供,但由于搜集其他证据时付出了相应成本,因此获利减少为 8。第二,在获得其他充分证据后犯罪嫌疑人仍然拒不认罪,侦查机关以零口供提起公诉,犯罪嫌疑人将被依照法定刑量刑,获利为-10;侦查机关由于必须进行其他证据搜集才能破案而付出更多成本,获利减少为 5。不难看出,犯罪嫌疑人若选择不交代,会处于一种高收益伴随高风险的状态,即要么获利 10,要么-10;若选择交代将都会获利 5,收益低,风险也低。对于犯罪嫌疑人而言,交代无疑是全面且严格的优势策略。(二)侦查讯问中的动态博弈 在实行当事人主义的平等对抗式侦查模式的国家,非羁押式讯问给予犯罪嫌疑人更多保障自己利益的权利,这种模式下动态博弈是一种常态。实行强制侦查模式的国家往往采取羁押式讯问,⑤ 犯罪嫌疑人一开始便失去获得相关信息的机会,动态博弈的可能性很小。但也不排除一些特殊情形的出现,如事前串供、取保候审、监视居住、律师会见等等各种原因,导致犯罪嫌疑人能够掌握侦查机关或者其他嫌疑人的信息,对于自己的决策总是有着“许诺的可信性”或者“威胁的可信性”⑥ 的根据从而变得更加理性。⑦ 这就使得整个博弈互动过程中的信息变化复杂多样,侦查机关与犯罪嫌疑人的策略也会随信息的变化而变化,只有在一系列重复博弈后才能得出最终策略和结果。动态博弈与静态博弈相比具有博弈过程的往返性和重复性特征。根据信息的完整程度可分为完全信息动态博弈与不完全信息动态博弈。参与人完全了解所有参与人的得益情况的博弈称为“完全信息博弈”,不完全了解其他参与人的得益情况的博弈称为“不完全信息博弈”。 1.侦查讯问中的完全信息动态博弈。侦查讯问中存在着完全信息的动态博弈,即侦查机关完全掌握嫌疑人的犯罪信息并已足够申请检察院提起公诉,犯罪嫌疑人也非常清楚自己同案犯的相关策略,明晰侦查机关对自己罪行的法律后果的评价以及国家法律的相关规定,此时讯问成为一个单纯的刑事诉讼程序。信息完全意味着双方对事实、证据已经清楚,根据刑事诉讼法规定,只要事实清楚、证据确凿,零口供也可以定案。因此此时讯问仅能起到增强证据效力、为犯罪嫌疑人获得酌定量刑情节的效果,从而保障犯罪嫌疑人的基本权利,体现侦查讯问程序的合理性和正义性。 2.侦查讯问中的不完全信息动态博弈。这是一个十分复杂的循环博弈过程,它建立在这样的基础之上,即侦查机关与犯罪嫌疑人之间对彼此的信息都有一定了解但是又不全面,并且双方都会依据对方的新信息或新行动作出若干新决策。在这一过程中,侦查机关会用尽办法获得犯罪嫌疑人的完全信息,犯罪嫌疑人也会想尽一切办法获知侦查机关以及其他共犯嫌疑人的决策信息从而为自己下一步决策寻找依据,彼此间的博弈将不断重复直到案件侦破成功或者侦破失败为止。不完全信息的动态博弈是在信息的不断变化中进行重复博弈的过程,与静态博弈相比,其往往由数个静态博弈连续、规律、循环的实现,其中一方获得一个新的信息都会生成一个新的纳什均衡,全面严格的优势策略会随着信息的变化而变化,直到信息结束并形成最终的全面严格优势策略为止。(三)犯罪嫌疑人与法律道德之间的博弈 侦查讯问从本质上说是犯罪嫌疑人与法律和道德之间的博弈过程。犯罪嫌疑人所关注的犯罪代价最小化是由法律规定以及自身情感道德谴责所体现的。在侦查讯问中能否运用好法律和道德情感约束因素也是讯问成败的关键。这就要求讯问中必须向犯罪嫌疑人阐明法律具体规定,有针对性地进行道德情感感化以攻破其心理防线。 刑法所规定的自首和立功制度是犯罪嫌疑人与法律博弈的基础。假如警方通缉一名涉嫌故意杀人且情节严重的犯罪嫌疑人(有被判处死刑的可能),同时公示条件并且对其作出履行承诺,此时理性的犯罪嫌疑人会从以下几种情形中作出选择。 第一种情形,被抓捕前。这时犯罪嫌疑人有三种策略选择:要么抗拒抓捕,要么自首,要么自首同时或之后有重大立功表现。如果犯罪嫌疑人自认为不可能被抓获从而选择逃逸或抗拒抓捕,那么面临的风险和代价是极端绝望的死刑,犯罪嫌疑人此时选择的是高风险伴随高收益的情形。犯罪嫌疑人若去自首,自首将成为法定量刑情节而可能免其一死,但其将面临漫长痛苦的无期徒刑,不过服刑后仍可创造条件获得减刑和假释的法律优遇。如果犯罪嫌疑人自首后又争取重大立功,那么根据法定的量性情节应当为其减刑或免予刑事处罚,从刑罚以及精神道德上都获得了最为轻松的结果。对于嫌疑人而言,选择自首和立功是全面严格的优势策略;对于法律而言,减轻或免除处罚是因嫌疑人高度诚恳的自首和立功表现而给予其的利益回报。第一种情形,被抓捕后。这时犯罪嫌疑人有两种策略选择:一是不坦白,二是坦白或者争取立功和重大立功。犯罪嫌疑人不坦白务必会依法判处刑罚,而坦白却有可能避免一死,尽管犯罪嫌疑人此时已丧失了自首的法定量刑条件,但坦白还可获得酌定量刑情节。若犯罪嫌疑人被抓获后有立功表现的,可以从轻或减轻处罚,若有重大立功表现的,可以减轻或免除处罚。在此情形下,犯罪嫌疑人的全面严格的优势策略是态度诚恳的坦白事实,并且想尽一切办法寻找立功或重大立功机会,从而实现刑罚的最小化。 三、博弈论在当前刑事侦查讯问中的局限(一)刑事侦查博弈中的法律及制度因素制约 我国刑事诉讼采纳职权主义的强制侦查模式,与英美法系当事人主义的平等对抗式侦查模式相比,侦查机关拥有更广泛的侦查权,这不仅给予侦查机关在打击犯罪中更多的职权优势,也符合我国社会转型期打击犯罪的需要。但是,职权主义强制侦查模式决定了侦查机关与犯罪嫌疑人之间进行的往往是非完全信息的博弈,犯罪嫌疑人的权利得不到保障,以至于完全沦为侦查权力的客体。⑧ 在侦查实务中,尽管最高人民检察院和公安部三令五申、法律也有明确的规定,但有些地方侦查机关不照章办事、违法讯问、滥用强制措施的情形依然存在,如侦查过程中律师的会见权受到限制,嫌疑人的羁押期限被变相拖延,嫌疑人的量刑情节被忽视或者没有体现在案卷中等。⑨ 这样一边倒的博弈关系导致了权利的不对等和信息的极不对称,犯罪嫌疑人的合法权益不能得到保障,博弈关系出现断裂和失衡。(二)侦查机关与犯罪嫌疑人之间的信任危机。 法律范围内侦查机关与嫌疑人之间的辩诉交易才赋予侦查讯问博弈以生命力。然而实务中双方的辩诉交易缺乏信用基础,致使讯问博弈陷入困境。犯罪嫌疑人作为侦查讯问博弈中的弱势方,对作出每一步决策的依据都会非常谨慎,只有当其充分认为侦查机关提出的条件和承诺是真实并且可靠的,才会采取有利于侦查讯问的举措。如,侦查机关往往通过免除死刑的优遇促使重罪犯罪嫌疑人前来自首,当犯罪嫌疑人相信这一承诺并自首后,由于其罪行和情节程度过重却无法适用自首规定的可以从轻或减轻处罚的量刑情节,最终还是被法院判处死刑,侦查机关的承诺不能兑现。侦查机关无权也无法对法院的判决进行干预,这便导致了侦查机关对犯罪嫌疑人失去信用。长此以往不利于讯问博弈的正常进行以及刑罚制度的实现,也是对犯罪嫌疑人权利的蔑视和损害。(三)利益激励缺失导致博弈失灵。 得益是进行正常博弈的基础。侦查讯问中有时会出现利益激励缺失的情形从而导致博弈失灵。利益激励缺失往往是因丧失辩诉交易的基础而无法达成讯问博弈纳什均衡。如,一个有着坚决犯意并已经杀死数人的杀人狂,他的犯罪情节已经达到极端恶劣的程度,以至于任何利益承诺对其丧失了激励效果,因为法律不可能免其一死。这是一种完全不合作的博弈,哪怕其自首投案也绝非基于从轻或减轻处罚的利益诱惑。最好的办法是侦查机关投入巨大成本搜集口供外的其他证据并以零口供定案。侦查机关与极刑犯罪嫌疑人之间的博弈有以下情形:第一种情形,在侦查机关没有充足掌握口供以外其他证据的前提下,犯罪嫌疑人由于犯罪情节过重以至于交代事实也会被执行死刑,获利为-10,侦查机关获利 10;若不交代事实,侦查机关会因证据不足而将其释放,犯罪嫌疑人获利 10,侦查机关获利为-10。第二种情形,在侦查机关已经充分掌握口供以外证据的情况下,无论犯罪嫌疑人交代与否,都将被判处死刑,获利为-10,侦查机关获利为 10。显而易见,在缺乏利益激励时,对于犯罪嫌疑人而言,交代肯定必是一死,不交代则有被释放的可能,此时不交代将形成一个最为稳定的纳什均衡这便是利益激励缺失下的完全不合作博弈,不交代成为全面严格的优势策略。(四)犯罪嫌疑人不理性导致博弈失灵。 个人理性是侦查讯问博弈的前提。现实中犯罪嫌疑人的不理性表现会经常存在,这也决定了侦查机关和犯罪嫌疑人间的博弈并非完全有效,会出现博弈失调、失灵情况。如,一个严重精神病患者不可能对侦查讯问及法律规定作出理性反应,法律只能规定因其缺乏责任能力而减轻或免于刑罚。除此之外,共犯间难以动摇的江湖义气、异常顽固的同盟关系等种种不理性因素,也会使侦查讯问陷入困境之中,只能要求侦查人员具有更强的查找其他证据的能力。 (编辑:陈岩) 注释:
① 王则柯:《人人博弈论》,中信出版社 2007 年版,第 16 页

② 徐美君:《侦查讯问程序正当性研究》,中国人民公安大学出版社 2003 年版,第 66 页。
③ 全面,指的是不论对方采取哪个策略,自己的策略总是显示优势,因为对方交代,自己交代比不交代好,若对方不交代,自己也是交代比不交代好。严格,指的是这个优势策略的结局确实要好一些,如嫌犯 a 交代被判 8 年要严格的比不交代而被判 10 年好得多。
④ 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
⑤ [美]伦纳德?特里托、尼尔?c.谢美林、查尔斯?r.斯旺森:《刑事犯罪侦查》,但彦铮、郑海等译,中国检察出版社 2007 年版,第 201-218 页。
⑥ 动态博弈中的可信性是指先行为的参与人是否该相信后行为的参与人会采取对自己有利的或不利的行为。其可分为“许诺的可信性”和“威胁的可信性”。后行为方将来会采取对先行为方有利的行为相当于一种“许诺”,而将来会采取对先行为方不利的行为相当于一种“威胁”。
⑦ [美]科林.凯莫勒:《行为博弈——对策略互动的实验研究》,贺京同等译,中国人民大学出版社 2006 年版,第 41页。
⑧ 陈卫东:《刑事诉讼法实施问题调研报告》,中国方正出版社 2001 年版,第 9 页。
⑨ 龙宗智:《徘徊于传统与现实之间》,法律出版社 2005 年版,第 150 页。
出处:《江苏警官学院学报》2009年第3期


All Right Reserved 大连经济刑事律师
All Right Reserved Copyright@2024 版权所有 法律咨询热线:13050500633 网站支持: 大律师网