算法何以引发公共价值耗损:以S市增值虚开发票治理为例

学术   2024-10-14 09:30   辽宁  

摘要

随着人工智能技术在公共管理领域的广泛应用,算法为公共决策系统创造公共价值的同时,也因其蕴含的固有困境存在损害公共价值的风险。本研究基于公共价值理论以S市算法治理增值税发票虚开为例,揭示了算法辅助公共决策引发的价值耗损过程。研究表明,算法在公共决策系统的介入,推动了传统决策模式从指标式治理转向基于数据与特征的算法治理,提高了行政效率和治理的总体有效性。然而,算法也引发了显著的公共价值耗损,主要影响机制包括三个方面:第一,数据壁垒引发的“数据困境”制约算法模型的准确性和覆盖面,削弱了算法赋能公共决策的有效性;第二,算法弱“解释性”的“黑箱困境”削弱了行政执法过程的透明性,增加了行政执法的合法性风险和行政负担;第三,算法过度依赖特征识别引发“偏见困境”,导致治理手段与行政目的之间的伦理冲突。这些都值得公共决策部门加以警惕和应对。


作者简介

吴进进,深圳大学政府管理学院副教授、深圳大学残障与公益研究院特约研究员;

聂启旺,国家税务总局深圳市龙华区税务局。


文章结构

一、引言与研究回顾

二、算法决策的公共价值耗损:分析框架

三、案例分析:S市虚开增值税发票的算法治理

    (一)从指标识别到算法分析:S市虚开骗税治理的智慧化改革

    (二)算法治理的三重困境与公共价值耗损

        1. 数据困境:数据壁垒制约算法决策的有效性

        2. 黑箱困境:弱解释性与执法人员自由裁量权的扩张

        3. 偏见困境:税务算法潜在的歧视问题

四、结论与讨论



引言与研究回顾


随着大数据时代的来临,人工智能掀起了人类历史上的一次“智慧革命”,引发了经济、社会、生产生活各领域的重大变革。算法是人工智能的核心,是支持人工智能的基础计算方法。算法从历史数据中学习,对现实世界中的事件做出决策和预测。算法超越经验决策、专家决策和传统统计模型的强大预测力使得它在问题识别、决策方案抉择等公共决策过程中具有巨大的应用价值和潜力,推动了公共决策的科学化,形成了公共管理领域的算法决策范式。然而,算法也是一把双刃剑,算法蕴含的政治社会偏见、不透明的黑箱特质、预测偏差等内在缺陷都对公共决策有效性、透明性、公平性等基本公共价值构成了潜在威胁,可能削弱算法赋能公共决策的正向价值,从而产生公共价值耗损问题。现实中正不断涌现用意良好的算法实际上却在损害公共价值的案例,如美国洛杉矶当地政府引入无家可归者“弱势指数”算法,对需要救助的对象排列优先性;匹兹堡儿童福利机构运用算法模型预测哪些孩童可能会在日后受到虐待或忽视。然而,此类算法决策却使得这些边缘人群面临着更加严格的数字追踪、监控甚至惩罚。对算法决策价值耗损的关注具有现实性和必然性。这种必然性源于人工智能时代新技术的出现对传统公共决策模式产生了全方面的挑战。在以美国为代表的西方国家,算法决策已经深入公共管理的各个领域。在我国,数字政府建设如火如荼,算法在政务活动的使用也越来越广泛。国内外公共管理学界已经认识到算法对公共决策技术赋能的同时与部分公共价值相冲突问题,围绕算法决策如何影响有效性、透明性和公平性等公共价值展开了相关讨论。然而,相关研究存在着大量的争论,相关观点和基本立场并不一致,甚至存在截然相反的结论。


首先,算法性能的有效性是人类接受算法的前提。学者们普遍认可算法在提高政务服务效率和改善公共决策质量上的强大能力。影响公共部门算法决策有效性的主要因素是什么呢?部分学者认为算法技术与能力对算法有效性至关重要,如算法模型的可靠性、数据质量和特征丰富度、公共部门算法与大数据素养等因素。然而,一些研究更为关注公共部门算法决策的失灵现象,指出了保守的组织文化和传统僵化的管理体制对算法有效性的制约效应,如部门的领导力与创新力不足、机构间合作不畅以及官僚主义与决策惯性等。其次,算法的合法性很大程度上取决于算法流程和运行过程,特别是算法程序设计中的透明度。多数研究认为算法决策的黑箱特质加剧了公共决策过程的不透明问题,而算法不透明根源在于部分算法模型与基础参数的复杂性与难以解释性。尽管很多研究推崇算法透明度的重要性,但是也有研究表明人们并不关注算法透明度,算法的结果有效性对算法决策而言更为重要,公众愿意用更高的算法有效性来弥补算法透明性的缺失。最后,关于算法决策与公平价值关系的研究也存在较大争论。一些研究认为机器是中立的,算法决策脱离人类干预,基于客观的数据和规则进行决策,克服了情感、偏见等非理性因素的干扰,减少人类自由裁量权,从而增强了决策的科学化、理性化水平,因此公平性更高。然而,国内部分学者亦指出算法嵌入政府治理诱发权力技术化与技术权力化的双重风险,导致权力监督与权利保护难题,以及算法偏见有损社会公平、自主决策减损政府公信、数据滥用侵害隐私安全等社会风险。由于算法的历史数据存在种族、性别等个体阶层与身份上的偏差,算法继承并强化了这种偏差,对某类人群产生了强烈的偏见甚至歧视,算法不仅没有解决不公正问题,甚至还加剧社会不平等。


既有文献对算法与公共决策有效性、透明性和公平性价值关系做了富有洞见的研究,提出了多样性的视角和观点,为后续的研究提供了基础,同时也存在以下不足和局限:第一,当前西方文献多数研究立足于公众感知视角来分析算法决策是否以及如何影响公共价值,较少基于公共管理过程真实出现的算法决策事件,实证分析算法对决策有效性、透明性和公平性的影响及其过程。特别是算法决策的“技术-价值”张力在实践中如何引发公共价值耗损这一问题没有得到充分的解答。第二,目前对算法决策的公共价值的探讨仍然多以理论和规范分析为主,并且是分离的和碎片化的。学者们普遍认可算法提高政务服务和公共决策质量和效率的有效性,算法伦理和治理方面的学者们也注意到人工智能的内在缺陷及其不当使用问题,如算法偏差、算法歧视、算法黑箱等问题,并且未以“公共价值”的视角对其进行建构分析。第三,算法决策与公共价值关系的研究结论是复杂的,观点差异性较大,肯定算法增进公共价值和承认算法损耗公共价值的观点并存,然而少有研究将不同的观点统一起来,分析公共部门算法应用的动态过程中公共价值增益和减损并存的复杂性。


本文基于公共价值理论视角,构建了算法决策引发公共价值耗损的分析框架。通过S市税务系统应用机器学习算法治理虚开发票的个案,深入分析了算法决策在增进公共价值的同时如何产生“技术-价值”张力,揭示了算法决策产生公共价值耗损的影响机制。


算法决策的公共价值耗损:分析框架

公共决策科学化的重要基础是预测的科学化。准确的预测能降低决策的不确定性,提高公共决策的精准性和可行性。一直以来,人类经验预测都是公共决策的主要预测方法,但是随着环境不确定性的增加和数据量的膨胀,经验预测变得不再可靠。机器学习算法基于大数据和高维数据筛选预测因子,对变量间复杂关系建构非线性和高度交互的预测模型,在提升模型精确性上具有人脑判断、专家预测和传统统计模型无法比拟的优势。目前,机器学习算法强大预测力的技术优势在公共决策的应用突出体现在决策问题界定和决策方案抉择两个领域。首先,机器学习算法可以预测问题的结构、模式及其成因,包括预测问题是否可能发生,问题产生的后果,以及问题特性等,从而减轻问题的不确定性。其次,在政策方案设计的抉择阶段,机器学习模型的强大预测力可以预测问题的特征,从而为方案设计提供依据,同时可以精准预测各个政策方案的实施效果,从而为方案选择提供循证依据。


公共价值是一个集合了公民对政府期望的框架,使公共部门提供的公共服务与公众的需求相匹配的建构过程。随着数字治理成为新的政府治理范式,公共价值理论和数字政府研究深度融合。数字政府在提升政府治理能力与改善公共服务绩效等方面的公共价值引起了广泛重视。有学者指出数字化提高了政府服务质量,减少服务财政成本,提高政府政策和计划的有效性。在数字政府公共价值框架构建方面,学者们基于不同视角对数字政府公共价值的维度进行界定,发展出了多种分类。Harrison等将政府行为与道德和伦理信仰相结合,提出一个综合了效率、有效性、专业化、透明度、参与和协作的价值创造框架。刘银喜和赵淼认为数字政府的核心目标在于推进以公民为中心的公共服务,在提高管理效率的同时改善公民服务体验,增强公民满意度。Rose等在广泛总结文献的基础上提出了专业、效率、服务和参与四个价值立场。


对于算法决策而言,与之契合度最高的公共价值包括有效性、透明度和公平性三个价值。第一,有效性。有效性始终是算法决策的主要目标,有效性价值取向是指算法应用旨在提升政府行政效率,降低政府行政成本,减轻公众办事的行政负担。公共部门采用人工智能的逻辑起点也正是增强人类能力,以最少的资源执行任务,实现快速优质的公共服务创造。第二,透明性。不透明是算法决策系统的固有特征,它使系统运作过程变得复杂且难以解释。但是根据公共部门的价值属性,算法驱动的公共服务供给必须根据相关法律法规保持充分的信息公开和参与性。算法决策在强调提高行政流程效率性的同时,不能偏离行政过程合法性这一基本准则。第三,公平性。公平性是算法伦理的首要原则,人工智能发展应促进公平公正,保障利益相关者的权益,促进机会均等。算法应全面考虑不同人群的能力和需求,消除算法决策过程中的偏见和歧视,尽力确保让各类群体也能够便利、平等地从算法中获得福利。


然而,实践中公共决策对技术理性的过分强调,甚至将技术理性推崇为主导地位,已经遭到猛烈的批判。算法带来的政治风险和伦理挑战,如社会偏见、不公平、不透明与威胁政治安全等风险和危害,受到学者和社会各界广泛的关注和警惕。


首先,数据壁垒的困境是制约算法有效性的主要因素之一。尽管现有文献提出了影响算法有效性的诸多因素,但是其中最为关键的当属数据的质量与特征问题。算法驱动的决策模式的基础是大数据与集体智慧,核心要素就是知识的共享、开放、互通和集成。算法模型建立在对大量数据进行训练和测试的基础上,只有充分的数据共享才能建立良好的算法模型。因此,数据的共享和合作是不断提高算法效力和预测有效性的前提条件。然而,由于知识与信息作为部门核心资源,部门之间缺乏知识共享和信息公开的激励,部门知识与信息交流阻塞,产生了典型的“信息孤岛”和“数据烟囱”问题。部门化的算法应用难以突破跨部门的数据合作障碍,不同程度上存在着数据质量、标准和集成途径不一致的问题,而且更大问题在于,数据公开与算法系统的联通性引发了政府内部数据获取和控制权的紧张关系。


其次,算法的预测结果可能带有明显的政治与社会偏见,损害公共决策的公平价值。当前,机器学习算法在公共决策领域应用已经十分广泛,越来越多地被用于决定谁有资格获得社会救助、谁能得到商业保险,甚至决定谁是危险人物,谁可能再次犯罪这类一直由人类主导的关乎权利、平等的政治、社会伦理问题。基于机器学习算法的社会鉴别行为很容易导致对某些社会群体的歧视和偏见。机器学习算法两个基本要素——大数据和算法模型——都不是绝对客观公正的,很容易受到有意或无意的偏见的影响。机器学习算法不仅继承了现实中存在的种族和性别偏见,而且还可能加剧了数据集中所呈现的偏见和歧视,基于这一预测结果进行公共决策,可能进一步加剧社会不平等问题。


最后,算法预测模型的黑箱特征使得算法决策系统陷入过程不透明、决策结果问责难的困境,违背了公共决策的透明性公共价值。尽管算法驱动的自动化决策减少了人对决策过程的干预和自由裁量行为,提高了公共决策的准确性、一致性、客观性。但是,多数复杂的决策过程无法实现算法自动化处理,算法主要起到的是辅助决策的作用。在决策全部环节中,算法只是完成了一小半,剩下的部分如决策方案的判断和政策方案的实施仍然由人类完成。由于复杂精巧的算法是一个黑箱,尽管使用者知道算法预测结果和准确度,模型拟合过程涉及大量变量和数据,预测因子和结果之间缺少因果联系,预测太过复杂而难以直观理解。算法的不透明性和解释性差的特质反而增加了后续人类活动的负担和不确定性。算法取代了传统人类决策的方式,但是没有对其决策结果给予充分的解释。算法的黑箱特征一方面导致政府部门只能选择相信算法是准确和公正的,使得算法决策无法得到有效的监督和及时的纠正。另一方面,面对模糊宽泛的算法决策,政策执行者只能根据自己的判断来采取应对行动,反而扩大了行政人员的决策裁量权,既可能增加了行政人员的执法负担和公众应对负担,也可能导致潜在的腐败、渎职等行政违法行为。


因此,我们根据算法赋能公共决策技术理性和算法缺陷的相关文献,结合公共价值理论视角,提出了算法决策引发公共价值耗损的分析框架(见图1)。一方面,算法决策凭借其强大预测力的技术优势赋能公共决策的技术理性,实现提高决策效率降低决策成本的效用,有助于公共决策价值的创造。另一方面,算法决策的固有缺陷,通过数据壁垒困境、预测偏见困境和预测黑箱困境三种机制制造了算法决策的“技术-价值”张力,引发了算法公共价值的有效性、透明性和公平性的耗损,损害了公共决策的价值理性。



案例分析:S市虚开增值税发票的算法治理

随着商事登记制度改革的深入和“营改增”的逐步拓围,S市市场活力显著增强,纳税户数呈井喷增长态势,辖区纳税户连续多年增长幅度接近40%,随之而来的是税务治理形势严峻,虚开发票骗税行为日益增多。我国税收征管呈现“以票控税”的特征,即以纳税人接受和开具的发票为管理核心。巨大的利益驱使虚开发票、骗取出口退税等违法行为大量滋生。虚开发票的企业有多种类型,其中较为典型的是成立虚假企业虚开发票,因其形式简单粗暴又称为“暴力虚开”,其特点是开具发票后直接走逃不申报或者申报欠税不缴纳,或虚假填报申报表抵减税款。由于S市各级税务部门人力资源紧缺,工作压力繁重,传统的征管模式面临极大的挑战。在这样的背景下,S市积极引入人工智能技术作为治理虚开的常规手段,为S市税务治理虚开提供了明显的助力,不仅减轻了大量常规性任务和行政压力,而且在识别虚开企业的及时性和准确性上都有较大的提升。


(一)从指标识别到算法分析:S市虚开骗税治理的智慧化改革


S市税务系统长期以来一直耗费大量人力物力治理虚开骗税。从2014年开始,S市税务设置风控中心,负责全市虚开骗税的治理工作。主要治理手段是依靠专家经验建立指标识别虚开企业,形成了一套基于专家经验的指标法。其运用的指标数多达211个,主要分为企业基本信息类、企业关联人员类、企业申报数据类、企业发票信息类、企业涉税行为类等五大类。指标式治理的优势在于识别虚开企业的依据明确,逻辑性和可解释性强,可以清晰地指导执法人员如何处理,如哪些指标上出现问题的企业违法风险更高。依靠专家经验指标,S市税务在治理虚开骗税方面取得了一定成果。然而,指标法治理虚开问题存在明显的缺陷。指标治理是以事后挽回税收损失为目的的被动应对方式,事前预警和事中阻断存在明显缺陷。此外,这一分析方法效率较低,每个月只能识别两三百家企业,具体使用时常常要辅以人工后续分析,经常人为地更新改变指标阈值与权重,效率不稳定。S市税务局税收大数据和风险管理局工作人员针对传统手段的弊端时提到:“传统的指标方法最主要的限制,就是它的指标是固定的,是死的,面对不同的情况就要设计不同的指标,但是指标与指标之间的联系是比较少的。”(20230321-ZQ)随着S市注册企业数量的激增,S市税务虚开骗税在2015-2018年期间有进一步恶化趋势,不论是虚开骗税企业数量还是规模都有较大的增长,传统的治理方法已经无法应对逐渐恶化的虚开形势。


传统手段的各种弊端迫使S市税务系统将更多精力放在数字化技术上,借助人工智能手段提升税务治理的有效性、准确性和科学性。S市自2016年开始探索将人工智能引入虚开发票治理。算法应用的虚开骗税属于基础性风险核查任务,基础性风险性质恶劣,企业完全是不以实际经营为目的从事违法行为,如成立虚假企业虚开发票。S市税务稽查系统建立了“智慧稽查”系统,利用人工智能对虚假注册企业、虚开专用发票企业和企业法定代表人等人员开展风险分析。算法分析的核心是利用随机森林算法设计了3张企业和个人画像,训练了超过3万个企业和个人样本,自我学习总结出识别虚开企业的80个重要风险特征,模型预测准确率达到90%以上。为保证算法的不断升级更新,画像根据样本数据的变化,在学习中自动调节特征权重,形成的一套风险评分(RS)体系(见表1)。当风险得分超过50分时启动纳税评估,当得分超过75分则达到高风险级别,算法自动下达税务稽查指令和执法人员应对指引。S市税务局征管科的一名工作人员在介绍这一算法时说:“我们的算法的准确性其实主要就来自两个方面,一个是特征,一个是样本,而且这是一个动态变化的过程,特征的选取、评价是一个比较漫长而且持久的工作。可以说人工智能的迭代进化其实就是特征和样本的进化。”(20230219-YZ)相比指标法低效缓慢的识别过程,算法分析的最大优势在于快捷高效,目前通过算法可以实现每周2000余家企业的识别,准确率达到86.41%。经过人工智能一年半的参与,S市税务治理虚开成效逐步显现,过去较为严峻的虚开骗税形势得到了有效遏制。



(二)算法治理的三重困境与公共价值耗损


然而,尽管算法介入公共决策系统中起到了明显的效率提升价值,但是算法中的数据壁垒、算法黑箱、算法偏见等固有的缺陷也被带入算法决策中,对公共决策系统产生各类问题,甚至引发决策合法性风险。在S市税务算法决策应用中,算法治理就存在三重困境,不仅制约了算法治理的效果,并且还对基层执法人员行为和被治理对象产生了深刻的影响。


1.数据困境:数据壁垒制约算法决策的有效性


虚开骗税虽然是一个税收问题,但在应对该问题的时候,需要的数据却不仅仅是税收数据。不同维度的数据进行比对,可以有效发现企业虚开的问题线索。利用外部数据比仅依靠内部数据的预测准确率也会有明显的提升。S市税务为了提高算法的准确性,也试图从其他部门引入第三方数据,将这些数据的特征加入算法模型中,并且对某些数据特征比一般特征赋予更大的权重。S市税局征管科的一名工作人员提到了第三方数据共享对构建算法模型的重要性:“第三方数据对税务局的工作确实有很大助力,如果加到我们模型里面的话,它的效果还是很好的,现在的模型当中也有部分指标运用了第三方数据,比如网格、资金流水、消防等等数据就曾经在一些模型当中起到重要作用。”(20230127-FD)尽管S市税务部门设计算法模型时尽可能覆盖内部掌握的全部数据类型,比如登记注册信息、财务报表信息、申报数据、发票信息、人员关联信息、办税行为信息等,但S市税务掌握的数据主要是税收数据,数据较为单一,只能描绘企业在税务层面的一些特征,与纳税人真实的全貌还有较大的距离。真正从事虚开骗税的企业反而在税收方面会慎之又慎以达到以假乱真的地步,单纯从税收层面发现问题企业也越来越困难。


对识别虚开企业具有重要参考意义的外部数据当属工商异常名录数据和社区网格数据。但是由于部门行为规范以及对违法行为认定标准的差异性,一些部门的数据并不能直接被税务部门直接应用,非但不能起到优化算法、提高治理成效的效果,反而可能引发法律风险。2014年8月19日国家工商总局出台了《企业经营异常名录管理暂行办法》,规定工商部门可以将四类企业纳入异常管理,即未及时报送工商年报、未按照规定公示、提供材料弄虚作假,实际不在注册地址经营的企业。作为主动公开的数据,S市税务局于2018年实现了工商异常名录数据与税务黑名单管理系统互通,也就意味着企业被纳入工商异常名录的,系统自动将其纳入税务黑名单。但是在风险评估过程中,算法系统并未有效地利用这套异常名录数据,主要原因在于税务系统和工商系统对异常企业界定的差异,从而导致的数据标准的不兼容。如工商异常名录的纳入与解除十分频繁,大量企业被纳入后很短时间内又解除了,这给税务部门使用这一数据带来很大的麻烦。异常名录所能体现的纳税人“问题”,与税务机关期望的“问题”存在差异,税务机关希望借此发现存在较为严重问题的企业,可事实上并非如此,反而给纳税人造成了额外的负担。工商异常名录所称的通过登记的住所或者经营场所无法联系与税务系统认定无法联系也存在一定差异,税务部门无法直接使用工商异常名录中的实际不在注册地企业名单数据。


此外,社区网格数据也能为优化税务算法提供有价值的数据支持,但是这套数据也无法被税务局充分使用。S市为了取得较为准确的企业真实经营数据,与S市网格办多次磋商,试图将网格数据引入税收治理尤其是虚开骗税治理的算法特征集中来。网格办采集的实有法人(机构)、实有房屋信息与税务部门的要求从形式上来看可以说是完美契合,为此S市税务选定L区税务作为试点单位与网格办进行协作治税。截至2019年底,L区税务局获取了区网格办提供的14万条法人(含个体工商户、合伙企业)的核查信息,包含企业法人名称、证照类型、企业地址、楼栋编码等信息。L区税务对14万条网格数据进行初步数据清洗后却发现,仅6万条数据能够达到算法训练所需的数据质量要求,合格率不足43%。网格办数据存在的问题主要体现在以下几个方面:第一,S市网格管理的重点在人员管理,尤其在疫情防控阶段,对企业或者机构法人的重视程度较低,因此企业和机构法人信息严重缺失。第二,网格管理核查数据录入环节自动化程度较低,主要依靠网格管理员手工录入,信息错误率较高。网格管理系统核对校验功能较弱,没有与工商信息等外部系统对接,内部对数据质量缺乏硬性的考核机制。第三,录入信息缺乏标准化格式要求,对于统一社会信用代码等标准化、通用性信息也可以不采集,在地址录入环节也存在不同人对相同地址叫法不同的情况,非标准化信息给后续利用带来了很大难度。除了工商异常名录数据和网格信息以外,S市税务还尝试过获取海关信息、特许经营许可信息、安监信息、消防信息、卫生许可信息等,都面临着数据标准不统一问题。


更突出的问题是在数据交换时,政府部门间存在较强的数据保护心理,拒绝与其他部门进行数据交换。L区税务局基层风险应对工作人员也认为:“数据壁垒问题一直存在,还比较缺乏一个常规的、通用的制度。目前来自其他政府部门第三方数据主要是在日常工作中遇到急需解决的数据,通过领导的临时沟通协调,才有可能拿得到。”(20221215-WY)税务部门作为中央驻地方单位,实施垂直管理,与地方横向联动较少。S市L区政府注重数据治理的统筹性和协同性、注重数据集中管理,发挥数据优势,将L区政府各部门的数据统一划转到政务服务数据管理局管理,建立统一数据库,对辖区所有政府部门所掌握的数据进行归集整理,但税务数据始终未能纳入集成。S区L区税务局税收征管科的工作人员提到税务数据共享时表示:“既然税务数据都没有纳入政府统一管理共享使用,那么也就很难指望其他部门的数据能被税务部门使用。”(20221211-LQ)


由于无法获取关于纳税人各方面特征的数据,使得目前的算法预测模型存在很多局限。作为对税务部门打击虚开力度不断增强的回应,部分企业虚开的方式也越来越隐蔽和复杂。那些容易被算法识别的企业被查处后,剩下的企业越来越难以识别,这就要求算法不断升级,学习更多的数据,纳入更准确合理的特征变量。然而,由于存在数据困境,S市税务系统打击虚开的有效性也呈现下滑趋势。S市治理增值税发票虚开的算法应用存在一定局限,目前主要用于税务的基础性风险中,特别是企业虚假登记虚开增值税发票环节。对于正常经营的企业,或真假参半企业的纳税不遵从,导致少缴税款的实质性风险,算法则很少使用。数据壁垒的困境也是制约算法治理难以从暴力虚开这样的基础性风险扩展到实质性风险的重要原因,因为实质性风险的企业和个人的特征更加多样复杂,设计识别实质性风险的算法也需要更大范围的数据和信息,显然S区税务局目前的算法还不能满足这一要求。


2.黑箱困境:弱解释性与执法人员自由裁量权的扩张


尽管S税务为提高人工智能的解释性做出了大量人工干预,并且选用了在各种算法当中解释性较强的随机森林算法,但是由于税务算法的应用只停留在虚开企业识别阶段,在算法系统提出企业风险评分等级后,对于高风险等级的企业,税务人员需要根据指引来进行风险任务应对。然而,相比传统的指标法,算法自动生成的各类税务风险任务缺乏具体的应对指向,这就导致相关工作人员在证明或排除企业是否存在违法问题时缺少明确的行动应对指南,反而为行政人员提供了比传统方法指引风险应对时更大的自由裁量空间。基层行政人员为了避免自己的行为存在违法违规风险,需要增加额外的验证工作,从而导致过度执法以及企业行政负担的增加。


人工智能画像的风险任务应对指引相比传统的风险任务模糊得多,对基层应对人员的具体应对缺乏实际的指导作用,而这一问题主要根源于算法的弱解释性。风险任务应对指引是基层风险应对人员的操作手册,同时也是应对人员的考核指标和执法标准,风险任务应对指引是否清晰直接影响到应对人员如何开展工作以及应对人员如何证明自身工作的完备性。对企业的具体某个税收风险,利用传统指标法生成的风险任务往往指向明确,如应对的步骤和判别方法有着清晰完整的界定和相应的法定标准。由于指标指向的是企业具体的疑点,如果企业踩中某个指标,据此进行应对是完全可行的、充分的。在传统的风险任务中,因为疑点指向是明确的,税务人员一般通过指标的说明就可以判定企业存在某个问题,少部分情况下,还应由应对人员添加一些指标中未涉及的佐证。


然而,在应用人工智能的过程中,税务人员提供给人工智能学习的素材是特征而不是指标,但如果企业满足某些特征就被算法判定高风险并就此采取应对措施,那么行政人员如何采取措施,具体的行动方案做就比较模糊且不可解释。经过人工智能的精密计算,呈现给任务下发人员手中的是一份名单,名单中只有企业名称、纳税人识别号等基础信息,除此之外可能会显示人工智能判别的风险评分,仅凭这样的信息,任务下发人员必然无法撰写出一份结构清晰、指向明确、可操作性强的应对指引,下发的企业风险疑点也就不够明确。正如S市N区税务局M街道风险应对人员所指出的:“当前针对人工智能的风险任务出具的应对指引确实比较宽泛,这个宽泛的原因呢,首先是因为人工智能算法缺乏解释性这个特性,很难指明具体的风险疑点。”(20230321-YZ)


人工智能算法识别出某户企业虚开风险比较高,以及在哪些特征上面风险高,但是具体的风险点就要依靠应对人员的经验判断,如从哪几个风险疑点角度核查。在这种情况下,算法应用部门只能制定一些宽泛的风险应对指引,即使用相对通用的规则指导执法人员行动。例如,基于算法下达的应对指引只是告知应对人员可以电话询问、可以实地核查、可以让纳税人提供资料,但是不像传统指标方法那样明确告诉应对人员,应当核查企业资产负债表、利润表等,或者要求纳税人提供哪些信息。上级部门把如何操作化和实际应对措施的权限赋予给基层应对人员。因此,这种宽泛通用的应对指引就非常考验应对人员的职业能力,缺乏应对能力和经验的工作人员在面临这种指引时的确会感到茫然无措,无法入手。


由于算法研发的风险应对宽泛化模糊化,在风险核查的过程中,逐渐产生一个“举证责任”倒置的问题。人工智能可能并不只是简单地替代了传统的分析手段,它已经实际影响到了应对方式,即基层税务人员的执法方式。税务人员也不再承担举证责任,而是将这个举证责任抛给被核查企业。S市F税务局税源管理科负责人针对算法指导下的风险应对问题指出:“系统说你单位有问题又没有告诉哪里出现问题,那么一种选择是让企业证明自己没问题。”(20220912-WF)由于算法被认为比人工更加中立客观,行政人员应该服务算法的判断,算法迫使基层应对人员根据企业实际情况做进一步核查企业是不是在实际经营,此时应对人员就有较大的自由裁量权,依靠行政人员主观判断。这样的执法方式可能存在一定风险,即使该企业实际没有问题,但税务人员可能为了保护自己要求企业过度自证,由此产生的“自由执法”“过度执法”问题很有可能会给算法“误伤”的企业带来巨大的行政负担。缺乏明显的任务指引不仅导致执法人员执法过度,也同样可能诱使部分执法人员以不知道该核查什么为由放任问题企业从事违法犯罪活动,这给治理虚开带来了较大的执法风险。


3.偏见困境:税务算法潜在的歧视问题


S市税务局推动人工智能画像纵深发展,强化四张画像风险识别任务,加强对风险自然人的管理,不仅利用算法“管企业”,而且还要更加精确地实现“管人”的任务,进一步提高风险分析识别效率和效果。在四张画像构建过程中,工作人员为了弥补人工智能解释性不足的问题,进行了大量人工干预,在特征选取、模型选择、参数调节等环节有意识地提升自然人信息在风险识别当中的比重。然而,算法中大量任务特征可能存在一定伦理风险,如贫富歧视、性别歧视、地域歧视、年龄歧视等,这种偏见大量体现在企业法定代表人、投资方等关键人员上。S市税务曾经在算法识别领域加入了“三无人员”特征,即无固定住址、无固定收入、无稳定资产的人员。但是,将包含此特征的算法所产生的风险任务与其他一般算法进行了比较,发现包含“三无人员”特征的风险任务准确率并无太大差异,但因该特征所产生的风险指向给税务人员应对带来了很大难度。由于该类指标的权重占据重要地位,尽管风险应对人员显然不能以相关人员无固定住址、无固定收入、无稳定资产为作为充分的理由对企业或个人开展风险核查,但在虚开形势严峻、风险应对人员责任重大的背景下,应对人员普遍不敢放松对这些人员与企业的警惕,造成应对人员无所适从但最终仍会普遍采取限制性措施或者监控措施。


应用算法的税务部门显然也意识到了特征选择可能存在的偏见和歧视问题。他们采取的主要措施就是人工干预。Y区税务局风险应对管理人员也认为当前的指标当中可能存在一些歧视性的指标,但是可以通过其他行政的方法来避免造成危害:“当前算法当中确实是存在一些比如地域、年龄、性别、贫富差距等等这些特征,有可能会有一点歧视的意思在里面,但是我们现在运用人工智能技术还是有所保留的,不是计算机的判断就是命令,只是计算机提示这户企业存在问题,最终还是要应对人员一户一户去核的。”(20230205-ZQ)人工智能对违法企业的筛选并不会取代人的决策,最后确定是否存在虚开行为仍然依靠执法者个性化的分析和应对。


结论与讨论

在算法时代,公共决策过程既享受智慧治理赋能的价值创造机遇,又可能遭受算法固有困境所导致的价值耗损挑战。在人工智能技术嵌入公共管理与公共决策场景下,算法决策的公共价值耗损问题是一个新的重要研究问题。本文对S市虚开增值税发票算法治理的案例研究表明,尽管算法的介入推动了传统决策模式从指标判断转向数据驱动的算法分析,一定程度上提高了行政效率和治理的有效性。但是算法决策的内在困境引发了显著的公共价值耗损。在现有条件下,如何在政府治理和决策过程中更合理地运用算法决策更好地促进公共价值的实现?本文提出了让人类参与算法决策的过程和闭环中,把传统公共治理中人的能动性和透明性、公平性和问责制等价值观深深嵌入到算法决策中,建立传统治理与算法决策的协同机制。


首先,实现算法决策和传统治理的协同,应通过组织间数据流通和合作机制的调整适应算法决策的新要求,进一步提高算法决策的有效性。政府围绕人工智能支持公共服务供给进行变革,关键是打破不同部门之间的数据壁垒。解决“数据壁垒”必须从顶层设计开始:一是要避免多头建立系统,着力实现数字系统的整合和统一;二是要打破各部门数据保护的心理,将各部门的利益有效结合起来,而非以数据权力凸显部门地位;三是要充分研判不同数据的敏感程度,对于低风险的数据充分共享,对于高风险的数据脱敏后共享或利用协同学习等技术防止数据扩散风险。同时,不仅注重共享数据规模,而且也应注重共享数据质量,将数据标准化做在前头,统筹安排各部门按照同一标准开展信息化建设和数据采集、加工、存储,在保障数据安全的前提下,组织各部门之间联合建设各类模型、指标,提升算法效能。


其次,实现算法决策和传统治理机制的协同,要推动组织结构流程与算法决策的共同发展。科层组织应围绕着算法系统建立起一个以合作为基础的组织形态,这一形态是自上而下的“命令-执行”模式、自下而上的沟通模式与跨部门合作模式的结合。一方面,部门为了建立和优化算法,建立内部反馈系统或与其他组织开展跨部门合作。这种改变并没有改变组织的独立性,组织仍然是层级制的垂直结构,但组织为了满足算法对数据合作和信息共享的要求而做出改变,更多地与其他部门建立合作关系,建立正式或非正式的信息共享机制。另一方面,传统组织治理机构可以借助算法决策改变科层组织间的关系形态,实现职能整合和跨组织联动。通过建立统一协调的治理机构,整合分散的治理职能实现部门协同治理;同时建立派单式的组织联动,利用算法的强大数据处理和数据分析应用能力,向其他职能部门进行任务派单,提供解决方案,从而实现指挥联动其他部门的效果。


最后,健全算法决策的人类监督和治理机制。公共部门应审慎决定某项公共决策是否适合机器学习等算法技术,尽管算法在预测力上具有强大的优势,但这并不意味着大部分政策问题的识别和政策方案抉择都应该由算法模型来决定。一个基本的原则是对高度灵活性、高度非程序性和存在不可观测因素的决策任务需要人类主导决策过程,在算法辅助决策时也应有人类的监督。监管机构应采取各种算法决策监管工具,如模型认证、独立第三方对模型性能的持续测试、公共部门提前算法影响评估等,进一步加强算法决策的问责性。人类对算法决策监督的重点是分析、评估历史数据中的偏误对模型的过程与结果可能产生的影响,保持高度警惕并做好审查和介入准备。在使用算法构建模型前,决策者或算法的开发者就必须认真监督并审视数据是否存在偏误,采取措施消除数据偏误。在建立预测模型时,需要考虑哪些预测因子可能与种族、性别或其他容易引发社会偏见因素高度相关,这些预测因子最好从模型中剥离出去。这就需要建立人工智能研究人员与社会科学、人文、性别、医学、环境和法律等方面的专家进行合作交流的制度体系,如在政府或公司层面建立人工智能伦理委员会,委员会成员由各领域专家、企业和政府人士构成,对机器学习项目进行政治与伦理审查。人类对算法决策保持深度介入,建立算法与传统治理方式的协同治理机制对提高算法决策的透明度和公平性,保持其有效性发挥着关键作用。


本期来源:《中国行政管理》2023年第9期

编辑:明  婧

校对:明  婧

审核:曾  锋



往期推荐


数字政府治理的公共价值失灵发生机制及其矫正——以C市智慧城市建设为例

公共价值创造:数字政府治理研究新视角——理论框架与路径选择

技术嵌入、价值倾向与算法分类治理


公共管理共同体
定期推送中国公共管理专业期刊文章,传播公共管理知识,分享公共事物的治理之道。
 最新文章