算法驱动的市场经济政策,智能体如何帮助人类实现经济利益最大化

文摘   科技   2023-09-06 18:52   中国香港  


推荐导读


人类正在飞速迈入一个人类与智能体协同发展的共生关系之中,正如之前的一系列论文介绍中呈现,智能体不仅仅扮演人类助理的角色,智能体将更多在各种自动化组织中,自动活跃在各种交易场景之中,一个有着智能体密切参与的未来经济网络已经是不可逆转的必然趋势。


    我们必须要有对未来经济形态的基本认识,意识到智能体介入社会经济网络之中,将会如何改变我们当下的商业模式,如何改变每个人的收入模式;在以经验构建的专业领域工作中,智能体必然朝着取代人类职业的趋势发展,人类是否朝着更加多元经济的劳动形态发展。其次,当AI成为强有力的经济政策工具时,以算法驱动的可持续经济发展策略,是否更加公平分配市场的经济结果,还是成为技术特权阶级进一步制造生产垄断的工具。


      本次十篇AI与经济发展相关的论文推荐,既有关于AI如何协作一个国家的经济政策实现可持续发展,也有具体的关于智能体在经济交易市场的博弈关系,我们必须提前了解这些趋势对未来经济秩序的影响,例如以后我们通过智能体在自由市场中,进行交易委托的代理合同签订,多智能体在自由市场中会持续寻求签订契约合同的最优解,在竞争博弈的关系中,持续寻求利于自身诉求的最优策略,整个交易市场将会更加活跃;这些都将改变我们未来的商业模式,以及密切决定着每个人在市场中的核心利益关系。


        在巨大的变革来临之前,我们必须提前了解,AI介入的经济社会形态将会如何。




        Part.1


        AI经济学:应用人工智能驱动税收政策以提高公平与生产力


          论文:The AI Economist: Improving Equality and Productivity with AI-Driven Tax Policies

            地址:https://arxiv.org/pdf/2004.13332.pdf


              应对现实世界中的社会经济挑战需要设计和测试经济政策。然而,在实践中这很难做到,因为缺乏合适的(微观水平的)经济数据和有限的实验机会。在这项工作中,我们训练了社会规划者,他们在动态经济中发现可以有效权衡经济平等和生产力的税收政策。


              我们提出了一种两级深度强化学习方法,用于学习动态税收政策,基于经济模拟,其中既有代理人又有政府进行学习和适应。我们的数据驱动方法不依赖于经济建模假设,仅从观察数据中学习。我们提出了四个主要贡献。首先,我们提供了一个经济模拟环境,具有竞争压力和市场动态特征。我们通过展示基准税制表现与经济理论一致,包括学习代理行为和专业化方面,来验证模拟的有效性。其次,我们展示了人工智能驱动的税收政策相比基准政策(包括著名的Saez税收框架)在平等和生产力之间的权衡提高了16%。第三,我们展示了几个新出现的特征:人工智能驱动的税收政策在质量上与基准政策有所不同,设定了更高的最高税率和更高的低收入净补贴。


              此外,人工智能驱动的税收政策在面对人工智能代理人学到的新出现的避税策略时表现出色。最后,人工智能驱动的税收政策在与人类参与者进行实验时也非常有效。在MTurk上进行的实验中,人工智能税收政策提供了与Saez框架相似的平等和生产力权衡,同时具有更高的逆收入加权社会福利。



              Part.2


              使用 AI 经济学家建立数据驱动、可解释和健壮的政策设计基础

                论文:Building a Foundation for Data-Driven, Interpretable, and Robust Policy Design using the AI Economist
                  地址:https://arxiv.org/pdf/2108.02904.pdf

                    优化经济和公共政策对于解决社会经济问题和权衡至关重要,例如改善平等、生产力或健康,这涉及到一个复杂的机制设计问题。政策设计师需要考虑多个目标、政策杠杆和来自战略行为者的行为响应,这些行为者优化他们的个人目标。此外,现实世界中的政策应该是可解释的,并且要对模拟与现实之间的差距具有鲁棒性,例如由于校准问题而导致的差距。

                    现有方法通常限制在一组狭窄的政策杠杆或难以测量的目标上,不能产生明确的最优政策,或者不考虑战略行为,例如。因此,在现实情境中优化政策仍然具有挑战性。在这里,我们展示了AI经济学家框架使用两级强化学习(RL)和数据驱动的模拟,可以实现有效、灵活和可解释的政策设计。我们在优化美国各州政策和联邦补贴的严格性方面验证了我们的框架,例如在大流行期间,如COVID-19,使用与真实数据相符的模拟。

                    我们发现,使用RL训练的对数线性政策与过去的结果相比,显著改善了社会福利,基于公共卫生和经济结果。他们的行为可以解释,例如,表现良好的政策对恢复和接种率的变化有强烈的响应。它们还对校准误差具有鲁棒性,例如,感染率被高估或低估。迄今为止,实际政策制定尚未广泛采用机器学习方法,包括RL和AI驱动的模拟。我们的结果显示了AI在指导政策设计和改善社会福利方面在复杂的现实世界中具有潜力。


                    Part.3


                    经济政策的强化学习:一个新的前沿?

                      论文:Reinforcement Learning for Economic Policy: A New Frontier?
                        地址:https://arxiv.org/pdf/2206.08781.pdf

                          基于代理人的计算经济学是一个具有丰富学术历史的领域,然而,它一直在努力进入主流政策设计工具箱,面临着代表复杂和动态现实所带来的挑战。强化学习(RL)领域也有着丰富的历史,并且最近已经成为几项指数级发展的中心。现代RL实现已经能够达到前所未有的复杂程度,处理以前难以想象的复杂性程度。本综述调查了经济建模中经典的基于代理人技术所面临的历史性障碍,并思考了最近在RL领域的发展是否能够克服其中的一些障碍。

                            关键词:强化学习 · 基于代理人建模 · 经济政策


                            Part.4


                              超人工智能的政治经济学

                                论文:Political economy of superhuman AI
                                  地址:https://arxiv.org/pdf/2209.12346.pdf

                                    在这个说明中,我研究了阻止出现被表示为AI*的“超人级”通用人工智能的制度和博弈论假设。这些假设包括(i)“思想自由”,(ii)对AI*的开放源代码“访问”,以及(iii)与AI*竞争的代表性人类代理的理性。我证明,在这三个假设下,AI*的存在是不可能的。这个结果产生了两个关于公共政策的直接建议。首先,严格规范人脑的数字“克隆”应受到限制,假设性的AI*对大脑的访问应被禁止。其次,AI*研究应该被广泛,如果不是公开地,应该让人们能够访问。JEL:C70,C80

                                      关键词:人工智能,政治经济学,AGI,博弈论,非零和博弈



                                      Part.5


                                      自主 2.0:规模经济的追求

                                        论文:Autonomy 2.0: The Quest for Economies of Scale
                                          地址:https://arxiv.org/pdf/2307.03973.pdf

                                            随着过去十年中机器人技术和人工智能技术的进步,我们已经进入了自主机器时代。在这个新的信息技术时代,自主机器,如服务机器人、自主无人机、送货机器人和自动驾驶车辆,而不是人类,将提供服务 [1]。自主机器的崛起承诺彻底改变我们的经济。然而,在经过了十多年的密集研发投资之后,自主性仍然没有兑现其承诺 [2]。

                                              在本文中,通过检查数字经济的技术挑战和经济影响,我们认为从技术角度来看,可伸缩性是非常必要的,并且从经济角度来看具有显著优势,因此是自主产业充分发挥其潜力的关键。然而,当前的发展范式,被称为自主 1.0,与工程师的数量一起扩展,而不是与数据量或计算资源的数量一起扩展,因此阻止了自主产业充分受益于规模经济,尤其是成本不断降低的计算成本和可用数据的激增。
                                                我们进一步分析了关键的可伸缩性障碍,并解释了一个新的发展范式,被称为自主 2.0,如何解决这些问题,以大大促进自主产业的发展。



                                                Part.6


                                                  基于人工智能的框架在孟加拉实现可持续发展目标

                                                    论文:An Artificial Intelligence-based Framework to Achieve the Sustainable Development Goals in the Context of Bangladesh
                                                      地址:https://arxiv.org/pdf/2304.11703.pdf

                                                        可持续发展是实现人类发展目标的框架。它提供了自然系统提供自然资源和生态系统服务的能力。可持续发展对经济和社会至关重要。人工智能(AI)近年来受到越来越多的关注,有潜力在许多领域产生积极影响。AI通常是追求长期可持续性的一个常用组成部分。在本研究中,我们探讨了AI对可持续发展的三大支柱(社会、环境和经济)的影响,以及从中我们可以推断出AI在各种领域的影响的众多案例研究,例如农业、废物分类、智能水管理以及暖通空调系统。

                                                        此外,我们提出了基于AI的实现可持续发展目标(SDGs)的策略,这些策略对像孟加拉这样的发展中国家非常有效。我们提出的框架可以减少AI的负面影响,并促进这一技术的积极性。

                                                        关键词:人工智能,可持续发展,可持续发展目标(SDGs),框架,环境,社会,经济。


                                                        Part.7


                                                          模型与铁皮人 —— 使用大型语言模型进行 AI 对齐中的委托 - 委托代理问题的行为经济学研究

                                                            论文:Of Models and Tin Men -- a behavioural economics study of principal-agent problems in AI alignment using large-language models
                                                              地址:https://arxiv.org/pdf/2307.11137.pdf

                                                                AI对齐通常被描述为一个单一设计者与人工智能代理之间的互动,其中设计者试图确保代理的行为与其目的一致,风险仅因设计者意图的效用函数与代理的内部效用函数之间的意外不一致而产生。随着采用大型语言模型(LLMs)实例化的代理的出现,这种描述不捕捉到AI安全的基本特点,因为在现实世界中,设计者和代理之间不存在一对一的对应关系,许多代理,无论是人工的还是人类的,都有多样化的价值观。

                                                                因此,AI安全具有经济学方面的特点,而委托代理问题可能会出现。在委托代理问题中,冲突是因为信息不对称以及代理和其委托方之间的效用存在固有的不一致而产生,这种固有的不一致不能通过训练来迫使代理采用所期望的效用函数来克服。我们认为,委托代理问题背后的假设对于捕捉涉及到现实世界中预训练AI模型的安全问题的本质是至关重要的。采用经验方法来研究AI安全,我们调查了GPT模型在委托代理冲突中的响应方式。我们发现,基于GPT-3.5和GPT-4的代理在一个简单的在线购物任务中都会覆盖其委托方的目标,显示出明显的委托代理冲突的证据。

                                                                令人惊讶的是,早期的GPT-3.5模型对信息不对称的变化做出了更加微妙的行为响应,而后来的GPT-4模型在坚持其先前对齐方面更加刚硬。我们的研究结果突显了将经济学原理纳入对齐过程的重要性。



                                                                Part.8


                                                                  把它写下来:正式合同缓解多智能体强化学习中的社会困境

                                                                    论文:Get It in Writing: Formal Contracts Mitigate Social Dilemmas in Multi-Agent RL
                                                                      地址:https://arxiv.org/pdf/2208.10469.pdf

                                                                        多智能体强化学习(MARL)是一种用于训练在共同环境中独立行动的自动系统的强大工具。然而,当个体激励和群体激励分歧时,它可能导致次优行为。人类在解决这些社会困境方面表现出了出色的能力。在MARL中,要在自私的代理人中复制这种合作行为仍然是一个开放性问题。在这项工作中,我们借鉴了经济学中的正式合同概念,以克服MARL中代理人之间激励分歧的问题。

                                                                        我们提出了对马尔可夫博弈的增强,其中代理人自愿同意在预先指定的条件下进行绑定的状态相关奖励转移。我们的贡献是理论性的和实证性的。首先,我们展示了这种增强可以使所有完全观察到的马尔可夫博弈的次优子博弈均衡展现出社会最优的行为,前提是合同空间足够丰富。接下来,我们将博弈论分析与在合同增强上运行深度强化学习的实验相结合,针对各种社会困境。我们讨论了在合同增强中学习时的一些实际问题,并提供了一个可导致高福利结果的训练方法,即多目标合同增强学习(MOCA)。

                                                                        我们在静态的单次移动游戏以及模拟交通、污染管理和共用资源管理的动态领域中测试了我们的方法。



                                                                        Part.9


                                                                          人工智能和双重合同

                                                                            论文:Artificial Intelligence and Dual Contract
                                                                              地址:https://arxiv.org/pdf/2303.12350.pdf

                                                                                随着人工智能算法在最近取得的巨大进步,人们希望算法将很快在各个领域,如合同设计等,取代人类决策者。我们通过实验研究了由人工智能(多智能体Q学习)驱动的算法在双主体-代理人问题的双合同模型中的行为,分析了可能的后果。我们发现,这些人工智能算法可以自主学习设计激励相容的合同,而无需外部指导或彼此之间的通信。我们强调,由不同人工智能算法驱动的主体可以进行混合和竞争等混合和总和行为。

                                                                                我们发现,更智能的主体往往会变得合作,而较不智能的主体会内生地变得短视并倾向于竞争。在最优合同下,通过主体之间的串通策略维持了对代理人的更低的合同激励。这一发现对于主体异质性、合同参与的玩家数量的变化以及各种形式的不确定性都具有稳健性。

                                                                                  JEL分类:D21,D43,D83,L12,L13
                                                                                    关键词:人工智能,双重合同,委托代理问题,AI对齐。



                                                                                    Part.10


                                                                                    多智能体强化学习中的紧急交换行为

                                                                                      论文:Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning
                                                                                        地址:https://arxiv.org/pdf/2205.06760.pdf

                                                                                          人工智能的进步通常源于开发新环境,将现实世界的情况抽象成便于进行研究的形式。本文提供了一个基于基础微观经济学思想的环境,为这样一个环境作出了贡献。在这个环境中,代理人学会在一个空间复杂的世界中生产资源,彼此进行交易,并消费他们更喜欢的资源。我们展示了新出现的生产、消费和定价行为如何根据微观经济学中供求变化的预测方向响应环境条件。我们还展示了一些设置,其中代理人对商品的新出现价格在空间上变化,反映了商品的地方丰富程度。价格差异出现后,一些代理人随后发现了在不同价格地区之间运输商品的一个领域,这是一个有利可图的策略,因为他们可以在便宜的地方购买商品,然后在昂贵的地方出售。

                                                                                          最后,在一系列消融实验中,我们研究了环境奖励、交易行为、代理人架构和能力以及消费可交易商品的选择如何在促进或抑制经济行为的出现方面发挥作用。这项工作是一个研究计划中环境开发部分的一部分,该计划旨在通过模拟社会中的多智能体互动来构建类似人类的通用人工智能。通过探索哪些环境特征需要从学习中自动出现基本的微观经济现象,

                                                                                          我们得出了一个与以前的多智能体强化学习研究不同的环境,具有多个维度的差异。例如,该模型包括不同的口味和身体能力,并且代理人之间进行协商作为一种基于实际的通信形式。为了进一步推动这方面的工作,我们将作为Melting Pot套件的一部分发布该环境的开源实现。




                                                                                          end



                                                                                          📢 AI-Agents前沿观察站




                                                                                          AI-Agents前沿观察站是一个围绕AI-Agents这一方向进行前沿探索与观察的社群,随着更多Agents项目开源,近期也将展开更多的商业合作,以及具有建设性的主题交流,符合以下四个身份的朋友可申请加入:

                                                                                          1,AI-Agents的应用开发者 
                                                                                          2,LLM算法工程师;
                                                                                          3,学术研究者;
                                                                                          4,AI-Agents技术背景出身的创业者;

                                                                                          *这是一个具有学术研究到工程应用落地的社区,兴趣爱好者勿扰。

                                                                                          请加微信Z10850,备注:AI-Agents,(申请加群请做自我介绍,谢谢)

                                                                                          近期会议 》》

                                                                                          VION WILLIAMS
                                                                                          推动人类文明的进步与发展
                                                                                           最新文章