2025年1月8日,美国国土安全部(DHS)发布《公共部门生成人工智能部署手册》,旨在帮助联邦、州和地方政府官员负责任地使用生成式人工智能(GenAI)技术,以改善公共服务。该手册基于DHS试点项目的案例研究,展示了GenAI在加强调查线索、制定灾害缓解计划和创新移民官员培训中的应用。手册提供了公共部门组织推进GenAI使用的七类可行步骤,涵盖政策、技术和行政方面:开发增强任务的GenAI用例、建立联盟和促进有效治理、利用工具和基础设施、负责任和安全地使用AI、衡量进度和定义成功、培训员工和聘用技术人才,以及寻求用户反馈。例如,组织应将GenAI部署与优先任务相结合,并确定试点范围以改进特定流程。国土安全部部长Alejandro Mayorkas强调,安全利用GenAI潜力需要政府、行业、学术界和民间社会的合作,呼吁培育负责任、以使命为中心的创新文化。
部署指南
任务增强型GenAI用例:组织应确保GenAI部署与其任务对齐,并设计试点项目以支持任务增强型流程。试点项目应解决特定问题,并在成功后考虑扩展到其他部门或流程。
联盟建设和有效治理:从最高领导层获得支持,并建立跨组织联盟以监督GenAI部署。评估现有治理结构,并考虑创建新的治理机构以应对AI治理。
工具和基础设施:评估现有的技术工具和基础设施,以确定它们是否适合GenAI的需要和目标。考虑使用商业、开源或开放权重模型,并评估是否需要额外的工具或配置。
负责任的使用和可信度考虑:从一开始就优先考虑负责任和可信的AI使用,并建立组织对“负责任”和“可信”的共同理解。明确沟通GenAI的局限性和风险,并制定明确的组织指导原则和最佳实践。
测量和监控:确定或开发定性和定量指标,以反映GenAI试点项目的目标。确保必要的基础设施(如仪表板)到位,以监控这些指标,捕获相关数据,并向内部利益相关者传达试点项目的进展。
培训和人才招聘:为员工提供GenAI使用的培训,帮助他们发展基本的技术技能。确定必要的技术技能,并评估组织中是否已存在这些技能。考虑招聘能够支持GenAI开发的技术人才。
可用性测试和其他反馈机制:在GenAI试点生命周期的开始,识别相关用户,并在整个开发过程中定期进行可用性测试。与用户和其他利益相关者进行双向沟通,以获得反馈并分享更新。
风险管理
风险识别:识别潜在风险,包括幻想/幻觉、隐私侵犯、歧视、数据偏见、对公民权利和自由的威胁、物理安全和数据安全。评估现有政策和监管框架对GenAI使用的适用性,并在必要时制定明确的组织指导原则和最佳实践。
风险缓解:与法律、隐私、公民权利和自由以及网络安全专家合作,以解决开发过程中的负责任使用考虑。对所有GenAI工具进行测试,并在必要时回滚开发工作。定期进行风险识别、缓解和补救措施,并将其用于改进政策和跟上技术发展。
政策和监督:制定政策,明确GenAI工具的应用范围,确保其输出不是任何关键决策的唯一依据,并在使用前进行人工审查。将监督办公室嵌入部署过程中,确保GenAI试点项目符合负责任AI使用的原则。
结论
DHS的GenAI手册为公共部门组织提供了一个全面的指导框架,帮助他们在确保隐私、公民权利和自由的同时,有效地利用GenAI技术来增强其任务能力。通过详细的试点项目经验和具体的行动步骤,该手册旨在促进GenAI在公共部门的负责任和有效部署。
附:GenAI试点项目简介
试点1:加强调查线索:国土安全部调查局(HSI)利用大型语言模型(LLM)增强搜索和总结功能,提高调查报告的效率和准确性。
试点2:帮助地方政府制定灾害缓解计划:联邦紧急事务管理局(FEMA)利用LLM帮助地方政府开发全国社区的灾害缓解计划。
试点3:为移民官员创造新的培训机会:美国公民及移民服务局(USCIS)利用GenAI提供动态、个性化的面试培训,适应官员的具体需求。
参考资源
1、https://executivegov.com/2025/01/dhs-public-sector-ai-deployment-guide/
2、https://www.dhs.gov/sites/default/files/2025-01/25_0106_ocio_dhs-playbook-for-public-sector-generative-artificial-intelligence-deployment-508-signed