基于大模型交通事故分析能力,研究人员揭开交通事故背后新秘密

科技   2024-11-04 17:35   北京  



在当今交通安全日益受到重视的背景下,研究者们开始探索如何利用先进的人工智能技术来改善交通事故的分析与预防。


近期,一项基于大型语言模型(LLMs, Large Language Models)的研究引起了广泛关注。


来自美国佐治亚大学的一支研究团队借助链式思维(CoT, Chain-of-Thought)和领域知识提示工程(DKPE, Domain-Knowledge Prompt Engineering)技术,深入分析了交通事故的严重程度,为传统交通安全研究提供了新的视角和方法。


目前,相关论文以《利用具有思路链和快速工程的大型语言模型进行交通事故严重程度分析和推理》(Leveraging Large Language Models with Chain-of-Thought and Prompt Engineering for Traffic Crash Severity Analysis and Inference)为题发表在 Computers 上 [1]。


佐治亚大学土木环境工程专业的博士生甄皓是第一作者,Jidong J. Yang 教授担任通讯作者。


图|相关论文(来源:Computers


交通安全仍然是全球面临的重大挑战。尽管近年来在车辆安全、道路设计和交通政策方面取得了一定的进展,交通事故的发生率依然令人担忧。


各种因素如驾驶员行为、环境条件、车辆特性以及道路设计等,共同影响着事故的严重程度。理解这些复杂的因果关系对于降低事故带来的损害至关重要。


然而,传统的统计学和计量经济学方法在交通安全领域的应用却存在一些明显的局限性。


这些方法通常依赖于结构化数据,难以处理非结构化的文本信息,尤其是随着事故报告中越来越多的文字描述信息被记录,如何有效利用这些非结构化叙述数据成为研究的新挑战。


自然语言处理(NLP,Natural Language Processing)技术的快速发展为此提供了新的解决方案,使得研究者能够更深入地挖掘交通事故背后的信息。


在此背景下,甄皓所研究的核心问题便是:大型语言模型能否处理复杂的交通事故数据,并提供有效的分析和推理。


为此,他决定评估三种先进的 LLMs(GPT-3.5-turbo、LLaMA3-8B 和 LLaMA3-70B)在交通事故严重程度分析中的能力,将此任务视作一个分类问题。


通过比较提示工程和链式思维对模型推理效果的提升,他和所在团队希望探寻 LLMs 在该任务中的最佳表现。


图|文本叙述生成(来源:Computers


在实验中,甄皓还关注了 LLMs 在零样本和少样本学习场景下的适应能力。


一方面,这对于评估模型在缺乏大量标注数据情况下的表现至关重要。另一方面,他们希望通过强大的预训练能力,突破传统方法在数据有限情况下的局限。


此外,通过 CoT 技术,他们能够深入理解模型在推理过程中考虑的各类因素,如环境条件、驾驶员行为和车辆特征等。


值得注意的是,审稿人对这项研究的评价非常积极,认为这项研究首次将先进的 LLMs 应用于交通事故严重程度分析,成功结合了 AI 前沿技术与传统交通安全研究,开辟了新的研究方向。


并认为本次研究展示了不同模型在该任务中的能力与局限性,有助于更深入理解模型表现。


特别是在交通事故后果推理过程中,通过 CoT 生成的推理过程,课题组提供了对 LLMs 决策过程的可解释性,这对提升模型在实际应用中的可信度非常重要。


展望未来,这项研究的成果具有广泛的应用前景。


首先,在事故分析与研究方面,交通研究机构可以通过这一技术对历史交通事故数据进行深入分析,从中提炼出影响事故严重程度的关键因素,推动交通安全研究进展。


政府和学术界可以利用这一工具预测不同交通条件下的事故发生模式,并优化交通基础设施设计,从而降低事故发生率。


其次,结合 LLMs 与交通管理平台,可以实现交通事故报告和数据的实时分析,识别高风险路段及事故诱因,协助交通管理部门采取预防措施,以减少事故的发生。


同时,政府部门可以利用该技术制定数据驱动的交通安全政策,例如在高危时段或地点部署更多的交通控制措施。


在事故发生后,相关部门也能够借助这一技术快速分析事故严重程度,确定最优的应急响应措施,以缩短事故处理时间、减轻事故影响。


此外,保险行业同样能从中受益,保险公司可以利用 LLMs 分析事故报告,自动评估事故严重程度,快速判定理赔金额,从而提高理赔效率。


图|碰撞严重程度推理任务模型性能(来源:Computers


据介绍,从研究起步到完成成果,经历了多个阶段。甄皓从前期对交通安全因果关系的探索开始,逐渐认识到多模态数据的应用潜力。


在以往的研究中,他和所在团队已经设计了一种多模态深度学习模型,通过同时利用结构化数据与非结构化文字数据来进行交通事故严重性分析,取得了显著的成果。


此后,课题组的研究便在此基础上进一步深入,探索如何通过 LLMs 改善交通事故分析。


在研究过程中,甄皓表示自己也遭遇了一些挑战。其中,最让他们印象深刻的是解决图形处理器(GPU,Graphics Processing Unit)故障的过程。


当实验进行到关键阶段时,GPU 的故障几乎让实验停滞不前。尽管尝试了常见的解决办法,最终还是需要将硬件寄回维修。


甄皓说道,作为一名非计算机专业的学生,这一过程无疑增加了许多难度。然而,正是这种技术问题的解决,让他深刻认识到科研过程中的复杂性和应对挑战的决心。


未来,甄皓计划继续在此领域深入探索。他和同事希望通过引入更先进的技术手段,进行有针对性的微调,进一步增强模型的推理能力与实际应用的匹配度。


具体而言,他们将进行监督微调,通过使用专家标注的高质量数据对模型进行再训练,以优化模型的预测能力,并使其更好地对齐人类的偏好。


通过这种方式,他们希望将 LLM 模型的推理过程更加贴近实际场景中的需求,尤其是在处理交通安全领域复杂文本数据时,展现出更强的适应性和决策能力。


此外,其还计划在更大规模的多样化数据集上进行实验,以验证微调后的模型在不同应用场景中的泛化能力。


而当问起甄皓的学历路程,他说:“从本科到博士的学习经历中,我在多个不同的领域进行了探索,每个阶段都充满了挑战和收获。”


图 | 甄皓(来源:甄皓)


其表示,自己于 2014 年进入华北电力大学北京校区,攻读新能源科学与工程的学士学位。


在硕士阶段,甄皓考取了技术经济及管理方向的研究生,参与了多个与电网相关的研究项目。这一转变让他扩展了学术视野,并提供了丰富的项目管理和跨学科合作机会。


在研究生的第二年,他在师姐的帮助下开始涉足能源管理与预测的科研工作,并撰写了一些论文。


回忆在申请博士学位的过程中,甄皓说自己经历了一个挑战性的阶段。在全球疫情的影响下,考点关闭、考位稀缺的情况下,尽管没有参加任何辅导班或依靠中介机构,他依然能够一次性通过研究生入学考试(GRE,Graduate Record Examination)和托福考试,成功申请到了多所高校,这一过程极大提升了他的信息搜集和自主学习能力。


2021 年,甄皓进入佐治亚大学攻读土木环境工程(交通工程方向)的博士学位,并担任研究助理。在这一阶段,他进一步拓宽了研究方向,积极参与车辆控制、交通安全和交通公平性等领域的研究。


目前,他的研究主要集中在智能交通、交通安全、公平性和交通规划等方面,旨在发现并解决这些领域中的新问题,并通过新技术推动学术和应用的边界。


参考资料:
1.Hao Zhen, Yucheng Shi, Yongcan Huang, et al. Leveraging Large Language Models with Chain-of-Thought and Prompt Engineering for Traffic Crash Severity Analysis and Inference. Computers 2024, 13, 232. https://doi.org/10.3390/computers13090232

运营/排版:何晨龙





01/ 水也能用来造芯片?科学家用液态水分子制备神经网络计算芯片,或为AI计算提供新方向


02/  哈佛团队开发类ChatGPT的AI病理模型,诊断19种类型癌症准确率近94%,为癌症诊疗提供新工具


03/ 动物模型血糖被控长达一天,浙大团队制备口服胰岛素制剂,小鼠连续给药7天未出现低血糖


04/可同时用于塑料降解与绿色制氢?科学家制备单原子铁催化剂,有望减少依赖传统化石燃料


05/ 科学家发现新型自由基聚合模式,开发功能化聚烯烃材料,或可突破扩链剂进口依赖




DeepTech深科技
DeepTech 是一家专注新兴科技的资源赋能与服务机构,以科学、技术、人才为核心,通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块,推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。
 最新文章