自动驾驶量产相关学习资料整理！

文摘 2024-10-23 10:42 中国香港

点击下方卡片，关注“自动驾驶之星”

这里有一群奋斗在自动驾驶量产第一线的小伙伴等你加入

1: 端到端自动驾驶 VS 模仿学习

就目前来看只靠模仿学习来做端到端自动驾驶的方案存在着先天的不足。

在这里给大家推荐一个帖子有关模仿学习局限性的探讨。https://zhuanlan.zhihu.com/p/717288142。当然也有两篇最新的内容HE-Drive, 和Hydra-MDP。关于这两篇论文的详细解读已经上传到自动驾驶之星知识星球！

2:扩散模型入门资料

在自动驾驶和具身智能领域，扩散方法正逐渐成为提升系统性能和智能体交互能力的关键技术。

自动驾驶感知任务

自动驾驶系统依赖于精确的感知能力来理解其周围环境。扩散模型，通过模拟数据生成的随机过程，已被证明在处理多传感器融合数据、3D目标检测和基于BEV（鸟瞰视角）的语义分割等任务中非常有效。例如，DifFUSER模型结合了扩散模型和3D目标检测器，有效缓解了小目标和遮挡问题，提升了BEV感知的性能。

具身智能的感知与交互

具身智能体需要全面感知环境并理解物理世界的规律，以便更自然地与人类互动并可靠地执行任务。扩散模型通过模拟和逆向扩散过程，有助于具身智能体在物理或虚拟环境中进行感知、理解和导航，从而提升其交互能力。

仿真平台的构建

具身智能仿真平台对于智能体的训练和评估至关重要。扩散模型可以在仿真平台中生成逼真的环境和交互场景，提供用于训练和评估的数据，以及算法比较的标准化基准。这些仿真环境需要考虑环境的物理特性、对象的属性及其相互作用，扩散模型能够提供这样的逼真模拟环境。

处理特殊数据类型

扩散模型在处理特征集中在低密度区域的非常规数据或样本量较少的情况时，展现出了优化和适应性研究的显著进展。通过在每个时间步引入额外的分类器来优化采样过程，扩散模型能够更有效地在低密度区域生成高质量的样本。

提高生成质量和效率

扩散模型通过各种创新方法优化时间步长和采样过程，减少所需的采样步骤并加快模型的生成速度。例如，通过引入对角和完全协方差来优化时间步长，显著提升了DDPM生成效率的同时保持了生成样本的质量。

降低KL散度

在降低KL散度以优化反向去噪过程方面，扩散模型通过动态规划算法融入模型中，实现了对反向去噪过程的优化。这种方法允许模型在保持生成质量的同时，找到最优的推理路径，提升了推理过程的效率和效果。

扩散方法在自动驾驶和具身智能中扮演着重要角色，它通过生成高质量的数据样本，提高感知任务的性能，增强与环境的交互能力，并在仿真平台构建中提供逼真的模拟环境。同时，扩散模型还在处理特殊数据类型、提高生成质量和效率、降低KL散度等方面展现出了显著的研究进展。随着技术的不断进步，我们期待扩散方法在未来的自动驾驶和具身智能领域发挥更大的作用

扩散方法将会在自动驾驶和具身智能中发挥着重要的作用。在此给大家推荐一下吴恩达老师出的扩散模型的入门视频，并配有代码！

综述：扩散模型（Diffusion Models）的应用全景及发展方向

首个以人类行为端对端自动驾驶系统HE-DRIVE：基于扩散模型实现OpenScene轨迹规划最新SOTA

3: 提示工程入门视频

提示工程（Prompt Engineering）是一门新兴的学科，它关注于如何有效地设计与优化提示词（Prompt），以便在不更新模型权重的情况下，引导大型语言模型（LLM）产生期望的输出结果。这项技术在不同的模型之间可能存在显著差异，因此需要大量的实验和探索。

提示工程的核心在于理解并利用大型语言模型的内部机制，通过精心设计的输入提示来影响模型生成文本的概率分布。这些提示词可以看作是语义特征的显式表达，它们在限定领域内可能存在一些通用的表达方式。提示工程的效果在不同模型间可能有很大差异，因此需要大量的试验和启发式方法来优化提示词。

在实际应用中，提示工程可以帮助改善大语言模型的性能，特别是在自然语言处理任务和生成性任务中，如文本生成、答案生成、文章写作等。基本方式包括Zero-shot Prompting和Few-shot Prompting。Zero-shot Prompting涉及将任务输入模型，而不提供任何示例来表明所需的输出。Few-shot Prompting则是通过提供少量高质量的示例，包括目标任务的输入和期望输出，帮助模型更好地理解人类意图和生成准确输出的标准。

总的来说，提示工程是与大模型交互的重要方式，它通过精心设计的提示词来引导模型的行为，以达到期望的输出结果。随着大模型技术的不断进步，提示工程在AI领域的应用将越来越广泛。

视频链接：https://www.youtube.com/watch?v=J2lQSe4hcLM

以上更多的详细的内容欢迎大家关注自动驾驶之星和生成式AI 与具身智能知识星球！

自动驾驶之星和生成式AI与具身智能知识星球，新人优惠券来袭，结识一群志同道合的小伙伴一起成长。

下一个风口会不会是生成式AI 与具身智能的时代，我们特意创建了生成式AI与具身智能交流社区，关于大模型，机器人的相关业界动态，学术方向，技术解读等等都会在社区与大家交流，欢迎感兴趣的同学加入我们(备注具身智能)！

自动驾驶之星知识星球主打自动驾驶量产全技术栈学习，并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括端到端大模型，VLM大模型，BEV 障碍物/车道线/Occ 等的学习资料！

生成式AI与具身智能知识星球，我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容，本知识形象并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括生成式AI大模型，具身智能，业界资料整理等的学习资料！

自动驾驶之星是面向自动驾驶&智能座舱量产向相关的交流社区，欢迎大家添加小助手加入我们的交流群里，这里有一批奋斗在量产第一线的小伙伴等你的加入！

👇点个“赞”和“在看”吧

http://mp.weixin.qq.com/s?__biz=MzkzMjY1MDI0OQ==&mid=2247487072&idx=1&sn=a51786581e9371443550614786f2e972

自动驾驶之星

自动驾驶之星，是一个以自动驾驶\x26amp;智能座舱量产交流为主的社区。这里有自动驾驶\x26amp;智能座舱量产第一线的前沿动态，有一群奋斗在自动驾驶\x26amp;智能座舱量产第一线的小伙伴在分享他们的量产经历。期待你的加入！希望每个人在这个浪潮中都能成为自动驾驶之星！

最新文章

某合资主机厂研发中心裁员

为何机器人难以打通「任督二脉」？

20 多家端到端自动驾驶企业/研究机构方案盘点（2）理想、地平线、元戎启行

20 多家端到端自动驾驶企业/研究机构方案盘点（1）tesla、小鹏汽车、零一汽车

PointLLM：使大型语言模型能够理解点云

大模型SFT暗藏大陷阱？梯度累计bug造成大范围影响

小鹏AI日的「9点必读」：机器人比车难做10000倍

端到端量产论文精选！

智驾公司中层leader的生存之道

智能座舱：能不能把今天的内卷，变成明天的诗和远方？

介绍一种transformer稀疏神经网络的硬件加速器算法

特朗普上台对中国汽车行业的影响：自动驾驶与芯片行业的双重挑战

VLM大模型在自动驾驶领域的创新应用--2024 年 PRCV 自动驾驶挑战赛冠军解决方案

华为李大锋：数字钥匙的安全与体验-华为数字钥匙方案介绍|2024车身电子技术论坛（11月14日，上海）

这些年我们一起追过的自动驾驶端到端范式！

"35岁程序员"在自动驾驶赛道的悲哀：职业发展的困境与挑战

具身智能的前景如何？是否适合读博？

自动驾驶的明日之星：世界模型带来的革新与挑战

自动驾驶赛道的挑战与机遇：裁员与业务缩减背后的故事

快手 Kuaishou AI 全景解析

小鹏「端到端」及「纯视觉」的法宝，终于一次说清了

【自动驾驶之星社区】上海线下大模型活动圆满落幕 —— 探索自动驾驶的新边界

1024，致敬那些改变世界的代码诗人

Open3DTrack 面向开放词汇的3D多目标跟踪 !

自动驾驶之星社区一周经典内容整理！

「AI 汽车大战」的三个真相

我们回来啦！自动驾驶之星社区大模型线下活动（10月26号上海）报名开始啦！

传小马智行即将公开申请IPO，赴美上市迈出关键一步

自然资源部审图中心副主任：智能驾驶测绘的安全隐患

大模型SFT暗藏大陷阱？梯度累计bug造成大范围影响

工作的意义是什么？

首个以人类行为端对端自动驾驶系统HE-DRIVE：基于扩散模型实现OpenScene轨迹规划最新SOTA

魔视智能获新一轮融资，或为IPO做准备

开源SOTA项目Voxel-SLAM：完整、精确且多功能的激光雷达-惯性SLAM系统

如何快速将特斯拉3D感知移植到擎天柱？有可能只需要HeightFormer

高阶智驾平权时代，BEV+Transformer架构或成必杀技？

视频生成和具身智能强强联合！谷歌&卡内基梅隆&斯坦福发布Gen2Act：泛化超棒！

自动驾驶之星社区大模型线下活动报名开始啦！（10月26号上海）我们回来啦！

自动驾驶之星社区一周经典内容整理！

Tesla We Robot发布会总结

全面了解端到端自动驾驶的研发现状、挑战与策略应对（二）

自动驾驶量产经验整理！

百度汽车云3.0 ，为端到端自动驾驶量产落地提速

大模型入门笔记整理记录

地平线通过港交所上市聆讯，即将IPO

全面带你了解端到端大模型的底层逻辑（一）

大模型中LLM训练技巧(干货满满！！)- SFT

【论文日报合集】英伟达开源MaskLLM剪枝技术，显著降低LLM推理成本

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

自动驾驶量产相关学习资料整理！

自动驾驶感知任务

具身智能的感知与交互

仿真平台的构建

处理特殊数据类型

提高生成质量和效率

降低KL散度