首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

云计算与大模型训练的结合

文摘 2024-12-26 07:01 美国

点击下方卡片，关注“Ai fighting”公众号

“ 我们要学会使用第三方的大模型平台，而不是什么都从0开始 ”

大模型从出现以来，其巨大的成本问题一直都是压在很多企业头上的一座山；但大模型作为一项基础设施，理论上应该和现有的基础设施相结合，比如说云计算平台。

根据云计算的思想，除了实现快速部署迁移以及庞大的网络洪峰之外；其次最重要的一点就是提升资源的利用率；比如对很多公司来说，流量洪峰主要都集中在某些时间段，大部分时间的流量都比较平稳。

因此，如果按照最高峰值部署服务器，那么就会造成巨大的浪费；因此，云计算的用武之地就出现了；因为云计算快速动态扩/缩容的机制，导致其能够更好地利用空闲资源。

云上的大模型

大模型由于其巨大的体量，以及参数和数据；对一家企业来说，要想设计训练出一个属于自己的模型，就需要购买大量的算力资源——也就是GPU。

但GPU的价格问题使得企业面临着巨大的成本压力；因此，购买或租用别人的算力，就成了一个比较好的选择。在需要算力的时候就租用别人的算力，再不需要的时候就可以把算力给释放掉；这样既节省了成本，也提升了资源的利用率。

而由于云计算的诸多特性，比如快速扩容，集群，调度等等；使得把大模型搬到云上就是一个很好的选择。

欢迎加入自动驾驶实战群

今天在看腾讯云平台的时候，发现其提供了大量与大模型训练，微调，部署相关的功能；其不但提供了算力支持，同时还封装了很多与大模型训练，微调，部署相关的工具包，加速器等工具。

其上不但可以部署自定义的大模型，而且其官方还提供了大量的预制基础模型镜像；用户可以通过这些镜像做上层的训练与部署开发。

如上图所示，这种功能大大降低了大模型的训练和微调成本；不但是资金成本，同样还包括技术成本；因为其封装了大量的基础功能，只需要通过简单的命令或API以及SDK集成即可使用。

这种方式，不但降低了企业的使用成本，对于对大模型技术感兴趣的个人技术人员，或者学习大模型技术的人；也同样让他们有机会设计和训练部署属于自己的大模型。

当然，提供这种云上大模型服务的企业不仅仅腾讯一家；国内还包括阿里，华为等多家云服务商；而国外包括微软，谷歌等都提供了类型的功能模块，方便大家使用。

因此，特别是对一些大模型应用领域的创业者来说，这种云上模型解决了底层模型的很多问题，节省了大量的时间；使得创业者可以专注于自己的产品和功能实现；而不用把大量的时间浪费在大模型的底层架构上。

所以说，对企业和创业者来说，一定要弄清楚自己的定位；到底是想做技术，还是做产品，还是做服务；不同的定位，需要关注不同的技术点和业务环节。

因此，随着社会的发展，社会分工变得越来越细；每个人都应该找准自己的定位，然后深入的钻研下去；而不是在不同的领域里反复横跳。

最后别忘了，帮忙点“在看”。

您的点赞，在看，是我创作的动力。

AiFighing是全网第一且唯一以代码、项目的形式讲解自动驾驶感知方向的关键技术。

长按扫描下面二维码，加入知识星球。

全网第一且唯一分享自动驾驶实战，以代码、项目的形式讲解自动驾驶感知方向的关键技术，从算法训练到模型部署。主要致力于3D目标检测，3D目标追踪，多传感器融合，Transform，BEV，OCC，模型量化，模型部署等方向的实战。

最新文章

华中科技/地平线联合提出 DiffusionDrive: 端到端自主驾驶的截断扩散模型！

CES2025，Nvidia主题演讲

东北大学提出4D时空激光语义分割网络4D-CS:实现nuscenes上最新SOTA

AI应用开发系列 3-掌握Prompt写作技巧，让AI提效百倍

华为/上交通联合提出 MSSIDD:多传感器去噪基准，移动摄像头去噪模型可迁移性评估的新视角！

智能座舱缘何成为自动驾驶的“宠儿”？

北航/新加坡国立大学/华中科技提出自动驾驶视觉语言模型的视觉对抗攻击！

人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望

第四届全球自动驾驶峰会1月14日在北京举办

3D视觉理解GPT4Scene：通过视觉-语言模型从视频中理解3D场景

澳门大学提出TiGDistill-BEV: 通过目标内几何学习蒸馏实现多视角BEV 3D物体检测

激光雷达会被智能汽车抛弃吗？

多模态学习关键技术深度综述：多模态标记、骨干模型架构、统一任务表示、数据与评估、挑战与趋势

2024国产人形机器人一览 1

端到端自动驾驶技术研究与分析

GB200机架供应链优化，GB200延期及GB300进展

武大/中科院/悉尼科技大学/牛津大学/西交大共同提出 DriveMLLM : 自主驾驶中多模态大语言模型的空间理解基准！

汽车产业的AIGC革命：重塑未来出行

MambaDETR: 基于查询的时间建模，使用状态空间模型进行多视图 3D 对象检测 !

大模型语义分析之嵌入(Embedding)模型

南京邮电&南京理工提出URoadNet：使用双重稀疏注意力用于多尺度道路网络提取

云计算与大模型训练的结合

华中科技大学提出端到端跨视图引用式多目标跟踪方法CRTracker

怎么提升向量数据库的召回准确率

哈尔滨工业大学提出MR-GDINO: 杜绝遗忘的高效的开放世界物体检测

YoloV8改进策略：卷积篇|CGAFusion，增强模型对特征的提取能力|附代码|即插即用

DriveGPT实现Waymo最佳预测: 扩展自回归行为模型在自动驾驶中规划与预测

AI突破：单图生成3D世界，GenEx重塑具身智能探索格局！

什么是相似性搜索？大模型的底座技术

智驾与底盘争抢的车身控制，你真的了解吗？

端到端自动驾驶技术研究与分析

基于Transformer架构的扩散模型

台湾大学 & 英伟达提出 SAM4MLLM 用于指代表达式分割的增强多模态大语言模型！

智能汽车嘚啵嘚 --- 智能座舱第八稿：智能座舱数字钥匙

华中科技 & 北航 & 清华 & 上海 AI Lab 提出 BIG.LITTLE Transformer ，用于高效视觉识别！

ChatGLM: 从GLM-130B到GLM-4的系列大型语言模型

全栈量产智驾应用算法在C1200家族芯片上的部署 | 研讨会回顾

大模型推理序列并行

SimpleBEV: 改进的LiDAR-摄像头融合架构用于3D目标检测！

端到端机器人学习的空间视觉感知（北大&哈佛）

什么是具身智能？自动驾驶是具身智能吗？

大模型推理加速与KV Cache（一）：什么是KV Cache

LsSInst: 改进基于 LSS 的 BEV 感知中的几何建模与实例表示 !

想了解AI大模型？你就不得不了解一下并行运算的始末

清华大学&加州大学发布流式密集4D重建模型Driv3R: 无需全局对齐实现15倍的推理提升

Yolo11改进策略：上采样改进|CARAFE，轻量级上采样|即插即用|附改进方法+代码

汽车产业的AIGC革命：重塑未来出行

使用大模型实现一个聊天机器人思路以及困难点

单目3D 目标检测的高效特征聚合和尺度感知回归！

一文读懂多模态大模型：LLaVA系列 | 从图像到视频内容理解的进化之路

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉