直播预告 | Fluid 双周会 -- Fluid 在大模型缓存加速的云产品实践研讨交流

文摘科技 2024-11-05 10:12 江苏

—

背景介绍

当前AI大模型的应用如火如荼，生文、生图、生视频的场景遍地开花，但随之而来的是模型体积越来越大，将模型从仓库部署到分布式架构中的时间也呈线性增长，导致推理服务的启动、模型切换效率低下，直接影响了推理服务的运营成本，也极大影响了用户获得推理结果的用户体验。火山引擎数据加速技术，将模型从仓库或存储位置缓存预热到算力近端和高速存储上，极大地加速计算端加载模型的时间，全面提升大模型应用的运行效率。本次交流将分享Fluid加速方案在云平台产品化的实践。

本期 Fluid 双周会(2024 年 11月 5 日 16 : 30)，将首先由火山引擎的范捷惟工程师介绍分享Fluid 在大模型高效加载应用场景的实践，然后组织相关技术在线交流研讨。

如果你对相关内容感兴趣，欢迎参加本期 Fluid 双周直播。

—

直播信息

具体参会信息如下：

Meeting Application: 钉钉视频会议

Meeting Link: https://meeting.dingtalk.com/j/L0m15vPelBV

Meeting Id: 396 929 6542

Time: 16:30 p.m. Tuesday, Nov. 5, 2024

Time zone: Beijing, Shanghai

Language: Simplified Chinese

👇👇 戳原文，直达会议链接！

http://mp.weixin.qq.com/s?__biz=Mzg5MTU3NzAyNg==&mid=2247484067&idx=1&sn=9960397aa987b074405bf3e453a57b6b

Fluid开源项目

Fluid开源项目官方社区，欢迎投稿留言，https://github.com/fluid-cloudnative/fluid

直播预告 | Fluid 双周会 -- Fluid 在大模型缓存加速的云产品实践研讨交流

直播预告 | Fluid 双周会 -- Fluid 在聚宽公司量化投资研究云平台的应用实践

聚宽揭秘：为什么量化研究员喜欢在Kubernetes上使用Fluid简化数据管理？

直播预告 | Fluid 双周会 —— Fluid 进度报告功能设计分享

Fluid双周会—Fluid动态缩容能力的调研分享

直播预告 | Fluid 双周会 -- Fluid 联手 OCM 打造多集群AI应用分发技术方案分享

直播预告 | Fluid 双周会 -- Fluid 1.1版本的规划

直播预告 | Fluid 双周会 -- Fluid v1.0 新功能特性介绍

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉