智能理解 PPT 内容，快速生成讲解视频

科技 2025-01-15 18:30 浙江

当我们想根据一版 PPT 制作出相对应的解锁视频时，从撰写解锁词，录制音频到剪辑视频，每一个环节都需要投入大量的时间和精力，本方案将依托于阿里云函数计算 FC 和百炼模型服务，实现从 PPT 到视频的全自动转换，将静态的 PPT 转化为动态视频。

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

适用客户

Cloud Native

期望通过 AI 技术将 PPT 转换为教学视频的在线教育机构
希望减少视频内容创作时间和成本，专注于创意构思的自媒体创作者

使用产品

Cloud Native

大模型服务平台百炼
函数计算
对象存储

架构与部署

Cloud Native

在制作线上课程、自媒体内容或者活动宣传视频时，用户通常需要撰写解说词、录制音频和剪辑视频，制作流程繁琐且周期较长。本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。

方案中涉及多种模型：视觉模型（qwen-vl-max-latest）用于理解 PPT 图文内容，快速生成与之相匹配的解说词；文本模型（qwen-plus）对解说词进行优化，提高其可读性和吸引力；语音模型（cosyvoice-v1）则根据解说词生成生动流畅的旁白音频。系统自动整合图片、文本和音频素材，将原本静态的 PPT 转化为结构严谨、过渡自然的动态视频。整个过程高度集成化，用户只需进行简单的几步操作，即可轻松实现从 PPT 到视频的转换。

最终的运行环境将与下图展示的架构相似。

本方案的技术架构包括以下云服务：

函数计算 FC：用于部署应用程序。
对象存储 OSS Bucket：用于存储从 PPT 文件中分解出的每一页图片。
大模型服务平台百炼：提供视觉模型、文本模型和语音模型服务，用于解说词创作、解说词优化和语音合成。

部署应用

1. 请点击前往部署^[^1]打开我们提供的函数计算应用模板，参考下表进行参数配置，然后单击创建并部署默认环境。

项目	描述	示例值
部署类型	部署方式。	直接部署
应用名称	自动生成。	默认
角色名称	模板所需的角色（如果需要授权，请按照控制台提示进行授权）。	默认
地域	FC部署地域。	默认华东1（杭州）
对象存储-存储桶名	下拉选择Bucket 名称。	ppt2video-test
百炼API-KEY	百炼API-KEY。	部署资源中获取的百炼 API-KEY
RAM角色ARN	函数计算访问对象存储OSS服务时使用的函数角色。	如果提示您当前选择的应用还需要额外一些权限，请单击前往授权。

2. 应用部署成功后如下图所示。

应用体验

1. 应用部署完成后，可以在环境详情的环境信息中找到示例网站的访问域名。

2. 点击访问域名，即可打开示例应用。

3. 鼠标移动到示例 1，然后单击使用该示例。

4. 当 PPT 被分解成图片后，点击生成解说词（文本理解）按钮，视觉模型将依次分析每一张图片，并为对应的页面创建解说词文案。文本模型会对生成的解说词进行润色，确保表达自然流畅且易于理解。

说明：点击生成解说词按钮右侧的下拉图标，可以选择文本理解或者深度理解。

文本理解：主要根据文字生成解说词，若配图关联度低则不予考虑。
深度理解：深入理解并分析 PPT 中呈现的架构图、流程图等视觉信息，解读其含义与逻辑关系。

5. 双击解说词区域可直接编辑当前页面的解说词。编辑完成后，只需点击页面其他任意位置即可自动保存更改。

6. 旁白音频提供了两种不同的内置音色供您选择。

7. 点击生成视频按钮，系统会根据解说词自动生成音频和字幕，最终和图片一起制作成动态视频。

说明：

系统将根据解说词生成音频和字幕，最后整合音频、字幕和图片合成视频。生成过程所需时间会根据 PPT 的页数有所不同，整个生成过程预计需要 5 分钟左右，请您耐心等待。
为了方便用户快速体验效果，当前应用为演示版本，体验完毕请及时释放资源。若想用于生产环境，建议下载源码：获取源码^[^2]，可以进行二次开发，同时打开登录鉴权功能。

总结

Cloud Native

至此，您已基本了解如何通过函数计算实现从静态 PPT 到动态讲解视频的全过程，更多细节以及后续清理资源，欢迎您移步官网查看详情：https://www.aliyun.com/solution/tech-solution/ai-for-ppt-to-video

相关链接：

[1] 前往部署

https://fcnext.console.aliyun.com/applications/create?template=ppt2video&deployType=template-direct&from=solution

[2] 获取源码

https://atomgit.com/aliyun_solution/ppt2video

阿里云云原生

发布云原生技术资讯、汇集云原生技术详细内容，定期举办云原生活动、直播，阿里产品及用户实战发布。与你并肩探索云原生技术点滴，分享你需要的云原生内容。

最新文章

为何最近谈论 SSE 和 WebSocket 的人越来越多了？

面对全球化的泼天流量，出海企业如何观测多地域网络质量？

函数计算×百炼新春活动正式上线！三步赢取蛇年精美好礼

基于 API 网关践行 API First 开发实践

现场领红包！通义灵码 AI 程序员给大家送福利啦

乐刻运动：基于 RocketMQ + MQTT 实现健身产业数字化升级

DeepSeek-R1 来了，如何从 OpenAI 平滑迁移到 DeepSeek

机房迁移，不同 Pod 副本请求耗时会相差数倍？

任务调度企业级场景下的新选择，兼容 XXL-JOB 通信协议

海外泼天流量丨浅谈全球化技术架构

“爆款”批量生成，如何实现一键创作 AI 有声绘本？

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

智能理解 PPT 内容，快速生成讲解视频

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

Flow-CLI 全新升级，轻松对接 Sonar 实现代码扫描和红线卡点

AI 短剧遇上函数计算，一键搭建内容创意平台

两步构建 AI 总结助手，实现智能文档摘要

通义灵码 2.0 全新升级发布会：你的 AI 程序员来了！

AI 场景下，函数计算 GPU 实例模型存储最佳实践

一键生成毛茸萌宠形象，基于函数计算极速部署 ComfyUI 生图系统

UU 跑腿云原生化，突围同城配送赛道

阿里云可观测 2024 年 12 月产品动态

Serverless Devs 官网全新升级，Serverless+AI 重磅来袭

云大使 X 函数计算 FC 专属活动上线！享返佣，一键打造 AI 应用

网络安全视角：从地域到账号的阿里云日志审计实践

从传统家电到智能生活，海尔智家的服务治理实践

【限时有奖】快速体验云消息队列 RocketMQ 版 Serverless 系列

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

面向 Workload 级别的灵活可配置 Serverless 弹性解决方案

Spring AI 智能体通过 MCP 集成本地文件数据

网络分析与监控：阿里云拨测方案解密

阿里云容器服务 AI 助手 2.0：新一代容器智能运维能力

ACK One 多集群网关：实现高效容灾方案

阿里云 Serverless 助力盟主直播：高并发下的稳定性和成本优化

让跨 project 联查更轻松，SLS StoreView 查询和分析实践

Qwen2.5 的云端新体验，5 分钟完成极速部署

云消息队列 Kafka 版 V3 系列荣获信通院“云原生技术创新标杆案例”

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

链路诊断最佳实践：1 分钟定位错慢根因

云原生 Meetup，AI 应用工程化专场·广州站

Envoy 开启 HTTP2 后偶现 404 如何解决？

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

恭喜 Apache RocketMQ、Apache Seata 荣获 2024 开源创新榜单“年度开源项目”

阿里云 2024 KCD 雅加达之旅精彩回顾

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

7分钟玩转 AI 应用，函数计算一键部署 AI 生图大模型

日志服务 SQL 引擎全新升级

函数计算助您 7 分钟极速部署开源对话大模型

CAP：Serverless + AI 让应用开发更简单

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉