给创业者的「视频生成/多模态」前沿技术与创业实操盘点

文摘科技 2024-07-25 21:35 上海

当下，多模态、3D 和视频生成三个相关但又各自独立的领域正不断融合。相关技术的发展不仅在学术界引起了广泛关注，更展现出了可观的商业化潜力。

为了帮助大家梳理上述领域前沿研究和商业落地实践的最新动态，我们邀请奇绩校友（创源引擎、极佳科技、万物灵犀等）共创了一篇视频生成/多模态方向的综述文章。

欢迎大家扫描下方二维码，添加小助手，实时查看视频生成/多模态最新的内容，以及加入「视频生成创业者交流群」：

﹀

文章主要内容包括：

多模态学术前沿探索

跨模态生成：图像生成和视频生成的经典论文回顾
跨模态理解：多模态大模型经典综述论文回顾，以及多模态幻觉（Multimodal Hallucination）、片段定位（Grounding）、具身智能（Embodied Intelligence）、视频理解中高效帧采样的单帧偏置（single frame bias）等重要学术问题讨论
3D 生成：单场景 3D 重建、多模态 3D 重建论文回顾及讨论

多模态工程化盘点

跨模态生成：盘点图像生成/视频生成/ 3D 生成模型和工具
跨模态理解：盘点闭源以及开源模型和工具（包括图片理解模型、视频理解模型、训练和部署工具、评测benchmark等）

商业化落地实践及赛道观察

创源引擎、极佳科技、万物灵犀三家奇绩校友企业的实践案例
技术发展趋势的观察和思考
商业化机会与挑战的探讨

下面是部分文章截图：

提醒：由于技术的不断变化，前沿论文、技术实践和商业创新的资讯都处在快速变化中，我们会采用【在线文档】来呈现这些变化和观点的更新（公众号编辑器不支持更新），点击【阅读原文】或添加开篇小助手，查看更多更新有关大模型的资料。

此外，我们邀请到 GenAI 时代冲得最快的创业者/科研学者，来【奇绩潜空间】分享产品探索和商业化落地实践。第三季全新升级，首期我们邀请到 Luma AI 首席科学家——宋佳铭，欢迎与身边的创业者共同参与 👉🏻活动报名 | 从视频理解 3D，与 Luma AI 首席科学家对话，活动时间：7月27日（本周六） 10:00-13:00。

加入 #奇绩创业社区#

扫描创业营二维码，提交奇绩创业营申请表，即可【免费】加入社区，【滑动】查看并免费领取创业社区独家资源：

奇绩创坛

像联合创始人一样，手把手与你一起创业。奇绩创坛成立于2019年，使命是在源头最大化驱动创新，核心产品是创业营，每年举办两届，陆奇博士和合伙人全身心投入3个月，通过创业营投资加速，提供长期帮助。

创业伙伴之间如何建立信任、沟通和明确分工？

奇绩创坛路演日（2024秋季创业营）| 投资人报名

Lepton AI 鱼哲：除 AI Infra 外，还有什么重要的事 | 奇绩潜空间活动报名

奇绩校友融资新闻 | 光轮智能完成 Pre-A+ 轮数千万融资，用合成数据加速空间智能

专访中国国际大学生创新大赛获奖者：共绩科技创始人付智

硅基流动袁进辉：AI Infra 创业 10 年得与失 | 奇绩潜空间活动报名

奇绩创业公开课——复旦 2024 秋季线下开课

奇绩女性创业者大会（完整议程和嘉宾名单）

从基流科技看，国内千卡到万卡算力集群建设的前沿

创业初期打造好团队的5个关键点

奇绩潜空间活动报名 | 阶跃星辰朱亦博：关于全栈式 AI Infra 设计与搭建的思考

奇绩创业公开课——北大清华 2024 秋季线下开课

奇绩校友融资新闻 | 「极佳视界」完成连续三轮融资，致力从视频生成走向 4D 世界模型

活动报名 | 奇绩校友创业经验分享

奇绩潜空间活动报名 | 李卓翰—— vLLM : 构建高效的开源 LLM 推理引擎

「如身机器人」完成数千万天使轮融资，首款多合一智能康复机器人已量产丨奇绩校友融资新闻

从技术到实践，交流 AI Infra 创业历程与经验 | 【奇绩潜空间】第四季开始报名

奇绩创坛 Campus Scout Program 招募（2024秋）

第三届女性创业者大会｜活动报名

如何融第一笔钱：见投资人前的准备步骤

奇绩创坛 Fellow Program 招募（2024秋）

活动报名 | MiniMax 闫俊杰：Intelligence with Everyone

大模型相关的产品化路径思考｜奇绩大模型笔记 #3

奇绩创坛实习生招募（2024秋）

Dream Machine：从视频理解 3D｜Luma AI 首席科学家宋佳铭亲述

初创企业如何为产品定价？

活动报名 | 多模态大模型：以视觉为中心的探索

如何快速验证产品价值与用户需求是否匹配？

奇绩视角下的 Scaling Law（规模定律）｜奇绩大模型笔记 #2

活动报名｜创业者自组织会议（AI Unconference）

通用智能的本质｜奇绩大模型笔记 #1

活动报名 | 奇绩校友创业经验分享

如何做简单高效的用户调研？

活动报名 | 高效长文本生成的技术与应用

活动报名 | 揭秘高效长文本生成，让模型更高效、更智能

创始人之间如何分配股权？

初创公司早期如何换方向（Pivot）？

31 家机器人创业公司，链接产业核心企业和应用场景｜奇绩创坛产品日

给创业者的「视频生成/多模态」前沿技术与创业实操盘点

如何找到联创，建立创始团队？

活动报名 | 从视频理解 3D，与 Luma AI 首席科学家对话

如何找到一个好的创业想法？

早期创业融资指南：资本市场现状及给创业者的融资建议

探讨大模型前沿技术与商业化落地 |【奇绩潜空间】第3季开始报名

年轻人应该考虑创业的三个理由

给「AI 推理」创业者的前沿技术与商业实操盘点

创业者自组织会议（AI Unconference）｜活动报名

提交即享，奇绩创业社区资源介绍

“认识你自己”：创业者性格测试

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉