给创业者的「视频生成/多模态」前沿技术与创业实操盘点

文摘   科技   2024-07-25 21:35   上海  
当下,多模态、3D 和视频生成三个相关但又各自独立的领域正不断融合。相关技术的发展不仅在学术界引起了广泛关注,更展现出了可观的商业化潜力。
为了帮助大家梳理上述领域前沿研究和商业落地实践的最新动态,我们邀请奇绩校友(创源引擎、极佳科技、万物灵犀等)共创了一篇视频生成/多模态方向的综述文章。
欢迎大家扫描下方二维码,添加小助手,实时查看视频生成/多模态最新的内容,以及加入「视频生成创业者交流群」:


文章主要内容包括:


多模态学术前沿探索

  • 跨模态生成:图像生成和视频生成的经典论文回顾

  • 跨模态理解:多模态大模型经典综述论文回顾,以及多模态幻觉(Multimodal Hallucination)、片段定位(Grounding)、具身智能(Embodied Intelligence)、视频理解中高效帧采样的单帧偏置(single frame bias)等重要学术问题讨论

  • 3D 生成:单场景 3D 重建、多模态 3D 重建论文回顾及讨论


多模态工程化盘点

  • 跨模态生成:盘点图像生成/视频生成/ 3D 生成模型和工具

  • 跨模态理解:盘点闭源以及开源模型和工具(包括图片理解模型、视频理解模型、训练和部署工具、评测benchmark等)


商业化落地实践及赛道观察

  • 创源引擎、极佳科技、万物灵犀三家奇绩校友企业的实践案例

  • 技术发展趋势的观察和思考

  • 商业化机会与挑战的探讨


下面是部分文章截图:


提醒:由于技术的不断变化,前沿论文、技术实践和商业创新的资讯都处在快速变化中,我们会采用【在线文档】来呈现这些变化和观点的更新(公众号编辑器不支持更新),点击【阅读原文】或添加开篇小助手,查看更多更新有关大模型的资料。

此外,我们邀请到 GenAI 时代冲得最快的创业者/科研学者,来【奇绩潜空间】分享产品探索和商业化落地实践。第三季全新升级,首期我们邀请到 Luma AI 首席科学家——宋佳铭欢迎与身边的创业者共同参与 👉🏻活动报名 | 从视频理解 3D,与 Luma AI 首席科学家对话活动时间:7月27日(本周六) 10:00-13:00
 


加入 #奇绩创业社区#
扫描创业营二维码,提交奇绩创业营申请表,即可【免费】加入社区,【滑动】查看并免费领取创业社区独家资源:
左右滑动查看更多资源

奇绩创坛
像联合创始人一样,手把手与你一起创业。奇绩创坛成立于2019年,使命是在源头最大化驱动创新,核心产品是创业营,每年举办两届,陆奇博士和合伙人全身心投入3个月,通过创业营投资加速,提供长期帮助。
 最新文章