AI周报:腾讯开源目前最强视频生成大模型 | 李飞飞 WorldLabs 发布革命性的单图3D场景生成技术

科技   2024-12-04 21:13   广东  

SmartFlowAI


点击上方蓝字关注我们

全文约 1800 字,预计阅读时间 5 分钟

新闻资讯

  1. 腾讯上线并开源了其视频生成大模型 Hunyuan-Video

12月3日,腾讯混元大模型正式上线并开源了其视频生成大模型——Hunyuan-Video。该模型拥有130亿参数,具备原生转场和切镜能力,并且支持物理模拟和一镜到底的视频生成功能。据称,Hunyuan-Video在性能上超越了竞争对手如Gen3和Luma,具备出色的视觉质量、运动多样性和文本-视频对齐能力。此外,该模型已在腾讯元宝APP上线,用户可以在AI应用中的「AI视频」板块申请试用。

https://aivideo.hunyuan.tencent.com/


  1. World Labs 推出单图 3D 场景生成技术

World Labs近日展示了其革命性的3D场景生成技术,该技术能够将单张静态图片转化为可互动的3D场景。这一创新成果吸引了广泛关注,并助力公司成功获得了2.3亿美元的融资。World Labs由著名计算机科学家李飞飞创立,其目标是通过“空间智能”技术,打通虚拟和现实之间的界限,为视频游戏、电影、VR等领域带来巨大的变革。

https://www.worldlabs.ai/about


  1. 亚马逊推出Amazon Nova多模态基础模型,多模态正式进入“AnyTo Any”时代

在2024年12月4日的AWS re:Invent全球大会上,亚马逊云科技(AWS)宣布推出全新的Amazon Nova多模态基础模型系列。这一系列模型将在Amazon Bedrock中提供,涵盖了文本、图像和视频生成功能,旨在满足多种任务需求。

Amazon Nova系列包括三款主打“理解”功能的模型:Amazon Nova Micro,适用于超快速文本生成;Amazon Nova Lite,一种低成本的多模态模型,能够处理图像、视频和文本输入并生成文本;以及Amazon Nova Pro,一种高性能的多模态模型,提供最佳的准确性、速度与成本平衡。

此外,亚马逊还正在研发Amazon Nova Premier,预计将成为其“最强”的多模态模型,专注于复杂推理任务,计划在2025年初发布。这些模型的推出标志着亚马逊在AI技术上的又一重大突破,进一步巩固了其在生成式AI领域的领先地位。

https://www.aboutamazon.com/news/aws/amazon-nova-artificial-intelligence-bedrock-aws


  1. 亚马逊大量投资Anthropic

亚马逊与Anthropic宣布深化战略合作,亚马逊追加40亿美元投资,使总投资额达到80亿美元。这一重大资金注入将推动Anthropic的成长和AI能力的提升。Anthropic选择亚马逊云科技为模型训练的首要合作伙伴,并计划使用Amazon Trainium和Amazon Inferentia芯片来训练和部署未来的基础模型。此次合作标志着两家公司在AI领域的紧密合作,并确立了亚马逊在模型训练合作伙伴中的核心地位。


小工具

  1. Pydantic AI

Pydantic AI 是基于 Pydantic 的一个工具库,旨在将 AI 模型集成到 Python 应用程序中。它提供了简洁的接口,用于与不同 AI 模型(如 OpenAI、Vertex AI)进行交互,同时支持类型检查、参数验证等功能,从而提升开发效率和代码的安全性。这个项目不仅能帮助开发者快速构建 AI 驱动的应用,还支持自定义工具扩展和上下文管理,适合各种规模的 AI 应用开发。

https://github.com/pydantic/pydantic-ai


  1. DocsGPT

DocsGPT 是由 GitHub 用户 arc53 开发的开源项目,旨在通过整合强大的 GPT 模型,为开发者提供文档检索支持。其主要功能是帮助用户快速搜索项目文档中的信息,减少手动查找的时间。用户可以通过简单的自然语言提问,获取精准的答案,从而优化文档使用体验。该项目支持本地部署和云端运行,并且提供多种大型语言模型(如 Mistral、LLaMA、Falcon)供选择,以满足不同硬件资源的需求。

DocsGPT 的架构基于 Flask 和 React,提供前端、后端及 Chrome 插件支持。开发者可以通过 Docker 容器快速部署,并利用 MongoDB 和 Redis 提供高效的开发环境。项目还欢迎开源社区的贡献,支持本地化和自定义模型优化。

https://github.com/arc53/DocsGPT


往期 · 推荐

北大字节VAR获最佳论文、厦大清华获亚军,NeurIPS 2024最佳论文出炉

最强开源文生视频!腾讯混元 HunyuanVideo对外开放并全面开源

ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星

o1圈的新王!阿里QwQ-32B开源

🌠 番外:我们期待与读者共同探讨如何在 AI 的辅助下,更好地发挥人类的潜力,以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践,我们可以更清晰地认识到 AI 的辅助作用,并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”,加入机智流大模型交流群!

一起“点赞”三连👇

机智流
共赴 AI 时代浪潮~
 最新文章