AI周报：快手联合浙大、清华推出多视角视频生成模型 | ChatGPT Projects上线 | 微软推出的14B参数小语言模型

科技 2024-12-15 19:59 广东

SmartFlowAI

点击上方蓝字关注我们

全文约 1000 字，预计阅读时间 3 分钟

新闻资讯

SynCamMaster-快手联合浙大、清华等机构推出的多视角视频生成模型

SynCamMaster是由浙江大学、快手科技、清华大学和香港中文大学研究人员联合开发的全球首个能结合6自由度（6 DoF）相机姿势、从任意视点生成开放世界视频的多视角视频生成模型。它增强了预训练的文本到视频模型，以确保不同视点的内容一致性，并支持多摄像机视频生成。通过插件式模块和多视图同步模块，SynCamMaster实现了视点间的动态同步，保持了4D一致性。此外，它还能扩展到新视角视频的合成，实现输入视频的新视角重新渲染。

https://jianhongbai.github.io/SynCamMaster/

Phi-4-微软推出的14B参数小语言模型，擅长数学等领域的复杂推理

Phi-4是微软最新推出的一款14B参数的小型语言模型，它在数学推理和传统语言处理方面表现出色。Phi-4的训练重点在于数据质量，大量使用合成数据来提升模型在STEM问答和数学竞赛问题上的表现。此外，Phi-4引入了一种新的训练范式——midtraining，以增强长文本处理能力，窗口长度可达到16K。在编程任务上，Phi-4同样表现出色，在HumanEval基准测试中以82.6%的准确率领先其他开源模型，如70B的Llama 3.3和72B的Qwen2.5。目前，Phi-4已在Azure AI Foundry上可用，并计划在下周在Hugging Face上提供。

OpenAI发布GPT-4o，打造类“她”的多模态AI体验

OpenAI近日推出GPT-4o，一个大幅升级的多模态人工智能模型。GPT-4o支持文本、图像和音频输入，并能通过自然语音回应，为用户带来类电影《她》的沉浸式交互体验。新版本不仅显著提升了对图像的理解能力，例如能即时翻译菜单、分析图片内容，还支持更自然的实时语音对话，展现出情感智能和幽默感。此外，GPT-4o在响应速度、语言覆盖范围及数据分析能力方面也全面优化，支持超过50种语言。该功能现已向ChatGPT Plus用户开放，并将逐步推广至免费用户。OpenAI此举旨在让先进的AI技术惠及更广泛的用户群体。

ChatGPT“Projects”上线，AI也能组队开黑做项目

OpenAI近期发布了ChatGPT的新功能“Projects”，专注于帮助用户更好地管理与AI相关的任务和资源。此功能允许用户将对话、文件和指令组织在一个地方，从而保持项目的上下文一致性。它类似于文件夹系统，特别适合需要长期合作或多步骤操作的任务，例如软件开发、研究、写作或数据分析。这一工具的推出旨在提升ChatGPT的效率和实用性，尤其对于需要高度组织的团队合作项目。

小工具

电商营销神器上线！Pic Copilot AI抠图助力效率翻倍

Pic Copilot推出全新AI抠图工具，专为电商卖家设计，支持批量操作，一键抠出产品主体，快速去除杂乱背景。基于领先的算法和大数据训练，该工具精准高效，适配多种图片处理需求。卖家可轻松生成聚焦产品的高质量图片，用于广告制作、商品展示等，显著提升营销效果和运营效率。这款工具旨在降低图片编辑门槛，帮助商家专注于核心业务发展，抢占电商竞争优势。

https://www.piccopilot.com/create

OpenAI高调“暗示”AGI产品发布？苹果三系统正式集成ChatGPT：iPhone16一键启动多模态

🚀OpenAI 圣诞礼物第四弹：Canvas全量开放，上新两大功能💥

吴恩达DeepLearning.AI课程系列 - 大模型检索增强生成（五）：问题回复

🌠 番外：我们期待与读者共同探讨如何在 AI 的辅助下，更好地发挥人类的潜力，以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践，我们可以更清晰地认识到 AI 的辅助作用，并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”，加入机智流大模型交流群！

一起“点赞”三连👇

机智流

共赴 AI 时代浪潮~

最新文章

Qwen开源视觉推理模型QVQ，更睿智地看世界！

聊聊大模型推理系统之 Sarathi

英特尔新款游戏显卡卖爆！24G大显存版也在路上，这下AI玩家也要抢？

又媲美 ChatGPT!? Qwen2.5 技术报告详解

回顾OpenAI系列发布会，对未来 AI 行业走向存在哪些潜在影响

HF Weekly01: Qwen2.5 tech report领衔

o3发布，OpenAI提出全新对齐范式，通过SFT和RL直接教会LLM结合安全策略进行CoT复杂推理

速报：OpenAI o3发布｜阿里Qwen2.5开源并发布技术报告

OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题

Late Chunking×Milvus：如何提高RAG准确率

GitHub Copilot推出免费订阅｜豆包推出视觉理解模型，千tokens仅3厘｜Meta和斯坦福大学合作推出多模态模型

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

苹果Mac用户狂喜！ChatGPT深度集成应用，最后再藏AGI彩蛋

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学

OpenAI 年底「百亿补贴」来了，满血 o1 API 开放，成本暴跌，定制升级

聊聊大模型推理系统之 vLLM：PagedAttention 助力内存管理

Datawhale x 机智流 “AI+硬件”开源教程共建项目来啦！

AI周报：快手联合浙大、清华推出多视角视频生成模型 | ChatGPT Projects上线 | 微软推出的14B参数小语言模型

OpenAI重磅推出ChatGPT Projects功能，让ChatGPT更容易管理！网友：这是几日来最有用的发布

「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

OpenAI版“Her”正式上线，GPT能实时视频通话+屏幕共享了！德扑AI之父：比 o1“更受宠”的模式降临

吴恩达DeepLearning.AI课程系列 - 大模型检索增强生成（五）：问题回复

周中报：全球首个“AI 程序员”Devin全面开放|谷歌Gemini2发布，全面狙击o1模型|苹果智能正式集成ChatGPT

OpenAI高调“暗示”AGI产品发布？苹果三系统正式集成ChatGPT：iPhone16一键启动多模态

具身智能机器人的行业画像

AI周报：英伟达因涉嫌垄断被立案调查 | OpenAI正式发布Sora | Meta Google 各自发布新模型

突破闭源封锁！InternVL 2.5 革新开源多模态模型格局？

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术报告，端到端VLA模型驱动，唱跳都能陪你玩

聊聊大模型推理系统之 Orca：大模型推理系统开山之作

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI圣诞推出惊喜、商业策略却惹争议，谷歌Genie 2单图即可生成3D游戏世界，亚马逊Nova以超快输出惊艳亮相

2024 AI 产品经理大会，这个周末，不见不散～

OpenAI的第一份礼：ChatGPT Pro和o1 Pro mode，但我们真的需要吗

以通专融合方式构建AGI——路径与关键问题探索｜CNCC2024

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

具身智能的数据采集主流路径

AI周报：腾讯开源目前最强视频生成大模型 | 李飞飞 WorldLabs 发布革命性的单图3D场景生成技术

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

最强开源文生视频！腾讯混元 HunyuanVideo对外开放并全面开源

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

ICLR 惊现[10,10,10,10]满分论文，ControlNet 作者新作，Github 5.8k 颗星

Kimi悄悄开源了自家推理框架Mooncake~

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

使用大语言模型进行自动且多功能的评估

速报：O1模型扎堆发布的一周

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

AI周报：快手联合浙大、清华推出多视角视频生成模型 | ChatGPT Projects上线 | 微软推出的14B参数小语言模型

新闻资讯

SynCamMaster-快手联合浙大、清华等机构推出的多视角视频生成模型

Phi-4-微软推出的14B参数小语言模型，擅长数学等领域的复杂推理

OpenAI发布GPT-4o，打造类“她”的多模态AI体验

ChatGPT“Projects”上线，AI也能组队开黑做项目

小工具

电商营销神器上线！Pic Copilot AI抠图助力效率翻倍