首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

腾讯研究院AI速递 20250110

学术 2025-01-10 00:06 广东

生成式AI

一、微软研究院开源了目前最强小参数模型phi-4，支持商用许可

1. 微软开源14B参数的Phi-4模型，性能超GPT-4o，AMC测试达91.8分，支持MIT商用许可;

2. 采用高质量合成数据训练，包含50多类数据集，生成4000亿tokens;

3. 应用监督微调(SFT)和直接偏好优化(DPO)技术，MMLU得分84.8，9项基准测试优于同类模型。

https://mp.weixin.qq.com/s/Rk-XBLd3PosXCJhH_mth1w

二、一秒单图生成3D，实时编辑，Stability AI推出3D生成新方法

1. SPAR3D实现0.7秒内从单图生成3D模型，支持实时编辑点云，提供完整360度视图;

2. 采用两阶段设计：轻量级点扩散模型生成点云，再基于点云和输入图像创建详细网格;

3. 能分别处理可见和不可见部分重建，在GSO和Omniobject3D数据集测试中优于现有方法。

https://mp.weixin.qq.com/s/hs5otWcFn86oLhJHulhkAw

三、手与物的关系，Meta发布第一人称视角HOT3D 高质量数据集

1. Meta推出HOT3D数据集, 包含833分钟第一人称视角手物交互视频, 超370万张多视角图像;

2. 使用Project Aria和Quest 3设备采集, 提供RGB/单色图像流、3D点云和眼动追踪等多模态数据;

3. 数据集支持3D手姿态跟踪、物体姿态估计等任务, 多视角方法显著优于单视角。

https://mp.weixin.qq.com/s/isV_y_XbfBavzPt7FGwKqw

四、智元机器人推出全球首个4D世界模型EnerVerse，为具身定制

1. 智元机器人提出EnerVerse架构，通过自回归扩散模型生成4D空间并指导机器人完成任务;

2. 引入稀疏记忆机制和自由锚定视角，解决长程生成与多视角问题;

3. 模型在LIBERO基准测试中实现SOTA，长程任务规划与动作生成表现优异。

https://mp.weixin.qq.com/s/B6MfkL_SxZ5BrR--PYqYiQ

五、通义万相视频生成模型 2.1 版升级，复杂运动与物理规律提升

1. 通义万相2.1刷新VBench榜单，新增中英文字幕生成、电影级运镜、复杂运动等功能;

2. 采用Flow Matching和创新VAE架构，实现高效视频编解码和百万超长序列训练;

3. 引入自动化数据构建和评估管线，涵盖美学评分等20多个维度指标。

https://mp.weixin.qq.com/s/YFnftO_sKQ_d6AM5J-W8YQ

六、程序员出身的 AI 短片导演，用三个月拿下国际电影节的金奖

1. 程序员Jim用AI工具制作10分钟动画短片《鬼饮食》，获国际电影节金奖;

2. 通过精简角色设计、避开AI弱项、运用特写镜头等手法规避技术限制;

3. 坚持个人化创作和叙事表达，制作耗时3个月，工时超200小时。

https://mp.weixin.qq.com/s/YVuyRxi6ROftdCezSnX_KQ

七、全球首个AI 爆炸案！ChatGPT教特种兵造炸弹，袭击特朗普酒店

1. 37岁前特种兵在特朗普酒店引爆装有烟花和铅弹的Cybertruck, 造成7人受伤;

2. 嫌犯通过ChatGPT获取制造炸弹相关信息, 成为首起利用ChatGPT的恐袭案件;

3. 研究人员曾开发SciGuard智能体, 结合科学数据库与监管数据, 希望控制AI在危险领域的滥用风险。

https://mp.weixin.qq.com/s/-vPV-xwt43gXJTLUw51bYg

前沿科技

八、索尼的VR大空间项目，全新LBE技术、结合大IP沉浸式体验

1. 索尼推出《最后生还者》主题的大空间LBE体验，采用Crystal LED显示屏和多感官技术;

2. 无需VR头显，通过环绕屏幕、触觉反馈和氛围营造实现完全沉浸;

3. 索尼将在芝加哥开设奇幻世界娱乐中心，引入多个热门IP打造线下沉浸式体验。

https://mp.weixin.qq.com/s/TMYskPCDIz17Z3cJroTxfg

报告观点

九、胡润研究院发布《2024胡润中国人工智能企业50强》（特定领域）

1. 按市值与估值排名，寒武纪、科大讯飞和商汤科技分列AI企业50强前三，估值分别为2380亿、1160亿和500亿;

2. 北京20家、上海9家、深圳8家、广州4家企业入选，一线城市AI企业占比超八成;

3. 榜单仅纳入专注AI算力和算法企业，不含具身智能(如优必选等)和AI非核心业务企业(如BAT等)。

https://mp.weixin.qq.com/s/T3U9RsjBSLrNEepLAfEfEw

AI50节选

👇订阅下方合集，获取每日推送

腾讯研究院

腾讯公司设立的社会科学研究机构，依托腾讯公司多元的产品、丰富的案例和海量的数据，围绕产业发展的焦点问题，通过开放合作的研究平台，汇集各界智慧，共同推动互联网产业健康、有序的发展，致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a

最新文章

腾讯研究院AI速递 20250113

腾讯研究院AI每周关键词Top50

企业的AI转型正进入拐点：来自3000家企业调研的发现

腾讯研究院AI速递 20250110

腾讯高级经济顾问孙明春：觉知、转型与适应，迎接21世纪的第二个25年

活动报名｜当 AI 开始改变世界，他们想让世界再好一点

腾讯研究院AI速递 20250109

腾讯司晓：拟合未来，选择比能力更重要

腾讯研究院AI速递 20250108

我们的年终思考总结，邀你见证

腾讯研究院AI速递 20250107

读懂AI未来的50个关键词

腾讯研究院AI速递 20250106

AI时代的教育之问III：人机协同

腾讯研究院AI速递 20250103

数字经济的新进展和老问题

2024年最后一天，回望数实融合的新特征与新趋势

腾讯研究院AI速递 20241231

AI诈骗的终极形态

招聘 | 腾讯研究院法律研究中心实习岗

腾讯研究院AI速递 20241230

腾讯研究院AI每周关键词Top50

学会“摸鱼”

未来城市AI创意设计大赛作品展开幕——获奖名单揭晓

腾讯研究院AI速递 20241227

清华梁正教授：为什么AI替代不了人类？｜AI&Society百人百问

腾讯研究院AI速递 20241226

技术击碎共识之后，传播还有连通的可能吗？|专访南大胡翼青

腾讯研究院AI速递 20241225

游戏的可能：谈谈《黑神话：悟空》与传统文化

腾讯研究院AI速递 20241224

做播客，AI永远取代不了人

腾讯研究院AI速递 20241223

腾讯研究院AI每周关键词Top50

迈向福祉型人工智能：指导原则与行动路线图

腾讯研究院AI速递 20241220

空想未必不能产生“真理”

腾讯研究院AI速递 20241219

他为什么是整个硅谷的精神导师

腾讯研究院AI速递 20241218

谁为AI事故负责？

创新科技助力文化焕活丨腾讯“探元计划2023”项目的启示

腾讯研究院AI速递 20241217

腾讯杨健：AI向善，就是要看到芸芸众生的需要

腾讯研究院AI速递 20241216

腾讯研究院AI每周关键词Top50

腾讯研究院AI速递 20241213

创新者的基因：你也可以培养的技能

腾讯研究院AI速递 20241212

全文下载｜腾讯发布数据系统研究报告：加快数据系统建设，释放数据要素价值

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉