每周AI资讯

文摘 2024-08-09 12:08 广东

NEWS

每周AI资讯

最新热点一手掌握

智谱 AI：开源 CogVideoX 视频生成模型

智谱 AI 宣布，视频生成模型CogVideoX 开源，包含多个不同尺寸大小的模型，目前将开源 CogVideoX-2B，在 FP-16 精度下的推理需 18GB 显存，微调则需要 40GB 显存，单张 4090 显卡即可进行推理，而单张 A6000 显卡即可完成微调。CogVideoX-2B 的提示词上限为 226 个 token，视频长度为 6 秒，帧率为 8 帧 / 秒，视频分辨率为 720*480。

阿里团队：推出视频 AI 生成框架 Tora

阿里团队推出 AI 视频生成框架 Tora，基于轨迹导向的扩散变换器（DiT）技术，集成文本、视觉和轨迹用于生成视频，Tora 由一个轨迹提取器（TE）、一个时空 DiT 和一个运动引导融合器（MGF）组成：TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。MGF 将运动贴片集成到 DiT 模块中，以生成遵循轨迹的连贯视频。

智慧体育 - InnoMotion AI 赛事转播解决方案

商汤科技与上海东方传媒技术有限公司合作，打造“智慧体育 - InnoMotion AI 赛事转播升级解决方案”，在 2024 巴黎奥运会射箭比赛项目展示。利用三维运动捕捉技术和 AR 特效渲染引擎，实现射箭赛事数据采集与可视化转播，并提供 AI 解说。该方案能实时捕捉箭矢特征值，结合 AI 算法得出高精度空间 3D 坐标，与 AR 渲染引擎对接，完成真实赛事场景的数字化映射。该方案也应用于本届奥运会乒乓球项目的全程赛事转播，可呈现乒乓球的相关特效。

通义App：推出角色扮演功能

通义App上线角色扮演功能，可一键替换视频人物。上传一段视频，选择要替换的3D角色，在不改变其他场景和人物的情况下，将原有角色一键变身为3D角色模型，实现让孙悟空跳水、机器人打网球、二次元女孩揉面等创意视频。该功能基于Motionshop模型打造。Motionshop上线通义App，免费使用。

Canva 可画：发布一站式 AI 创作套件魔力工作室

在“Canva Connect 连接你我，可画未来”主题活动中，Canva 可画宣布一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件是“人人可用的一站式 AI 创作套件”，具备基于 AIGC 的多种功能，用户输入简单文字描述就能生成多种内容，套件内置“魔力橡皮擦”“魔力抓取”等功能，不过部分功能如智能抓取、魔力特效等需高级版会员资格且提供免费试用。

腾讯元宝：推出深度阅读模式

腾讯元宝在最新版本中，用户上传论文、财报、研报等专业内容的 URL 链接或文件时，除获得文字概括总结外，还能进入深度阅读模式。该模式提供核心内容概览与模块化解析，生成总结性图表助用户理解关键信息，原生支持最长近 50 万字输入，能生成图文并茂内容，对外文文献可提炼创新点与不足、划词搜索或翻译专业术语，对财报及研报能生成杜邦分析图等专业图表且集成计算器功能，用户上传并深度阅读过的文件可在“我的文件”查看，离线状态也能回看精读内容及原文。

AIGC产品“秒画趣拍”上线9天日活破52万人

近日，商汤科技基于“日日新·秒画”文生图大模型打造的一款帮助用户生成创意写真、自拍合照的AIGC产品“秒画趣拍”小程序版上线，试运营第9天日活跃用户突破52万，用户总量突破146万，日页浏览突破4117万，网络请求破亿次。“秒画趣拍”小程序里覆盖丰富模板，包括定格奥运、校园毕业照、创意合照、名画风写真、旅拍照片、新国风、二次元等，用户只需上传1张照片就能轻松生成高质量写真，进行不同风格的创作。

美国游戏演员发起大罢工

美国演员工会（SAG - AFTRA）成员针对游戏行业发起罢工，涉及超 16 万名成员，给游戏开发带来巨大冲击。罢工核心争议是 AI 技术的使用，工会要求严格保护演员数字复制品和生成式 AI 应用，防止未经授权使用演员形象和声音，与代表 30 家公司利益的游戏行业谈判委员会存在分歧，工会要求保护所有声音和动作捕捉演员，游戏公司最初只提议保护配音演员，虽后扩大范围但遭工会反对，双方立场僵持致谈判破裂，不过此次罢工并非全面停工，一些特定项目不受影响，但工会鼓励成员避免参与。

OpenAI 正研发 ChatGPT 文本水印，但面临不小挑战

《华尔街日报》报道 OpenAI 已开发出能高精度识别 ChatGPT 生成文本的工具但未发布，OpenAI 回应称正在研究文本水印技术且该技术存在挑战。通过文本水印，OpenAI 只专注检测 ChatGPT 文字，通过对 ChatGPT 选单词方式微小更改创建不可见水印，文本水印是多种解决方案之一，还包括分类器和元数据，不过文本水印面对翻译、改写等篡改行为效果会下降，还可能对非英语母语人士等群体有不成比例的影响，OpenAI 表示因复杂因素及其对生态系统潜在影响，将谨慎推进文本溯源技术研究，优先考虑视听内容认证工具。

Stability AI 推出“Stable Fast 3D”模型

Stability AI 推出 Stable Fast 3D“图生 3D 模型”AI 模型，只需 0.5 秒就能生成完整自然的 3D 模型，仅需单张图片即可，自带材质及参数，提供精确的 UV 展开便于后期修改，还可选择四边形或三角形网格重建功能（多耗时 100 至 200 毫秒）以控制模型网格拓扑结构。它能减少原图中主体受光照影响痕迹，使生成模型在不同光照下呈现正确颜色。Stability AI 将其与之前的 SV3D 模型比较，强调在保证精度的情况下，单个模型推理时间从 10 分钟缩短至 0.5 秒，有实际效益。

关于AI资讯，公众号将恢复周更，只放当周影响力较大的资讯。微信群会以日更的形式进行资讯推送。想进群的添加下方微信，备注【资讯】。

ACG彼方

彼方学院（Animation Comics Games Academy 简称:ACG ）是一个拥有专业团队，面向全球动漫游戏数字媒体元宇宙的从业者及爱好者、高校、研发机构等相关行业，提供多样化、定制化服务的综合平台。

OpenAI「圣诞狂欢」第三天 | Sora正式上线，它没有辜负期待，但也没超越期待

OpenAI「圣诞狂欢」第一天 | 满血版o1正式上线，有点东西但不多

10秒直出一张海报 | 即梦全新绘画大模型让设计师又双叒叕「失业」了

Sora遭遇严重泄露！艺术家愤怒"复仇"OpenAI，测试通道全网疯传3小时后紧急关闭

AI视频生成迎来重大突破：国产Vidu模型实现多主体完美融合，30秒生成电影级画面

秘塔AI上线“知识库”功能，AI搜索领域再掀波澜

打败Stability，赶超Midjourney，险胜FLUX，这个AI绘画产品叫Recaft

字节新产品「炉米Lumi」即将上线，剑指Liblib

智谱AI发布AutoGLM，解锁了人机交互更多的可能性

这个自定义网页的AI插件，让你体验到AI时代的“外挂”是什么

AI全自动短视频来了 | Suno Scenes让你一张图、一个视频秒转歌曲大作（附全网最详细教程）

从符合物理学到不讲物理，Pika 1.5全新特效功能「Pikaffects」引发全网病毒式传播

招生简章 | AI商业绘画系统班

被版权折磨的新媒体人，最终选择了AI

澳门研学精彩回顾丨2024“艺起探澳门”粤港澳大湾区文化交流之旅圆满结束！

播客AI化？NotebookLM，一期从无到有的播客音频只需要不到5分钟

GPT系列已被终结？OpenAI发布最强「o1」大模型，我们迈向了AI行业的新纪元

OpenAI的「草莓」大模型打响头炮 | Self play RL成LLM新范式，第二阶段的大模型爆发期即将来临

招生简章 | 虚幻引擎交互开发工程师班

无缝双语体验，这个国产最强AI翻译插件叫沉浸式翻译（附全网最细教程）

一个几分钟就能完成海报设计、网页设计的AI，它叫Ideogram（附教程）

每周AI资讯

告别熬夜，这个AI让你一键生成PPT，它就叫Kimi

腾讯元宝再度发力，上线长文精读，解救了我那蹩脚的英语阅读

每周AI资讯

彼方学院师生代表参加香港中文大学黄锦辉教授新书发布会

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉