每周AI资讯

文摘   2024-08-09 12:08   广东  


NEWS
每周AI资讯

最新热点一手掌握

01
智谱 AI:开源 CogVideoX 视频生成模型
智谱 AI 宣布,视频生成模型CogVideoX 开源,包含多个不同尺寸大小的模型,目前将开源 CogVideoX-2B,在 FP-16 精度下的推理需 18GB 显存,微调则需要 40GB 显存,单张 4090 显卡即可进行推理,而单张 A6000 显卡即可完成微调。CogVideoX-2B 的提示词上限为 226 个 token,视频长度为 6 秒,帧率为 8 帧 / 秒,视频分辨率为 720*480

02
阿里团队:推出视频 AI 生成框架 Tora
阿里团队推出 AI 视频生成框架 Tora,基于轨迹导向的扩散变换器(DiT)技术,集成文本、视觉和轨迹用于生成视频,Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成:TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频


03
智慧体育 - InnoMotion AI 赛事转播解决方案
商汤科技与上海东方传媒技术有限公司合作,打造“智慧体育 - InnoMotion AI 赛事转播升级解决方案”,在 2024 巴黎奥运会射箭比赛项目展示。利用三维运动捕捉技术和 AR 特效渲染引擎,实现射箭赛事数据采集与可视化转播,并提供 AI 解说。该方案能实时捕捉箭矢特征值,结合 AI 算法得出高精度空间 3D 坐标,与 AR 渲染引擎对接,完成真实赛事场景的数字化映射。该方案也应用于本届奥运会乒乓球项目的全程赛事转播,可呈现乒乓球的相关特效


04
通义App:推出角色扮演功能
通义App上线角色扮演功能,可一键替换视频人物。上传一段视频,选择要替换的3D角色,在不改变其他场景和人物的情况下,将原有角色一键变身为3D角色模型,实现让孙悟空跳水、机器人打网球、二次元女孩揉面等创意视频。该功能基于Motionshop模型打造。Motionshop上线通义App,免费使用


05

Canva 可画:发布一站式 AI 创作套件魔力工作室

在“Canva Connect 连接你我,可画未来”主题活动中,Canva 可画宣布一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件是“人人可用的一站式 AI 创作套件”,具备基于 AIGC 的多种功能,用户输入简单文字描述就能生成多种内容,套件内置“魔力橡皮擦”“魔力抓取”等功能,不过部分功能如智能抓取、魔力特效等需高级版会员资格且提供免费试用


06
腾讯元宝:推出深度阅读模式
腾讯元宝在最新版本中,用户上传论文、财报、研报等专业内容的 URL 链接或文件时,除获得文字概括总结外,还能进入深度阅读模式。该模式提供核心内容概览与模块化解析,生成总结性图表助用户理解关键信息,原生支持最长近 50 万字输入,能生成图文并茂内容,对外文文献可提炼创新点与不足、划词搜索或翻译专业术语,对财报及研报能生成杜邦分析图等专业图表且集成计算器功能,用户上传并深度阅读过的文件可在“我的文件”查看,离线状态也能回看精读内容及原文

07
AIGC产品“秒画趣拍”上线9天日活破52万人
近日,商汤科技基于“日日新·秒画”文生图大模型打造的一款帮助用户生成创意写真、自拍合照的AIGC产品“秒画趣拍”小程序版上线,试运营第9天日活跃用户突破52万,用户总量突破146万,日页浏览突破4117万,网络请求破亿次。“秒画趣拍”小程序里覆盖丰富模板,包括定格奥运、校园毕业照、创意合照、名画风写真、旅拍照片、新国风、二次元等,用户只需上传1张照片就能轻松生成高质量写真,进行不同风格的创作


08
美国游戏演员发起大罢工

美国演员工会(SAG - AFTRA)成员针对游戏行业发起罢工,涉及超 16 万名成员,给游戏开发带来巨大冲击。罢工核心争议是 AI 技术的使用,工会要求严格保护演员数字复制品和生成式 AI 应用,防止未经授权使用演员形象和声音,与代表 30 家公司利益的游戏行业谈判委员会存在分歧,工会要求保护所有声音和动作捕捉演员,游戏公司最初只提议保护配音演员,虽后扩大范围但遭工会反对,双方立场僵持致谈判破裂,不过此次罢工并非全面停工,一些特定项目不受影响,但工会鼓励成员避免参与


09
OpenAI 正研发 ChatGPT 文本水印,但面临不小挑战
《华尔街日报》报道 OpenAI 已开发出能高精度识别 ChatGPT 生成文本的工具但未发布,OpenAI 回应称正在研究文本水印技术且该技术存在挑战。通过文本水印,OpenAI 只专注检测 ChatGPT 文字,通过对 ChatGPT 选单词方式微小更改创建不可见水印,文本水印是多种解决方案之一,还包括分类器和元数据,不过文本水印面对翻译、改写等篡改行为效果会下降,还可能对非英语母语人士等群体有不成比例的影响,OpenAI 表示因复杂因素及其对生态系统潜在影响,将谨慎推进文本溯源技术研究,优先考虑视听内容认证工具


10
Stability AI 推出“Stable Fast 3D”模型
Stability AI 推出 Stable Fast 3D“图生 3D 模型”AI 模型,只需 0.5 秒就能生成完整自然的 3D 模型,仅需单张图片即可,自带材质及参数,提供精确的 UV 展开便于后期修改,还可选择四边形或三角形网格重建功能(多耗时 100 至 200 毫秒)以控制模型网格拓扑结构。它能减少原图中主体受光照影响痕迹,使生成模型在不同光照下呈现正确颜色。Stability AI 将其与之前的 SV3D 模型比较,强调在保证精度的情况下,单个模型推理时间从 10 分钟缩短至 0.5 秒,有实际效益




关于AI资讯,公众号将恢复周更,只放当周影响力较大的资讯。微信群会以日更的形式进行资讯推送。想进群的添加下方微信,备注【资讯】。

ACG彼方
彼方学院(Animation Comics Games Academy 简称:ACG )是一个拥有专业团队,面向全球动漫游戏数字媒体元宇宙的从业者及爱好者、高校、研发机构等相关行业,提供多样化、定制化服务的综合平台。
 最新文章