AI日报:可灵1.5模型升级!上线人脸模型;华为Mate 70系列将支持AI隔空传送;胖东来将追责AI篡改于东来视频者

科技   科技   2024-11-25 16:24   福建  
关注我,记得标星⭐️不迷路
AI日报

11月25日•AIbase

1、可灵AI平台 1.5 模型升级:上线人脸模型功能 新增「标准模式」

2、Runway新增视频扩展画面功能“Expand Video”

3、华为Mate 70系列将支持AI隔空传送 余承东亲自演示

4、Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒!

5、EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人

6、音频驱动生成面部视频技术JoyVASA

7、PicMenu:用AI将菜单可视化

8、英伟达发布Edify 3D生成模型 2分钟即可生成高质量3D资产

9、更聪明了!小米智能家庭屏系列产品推送大模型超级小爱

10、REDMI K80 Pro搭载Xiaomi AISP 2.0影像算法:融合四大模型

11、胖东来发声明:警告多账号擅自利用AI生成于东来声音

12、2028年全球生成式AI芯片市场预计将达 862.4 亿美元


1. 可灵AI平台 1.5 模型升级:上线人脸模型功能 新增「标准模式」

可灵 AI 平台最近升级至1.5版本,推出多项新功能,包括增强的高品质视频生成模式和新增的标准模式,后者支持快速生成720p 视频。新的人脸模型功能面向高级会员开放,用户可在训练后随时生成视频。



亮点提要:

🎥 高品质模式增强,支持运动轨迹和静止区域的精细控制。

⚙️ 新增标准模式,快速生成720p画质视频,创作时间大幅缩短。

👤 人脸模型功能首次上线,提供定制化视频生成,会员用户享受折扣。

详情入口:

🔗 https://www.chinaz.com/ainews/13431.shtml




2. Runway新增视频扩展画面功能“Expand Video”


Runway 近日推出 “Expand Video” 功能,用户可通过文本提示在原视频基础上生成额外视觉内容,并调整视频。该功能支持动态效果,如快速变焦和拉远镜头,使视频更加生动。此工具标着视频生成技术的又一进步,进一步丰富创作可能性。



亮点提要:

🎬 新功能上线: RunwayML 推出“Expand Video”,允许用户通过文本提示在原视频基础上扩展内容。

🌟 动态效果实现: 用户可以创造快速变焦和拉远镜头等动态效果,提升视频的视觉体验。

⚡ 生成速度提升: 新一代 Gen-3Alpha 模型生成速度显著提高,满足用户快速创作的需求。

详情入口:

🔗 https://www.chinaz.com/ainews/13438.shtml




3. 华为Mate 70系列将支持AI隔空传送 余承东亲自演示


华为 Mate70系列即将发布,搭载 AI 隔空传送和魔法手势操作功能。用户可通过手势轻松传送内容,提升使用体验。此外,Mate70系列将首次搭载原生鸿蒙系统,标志着华为在移动操作系统领域的进展。


亮点提要:

🤚 AI隔空传送功能允许用户通过手势轻松传送内容,提升了操作的便捷性。

✨ 魔法手势操作使用户在不便用手操作时仍能进行翻页等操作,增加了灵活性。

🌐 Mate70系列首次搭载原生鸿蒙系统,标志着中国在移动操作系统领域的重要进展。




4. Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒!


Lightricks 推出了名为 LTX Video 的开源视频生成模型,具有20亿参数。该模型可以以每秒24帧的速度生成高达5秒的视频,仅需4秒,性能显著。LTXV 与 ComfyUI 无缝集成,提升用户体验,促进创意产业的发展。


亮点提要:

⚡ LTXV以每秒24帧的速度生成768×512像素的视频,4秒内可生成长达5秒的视频内容。

🖥️ 该模型采用bfloat16精度,能够在主流显卡上高效运行,确保视频质量与内存使用的优化。

🌍 LTXV的发布标志着视频生成技术的民主化,为不同背景的创作者提供了丰富的创作工具和可能性。

详情入口:

🔗 https://www.lightricks.com/ltxv




5. EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人


EchoMimicV2是最新的动画生成技术,支持输入一张图、一段手势视频和一段音频,能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节,简化生成过程,并引入头部局部注意力机制来解决数据稀缺问题。


亮点提要:

✨ EchoMimicV2通过简化控制条件,实现高质量的半身人类动画生成。

🎨 采用Audio-Pose Dynamic Harmonization策略,提升动画细节与表现力。




6. 音频驱动生成面部视频技术JoyVASA


JoyVASA是一项新技术,旨在提升音频驱动的图像动画效果。通过解耦面部表情与三维模型,JoyVASA能够生成更长的动画视频,并且能够根据音频线索生成动作序列,支持人像和动物动画。该技术在中英文数据集上进行训练,展现出良好的多语言支持能力,未来将进一步提升实时性能和细化表情控制,推动动画领域的新可能性。


亮点提要:

🎨 JoyVASA通过解耦面部表情与三维模型,实现更长的动画视频生成。

🔊 该技术能够根据音频线索生成动作序列,具有人物与动物动画的双重能力。

🌐 JoyVASA在中英文数据集上训练,具备多语言支持,为全球用户提供服务。

详情入口:

🔗 https://jdh-algo.github.io/JoyVASA/




7. PicMenu:用AI将菜单可视化 随手一拍就能生成高质量菜单


PicMenu 是一款创新的 AI 菜单可视化工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的数字化展示。它为餐饮行业的数字化转型提供了全新解决方案,展现出极强的实用性和技术实力。

亮点提要:

📷 PicMenu通过拍照识别菜单,自动提取菜品信息并生成视觉呈现。

🌍 该工具支持多语言,未来将加入菜品标签系统,方便用户筛选。

💻 项目开源,开发者可通过GitHub获取源代码并进行部署。

详情入口:

🔗 https://www.picmenu.co/




8. 英伟达发布Edify 3D生成模型 2分钟即可生成高质量3D资产


NVIDIA 推出的 Edify3D 技术能够在两分钟内,根据文本描述或参考图像生成高质量的3D 模型,具备完整的 UV 贴图、4K 纹理和 PBR 材质。该技术结合了多视角扩散模型和基于 Transformer 的重建技术,显著提高了3D 资产的创作效率,支持多样化的应用场景。


亮点提要:

🎨 Edify3D 技术可在两分钟内生成高质量的3D模型,支持完整的UV贴图和4K纹理。

🔍 该技术结合多视角扩散模型和Transformer重建技术,确保生成模型的精确网格结构和高分辨率纹理。

🌐 Edify3D 还支持根据文本提示生成复杂的3D场景,为艺术设计和3D建模提供强大支持。

详情入口:

🔗 https://research.nvidia.com/labs/dir/edify-3d/




9. 更聪明了!小米智能家庭屏系列产品推送大模型超级小爱


小米公司宣布对智能家庭屏系列产品进行大模型升级,增加超级问答和闲聊对话等新功能。此次升级覆盖六款设备,用户需通过小爱音箱 App 完成设置。升级后,音箱将支持文本创作,具备更全面的知识库,提升用户体验。


亮点提要:

🛠️ 升级覆盖六款设备,包括Xiaomi智能家庭屏10和小米小爱触屏音箱Pro8等。

📱 用户需在小爱音箱App中设置权限管理,确保大模型开关开启。

💡 升级后音箱支持文本创作和实时搜索,提升用户体验。




10. REDMI K80 Pro搭载Xiaomi AISP 2.0影像算法:融合四大模型


小米公司今日披露了REDMI K80系列手机的影像配置细节,标志着该系列在摄影能力上的全面提升。Xiaomi AISP2.0包含了融合光学大模型2.0、影调大模型2.0、色彩大模型2.0以及人像大模型2.0,这些技术的应用将进一步提升K80Pro的影像处理能力。



亮点提要:

📸 REDMI K80系列配备旗舰级影像配置,包括800传感器主摄和50MP浮动长焦镜头。

⚙️ K80Pro搭载Xiaomi AISP2.0技术,支持150张全算法高画质快拍,提升拍摄体验。

💰 标准版与Pro版在主摄体验上保持一致,提供更低价选项,兼顾不同用户预算。




11. 胖东来发声明:警告多账号擅自利用AI生成于东来声音


胖东来商贸集团近日发布声明,警告多个账号未经授权使用其创始人于东来声音,并篡改视频内容。这些行为严重侵犯了公司的著作权和人格权,误导公众,影响品牌形象。胖东来表示将采取法律措施追究责任,以维护其合法权益和网络生态的正常秩序。


亮点提要:

🔊 多个账号未经授权使用于东来声音,严重侵犯著作权。

⚖️ 胖东来对这些侵权行为表示强烈不满,并要求立即停止。

📜 公司将采取法律措施追究相关责任,维护合法权益。




12. 2028年全球生成式AI芯片市场预计将达 862.4 亿美元


根据最新报告,生成式人工智能芯片市场正在经历快速增长,预计到2028年市场规模将达到862.4亿美元。这一增长反映了对计算能力的需求激增和云计算的普及。


亮点提要:

🌟 市场规模预计到2028年将达862.4亿美元,年均增长率为27.9%。
💻 主要驱动因素包括计算能力需求增加、深度学习发展及云计算普及。
📈 高通推出新一代芯片,提升智能手机生成式AI能力,推动市场创新。


关于AIbase>>

一个致力于让更多人了解并参与未来AI发展的平台


这里有最新AI资讯、100+ AI赚钱案例库、15000+AI产品库、保姆级AI工具教程


更多AI硬核内容直接访问AiBase官网,一键开启你的AGI之旅!


官网:https://www.aibase.com/zh/tools/


点击阅读原文,进AIbase官网.

AIbase基地
每日AI新闻聚合阅读,掌握AI前沿资讯、AI新品、政策动向,洞察AI行业趋势,深思未来。
 最新文章