小互AI日报：将你的表演同步到任意视频和图像、利用AI重写任何视频、几张照片就能克隆你自己、Google推出天气预测模拟系统…

文摘 2024-07-25 00:47 浙江

Hi~ 欢迎来到7.24XiaoHu.AI的日报！

______________

1、LensGo AI 推出了一个名为 FaceSync 的新功能。

用户可以录制自己的表演视频，然后选择一张图片或视频，FaceSync 能够将你的表演与这些图像或视频同步，使其栩栩如生。

也就是说，FaceSync 能够将你的形象转移到目标图像或者视频，同时保持你的声音和口型姿态同步，让你可以以任何形象来表演。

目前该功能还在测试中。

2、NeuralGCM：Google开发的天气预测模拟系统

NeuralGCM 是由 Google 开发的一种新型的基于 AI 和物理的气象和气候建模系统，达到了前所未有的准确性。与仅大气 AMIP 模型相比，气候模拟误差减少了多达 3 倍。该研究已经发表在《自然》杂志上，NeuralGCM 将传统的大气环流模型（GCMs）和机器学习方法结合在一起，全部使用 JAX 编写，以支持可微分优化和 GPU/TPU 上的高性能模拟。

该模型的效率远高于现有模型，显著提升了天气预报，并大大减少了气候模拟误差。比目前的最先进模型在相似或更高精度下高出 3 到 5 个数量级的计算效率。它还提供了极端天气事件（如热带气旋）的逼真模拟。在40年的气候模拟中，NeuralGCM准确再现了全球变暖趋势。

NeuralGCM 是开源的，邀请进一步的科学合作。

具体应用

短期天气预报: 提供从几小时到几天的高精度天气预测。
中期天气预报: 提供长达15天的天气预测，准确度接近最先进的物理模型和其他机器学习模型。
气候模拟：NeuralGCM能够进行长时间的气候模拟，预测未来几年的气候变化趋势。

🔗 详细：https://xiaohu.ai/p/11622

3、迪斯尼公布BD-X双足机器人图纸和技术方法

迪斯尼发表了一篇论文详细介绍了其新型的双足机器人BD-X的主要设计和控制方法。

BD-X设计的主要目的是为了在娱乐表演中使用。该机器人不仅能在复杂地形上移动，还能执行非常逼真的艺术化动作，比如舞蹈或表演。

🔗 详细介绍：https://xiaohu.ai/p/11638

4、Vozo：AI视频生成器重写你的视频

Vozo Rewrite & Redub 是一款创新的视频编辑工具，通过简单的提示即可重写视频脚本，然后这个工具会自动给视频重新配音、翻译语音并进行口型同步，生成新的视频。

无论是将经典视频转变为病毒视频宣传片，还是将普通视频变成喜剧，亦或是将一种语言翻译成多种语言，Vozo 都能在几秒钟内完成。

具体应用

视频重写与重新配音：使用AI提示重写脚本，并使用克隆的声音进行重新配音。
文本编辑语音：通过编辑文本更新解说，不需要重新录音。
多角色口型同步：视频中的多角色自然口型同步。
视频翻译：将视频专业翻译成30多种语言和方言。
自动视频重新利用：一键裁剪、重构和调整视频比例，以适应不同的社交平台。

使用场景

视频创作者：将经典片段转变为新的病毒式传播视频。
广告公司：修改脚本，重新配音，并口型同步广告，创建针对不同受众的无尽变体。
营销人员和电商：将产品视频翻译成多种语言，轻松扩大全球影响力。
教育者：通过编辑文本和克隆配音轻松修改教育视频，以适应任何语言或语调。

🔗 详细介绍：https://xiaohu.ai/p/11653

5、腾讯的PhotoMaker开源项目更新：

PhotoMaker 是由腾讯 ARC 实验室和南开大学 MCG-NKU 合作开发的一种高效个性化文本到图像生成方法！

无需训练，只需要几张照片就能克隆你的关键特征，然后生成你在各种场景、各种风格和各种状态的照片。

PhotoMaker 通过堆叠 ID 嵌入来生成逼真的人像照片。可以在几秒钟内完成个性化定制，无需额外的 LoRA 训练。该方法可以根据文本提示，生成符合描述的高质量人像图片，同时保持人物身份的特征。

通俗易懂来说就是它利用多个输入图片来创建一个统一的ID嵌入表示，这些嵌入向量包含了人物的各种特征（如面部特征、发型、表情等）。

然后利用这个ID表示来生成图像，从而保持人物特征的一致性。该方法不仅速度快、质量高，还可以根据文字描述生成定制化的照片。

主要功能：

生成逼真照片: 根据文字描述生成个性化逼真人物照片。
风格化: 可以对照片进行各种风格的处理。
身份变换: 改变照片中人物的年龄和性别。
身份混合: 将多个人物的特征融合生成新的人物形象。

🔗 详细介绍：https://xiaohu.ai/p/11665

6、Llama 3.1 发布

Llama 3.1 发布包含 8B、70B 和 405B 版本，性能媲美 GPT-4 等闭源模型。

Meta发布了新的Llama 3.1模型，包括期待已久的405B。
这些模型具有改进的推理能力、128K token上下文窗口，并支持8种语言。
Llama 3.1405B在多项任务上与领先的闭源模型竞争。
工具使用能力，支持搜索和Wolfram Alpha的数学推理，模型能够集成和使用多种工具，支持在零样本条件下进行工具调用和操作。
通过组合方法可以将图像、视频和语音功能整合到模型中
训练405B模型使用了超过16K的NVIDIA H100 GPU，历时数月。
Llama 3.18B和70B模型在性能和安全性上优于前代。
更新的许可证允许使用Llama模型的输出改进其他模型。

🔗 详细内容：https://xiaohu.ai/p/11686

______________

End.

感阅

谢读

点赞，关注关注关注！

你也可以直接通过xiaohu.ai直接访问小互的网站

http://mp.weixin.qq.com/s?__biz=MzkzMzQ5MDA5Ng==&mid=2247486052&idx=1&sn=76b8b655da95e094a41e70f95f6b6b7c

通往AGI之路

WaytoAGI.com，让每个人的AI学习过程少走弯路，让更多的人因AI而强大。

最新文章

最高10万奖金丨即梦AI交互创新大赛正式启动，期待你的参与！

智谱AutoGLM可以操控手机之后，看看社区伙伴怎么整活 | 你还有什么脑洞，欢迎来投稿讨论

清言上线情感语音模型GLM-4-Voice，AI 的 phone use 也来了

我真是服了，整活还是要看hailuoAI

AIPO共学课 | 李继刚提示词课万字整理

日更AI视频挑战——第七期开始了！

2024 全国大学生科技美术设计创新作品大赛外卡(非学生)赛道征集

AI音乐半年观(上) | 音乐生成有哪些实用场景和代表产品?

我们为何需要一站式 AI 服务超市，让智能服务触手可及？

日更AI视频挑战——第六期开始了！

2024中日韩华人AI歌曲创作大赛公告

新节目上线！日更AI视频挑战--第五期开始了

AIPO：校园 AI 创投活动，开放报名！

9月：AI 圈的乌龙、新闻与趣事

扣子最佳实践：雅思口语专家

【中国计算机协会×WaytoAGI】有奖AI视频大赛征集啦！

招募校园发起人，一起办校园「AI切磋大会」

突发！Runway 从 HuggingFace及Github 上删库跑路了，啥也没留

智谱 GLM-4-Plus 发布，附送免费 API

8月31日线下聚会第五期-AI切磋{摆摊}大会，报名最后两天

史诗更新！1080 可跑的 Sora，可商用！超大杯 CogVideoX 5B 开源！GLM-Flash 免费！

OpenAI「草莓」今秋发布，随后是「猎户座」

征集｜ComfyUI 全球社区峰会 AI 展：新艺术宣言

ComfyUI基础教程—小谈｜WaytoAGI共学计划

“谁是人类“访谈丨决赛在即，他们有话说

🥂🥇Video BattleAI视频挑战第18期-昊铂

第17期：Video Battle AI 视频挑战-黑盒子

Audio Battle Beta Vol.4 - AAA 歌词挑战

🤩让我康康这次AI切磋大会

用心捏一个bot的“人生”丨心意类拟人bot提示词教学，绝对精品 -- 带视频教学

“谁是人类”访谈丨大雨：选择相信也是一种解法

小互AI日报：将你的表演同步到任意视频和图像、利用AI重写任何视频、几张照片就能克隆你自己、Google推出天气预测模拟系统…

小互AI日报：苹果开发一种模型更新策略、实时股票信息机器人、为大语言模型提供的永久记忆能力、微软发布其设计工具…

小互 AI 周报上周AI圈都发生了什么大事…

阿里云百炼bot接入COW教程

通义大模型直接接入COW教程

15个城市线下聚会｜7月28日AI切磋{摆摊}大会｜北上广深杭郑武成南庆长厦昆大理西安云聚会

最大405B：Llama-3.1 发布，第一时间详解

阿里云 x WaytoAGI：“人肉图灵测试”，怎么玩？

扣子Coze收费前最后的1元套餐, 原价500, 可以再爽一年, 赶紧冲!

1分钟学会制作“冰淇淋甜品地标图”, 5分钟学会制作流程.

[详尽教程] <找三思做二十四节气海报> Coze bot大揭秘 -- 涵盖了coze目前大多能力

[教学向]我把Coze比赛第一的bot拆了教大家

推荐一门让你少走弯路的优质AI课

在杭州，见证一场年轻人的黑客松：AdventureX 有趣的项目盘点

Audio Battle Beta 第三期 Vol.3 - AAA

Agent共学活动新一期“谁是人类”全新开启!

世界生成式AI视频挑战赛-主题：第15期衔尾蛇「首尾帧」

【AI音乐挑战】Audio Battle Beta Vol.2 - AAA

🥇🪐提示未来-2024上海国际AIGC创作大赛

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

小互AI日报：将你的表演同步到任意视频和图像、利用AI重写任何视频、几张照片就能克隆你自己、Google推出天气预测模拟系统…

Hi~ 欢迎来到7.24XiaoHu.AI的日报！

1、LensGo AI 推出了一个名为 FaceSync 的新功能。

2、NeuralGCM：Google开发的天气预测模拟系统

3、迪斯尼公布BD-X双足机器人图纸和技术方法

4、Vozo：AI视频生成器 重写你的视频

5、腾讯的PhotoMaker开源项目更新：

6、Llama 3.1 发布

4、Vozo：AI视频生成器重写你的视频