Midjourney进军硬件领域 | 谷歌推出首个AI游戏引擎 GameNGen

科技   2024-08-29 22:44   上海  


🎨 Freepik Mystic AI 图像生成器发布

💡 Midjourney 进军硬件领域

📲 安卓/ MacOS 版 ChatGPT 支持「@」功能

🚀 国内首个基于物理的 3D 动作生成模型

🌇 实景三维大模型书生·天际 3.0

🚀 中国能源化工行业首个大模型昆仑发布

📈 OpenAI 估值超千亿美元

🤝 晶泰科技与协鑫集团签署 5 年战略协议

🎮 谷歌发布突破性 AI 游戏引擎 GameNGen

Freepik Mystic AI 图像生成器发布

Freepik Mystic[1],由 Magnific AI 和 Freepik 联合推出的 AI 图像生成器,宣称是目前市场上最先进的图像生成技术。目前,Freepik Mystic 可通过 Freepik Premium 订阅使用,未来也将在 Magnific AI 平台上提供。

与基础模型不同,Mystic 结合了 Flux 基础模型、微调和高分辨率图像生成技术,能够生成高质量的多种类型图像,包括写实肖像、动物、风景、奇幻场景等。图像由顶尖摄影师、数字艺术家、VFX 专家和设计师策划,并经内部专家微调,生成分辨率高达 1,664 x 2,432 的 AI 图像,且能遵循给定的提示词。

Midjourney 进军硬件领域

知名 AI 图像生成公司在社交媒体 X 上发布消息,宣布将扩展其业务范围,邀请人才加入其新成立的硬件部门。「Midjourney」尚未透露将开发何种类型的硬件设备,但表示有多个项目正在进行中,并暗示有「更多形态的可能性」。

「Midjourney」创始人 David Holz 曾任 Leap Motion 首席技术官,拥有丰富的硬件经验。近期,Holz 招募了前 Leap Motion 同事 Ahmad Abbas 担任硬件部门负责人,Abbas 在苹果公司工作五年,参与了 Vision Pro 头显的研发。「Midjourney」是探索 AI 驱动硬件领域的公司之一,其新产品备受行业期待。

安卓/ MacOS 版 ChatGPT 支持「@」功能

ChatGPT的安卓版和MacOS版应用新增了 Mentions 功能,允许用户通过使用「@」字符来调用不同的定制 GPT 模型。用户在输入「@」符号后,将看到一个弹出窗口,列出可用的 GPT 模型供选择,使得用户能够在保持聊天上下文的同时,无缝切换到不同的 GPT 模型。

目前,iOS 平台的 ChatGPT 尚未更新此功能。Mentions 是 ChatGPT 中一个重要的工具,它允许用户在一次对话中与多个专门的 AI 模型互动,每个模型都能提供独特的功能,从而丰富对话内容和用户体验。

国内首个基于物理的 3D 动作生成模型

元象 XVERSE 推出了国内首个基于物理的 3D 动作生成模型 MotionGen,创新性融合大模型、物理仿真和强化学习等前沿算法,用户输入简单文本指令即可快速生成逼真、流畅、复杂的 3D 动作。

MotionGen 基于元象自主研发的 MotionGenGPT 算法,无需人工设定或调整参数,结合强化学习+物理仿真,生成自然逼真的动作。利用 VQ-VAE 提取特征并复用,提供有效且紧凑的动作表征,Transformer 结构在文本与动作表征之间建立复杂而精准的联系。MotionGen 为动画、游戏、电影和虚拟现实行业带来极高创作自由度,零经验创作者也能轻松上手,创造高质量动画。

实景三维大模型书生·天际 3.0

上海人工智能实验室(Shanghai AI Lab)联合多家机构发布的书生·天际[2](LandMark)实景三维大模型迎来了重大升级,实现了渲染效率的大幅提升,提速近 6 倍,支持 VR 设备,为用户提供沉浸式虚实融合体验。

书生·天际 3.0 通过算法全面演进和训练系统的创新支撑,提供了更全面、更沉浸的交互体验,引入 Octree-GS 算法,结合八叉树空间结构和 3D 高斯算法,实现高效渲染。书生·天际训练渲染系统(LandMark System)可兼容多种算法和硬件资源,支持多样化高质量实景三维重建。书生·天际 3.0 的算法和系统已开源,并提供免费商用,推动了实景三维技术在城市规划、智慧文旅、游戏开发、影视制作等领域的应用。

中国能源化工行业首个大模型昆仑发布

中国石油发布 330 亿参数昆仑大模型,是中国能源化工行业首个通过备案的大模型。昆仑大模型由中国石油、中国移动、华为公司和科大讯飞联合打造,四方于今年 5 月签署合作共建协议,遵循“五个一”行动计划,训练了 8 个大模型并研发了 18 个应用场景。

昆仑大模型发布了不同层次、类型、尺寸的 8 个大模型,满足多样化业务场景需求。包括 130 亿参数和 330 亿参数的语言大模型,3 亿参数的视觉大模型,提升行业知识问答、概念理解等专业能力;50 亿参数地震解释和 1 亿参数测井处理解释专业大模型,显著提高智能化应用效果;130 亿参数智能问数、3 亿参数设备识别、160 亿参数客户营销场景大模型,支持智能运营和图文生成等业务需求。

OpenAI 估值超千亿美元

OpenAI 正接近完成其历史上的又一重要里程碑,据悉该公司正在进行新一轮融资谈判,本轮融资将使 OpenAI 的估值超过 1000 亿美元(约 7124.5 亿元人民币),Thrive Capital 正在主导本轮融资,预计将投资 10 亿美元(约 71.24 亿元人民币)。

OpenAI 的估值在今年早些时候已超过 800 亿美元(约 5699.6 亿元人民币),相比上一年的 290 亿美元大幅增长。微软作为 OpenAI 最大的支持者,也参与了本轮融资,但具体细节未公开。

晶泰科技与协鑫集团签署 5 年战略协议

晶泰科技与协鑫集团在苏州协鑫能源中心正式签署了为期 5 年的战略合作协议,协鑫集团将向晶泰科技支付预计 1.35 亿美元的研发费用,支持其在钙钛矿、超分子、锂离子电池等新能源材料领域的研究。晶泰科技将利用其在 AI 与机器人自动化领域的技术优势,为协鑫提供定制化的研发服务。

晶泰科技将为协鑫打造 AI+自动化数智创制系统,实现新材料的快速设计、高定制功能材料开发及工艺的高效应用。双方计划在深圳河套合作区成立新材料研究院,加强 AI 在能源领域的应用孵化。共同开发具有行业竞争力的差异化新材料,推动新能源产业的绿色低碳和高质量发展。

谷歌发布突破性 AI 游戏引擎 GameNGen

谷歌研究团队推出了名为 GameNGen[3]世界首个完全由神经模型驱动的游戏引擎,GameNGen 能够在单个 TPU 上以每秒 20 帧的速度实时生成可玩的游戏,利用扩散模型预测每一帧,实现了与原始《毁灭战士》游戏相媲美的视觉效果。

通过 AI 模型,GameNGen 能够自动模拟复杂的游戏环境,无需传统游戏引擎的手动编程,相较于传统游戏开发,这一技术有望显著降低开发时间和成本。尽管目前 GameNGen 专注于《毁灭战士》这款游戏,但研究团队希望未来能够扩展到更多游戏和互动软件系统。GameNGen 的技术不仅适用于游戏产业,还有望推动虚拟现实、自动驾驶汽车、智能城市等行业的发展。

如果以后再也见不到你,祝你早安,午安,晚安。

——《楚门的世界》



编辑团队

编辑:Yuki

设计:Ivan

商务合作请加微信:Rwkfbcianvd

参考资料

[1]

Freepik Mystic: https://www.freepik.com/free-photos-vectors/mystic

[2]

书生·天际: https://github.com/InternLandMark

[3]

GameNGen: https://arxiv.org/abs/2408.14837

十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
 最新文章