一周AI丨OpenAI重磅发布o1模型;iPhone 16系列发布;快手与蓝色光标战略合作;红杉资本更爱AI软件下游公司……

科技   2024-09-13 17:03   上海  


要闻列表

政策早知道

欧盟最高隐私监管机构对谷歌PaLM2合规性展开调查

大平台动作

OpenAI新模型OpenAI o1重磅发布:更强的推理能力,提示工程大变革


苹果发布史上第一台“专为AI设计”的iPhone,全新按钮将成为视觉智能之关键入口


沃尔沃携手英伟达,未来车型将搭载先进AI芯片


快手与蓝色光标合作,Blue AI心影创作平台将接入可灵API

新力量崛起

Nous Research推出优化器DisTrO,普通网络条件也可以训练AI模型


AI视频生成新进展,Vidu上线“主体参照”功能

投融资风向

红杉资本更爱AI软件下游公司,认为AI相关软件比AI模型更能带来利润


人形机器人公司“加速进化”完成亿元Pre-A轮融资,聚焦双足机器人开发





01

欧盟最高隐私监管机构对谷歌PaLM2合规性展开调查




政策早知道


欧盟的监管机构周四(9月12日)表示,他们正在调查谷歌的一款人工智能模型,原因是担心该模型是否遵守了欧盟严格的数据隐私规定。


爱尔兰数据保护委员会(Ireland's Data Protection Commission)表示,已对谷歌的PaLM2大模型展开调查,其调查正在审查谷歌是否评估过PaLM2的数据处理是否可能对欧盟的“个人权利和自由构成高风险”。这是欧盟在人工智能监管方面更广泛努力的一部分,欧盟27个国家的其他监管机构都在审查人工智能系统如何处理个人数据。


随着人工智能技术的发展,个人数据的保护问题日益受到各国监管机构的重视,尤其是在欧盟这样对数据隐私要求极高的地区。在本月初,爱尔兰监管机构就曾对马斯克的社交媒体平台X展开了行动。X公司最终同意停止使用欧洲用户的个人信息来训练其人工智能聊天机器人Grok,并承诺删除在2024年5月7日至8月1日期间从其社交媒体平台上收集的欧洲用户的公开帖子中的个人数据。此外,Meta平台在爱尔兰监管机构施加压力后,也暂停了使用欧洲用户发布的内容来训练其大型语言模型最新版本的计划;意大利数据隐私监管机构去年因数据隐私泄露而暂时封禁了ChatGPT,并要求开发商OpenAI满足一系列要求以解决担忧。


新闻拓展:

https://baijiahao.baidu.com/s?id=1809968735436773529&wfr=spider&for=pc




02

OpenAI新模型OpenAI o1重磅发布:更强的推理能力,提示工程大变革




大平台动作


当地时间9月12日,OpenAI正式发布了备受期待的AI语言模型OpenAI o1。这款内部代号为“草莓”的新模型声称在"推理"和问题解决能力方面较之前的大型语言模型有显著提升。o1模型系列目前以o1-preview和o1-mini两种形式推出,面向ChatGPT Plus用户和部分API用户开放使用。


o1最引人注目的特点是其拟人化的思考过程。在回答问题前,o1会进入一种特殊的思考模式,将复杂问题分解成多个小步骤逐一解决,生成一条较长的内部思维链,从而得出更加准确的答案。


根据OpenAI的API文档,新模型更喜欢简单直接的提示,需要注意以下几点:

1、保持提示简单直接:模型擅长理解和响应简短、清晰的指令,而不需要大量的指导。

2、避免思路链提示:由于这些模型在内部进行推理,因此不需要提示它们“逐步思考”或“解释你的推理”。

3、使用分隔符来提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来清楚地指示输入的不同部分,帮助模型适当地解释不同的部分。

4、限制检索增强生成 (RAG) 中的附加上下文:提供附加上下文或文档时,仅包含最相关的信息,以防止模型过度复杂化其响应。

新闻拓展:

https://mp.weixin.qq.com/s/sGcx90Q_‍uI8se-DKosj9dw




03

苹果发布史上第一台“专为AI设计”的iPhone,全新按钮将成为视觉智能之关键入口




大平台动作


北京时间9月10日,苹果2024年秋季发布会带来一系列新品,包括iPhone16系列、Apple Watch Series10和AirPods4等。这些新品不仅在硬件上有所升级,还引入了多项AI功能,预示着苹果在人工智能领域的进一步深入。


iPhone 16全系搭载了号称“专为Apple intelligence而生”的全新A18仿生芯片,除了支持 Wi-Fi 7,这颗芯片还设计了专用的16核神经引擎处理单元——其AI端侧算力比前代 iPhone 15提升两倍之多,同时支持硬件光线追踪功能。


新增的相机控制按钮是一个多功能的操作中枢,用户可以通过长按快速启动相机,轻点实现即时拍摄,甚至可以滑动调整拍摄焦段。而且,这个按钮成为视觉智能(Visual Intelligence)的重要入口,它将自动搜索拍摄事物的相关信息,例如通过多模态模型识别拍下的演唱会信息,并添加到日历中。在演示功能里,苹果希望将本地多模态信息,语音、文字、图像融合利用起来,用AI生成最贴合当下情境和个人需求的建议和解决方案。


更值得关注的是,苹果计划向第三方开发者开放这个按键的功能,这意味着未来有望看到更多创新的拍摄应用,甚至可能延伸到其他领域的应用中。


新闻拓展:

‍https://mp.weixin.qq.com/s/8t99RO2Yau_pVDR-FUsA3Q




04

沃尔沃携手英伟达,未来车型将搭载先进AI芯片




大平台动作


9月5日,沃尔沃在全新EX90电动SUV发布会上宣布,将继续与英伟达深化合作,未来的车型将搭载英伟达的芯片。


EX90是沃尔沃首款软件定义的汽车,它采用了英伟达Orin系统芯片,具备每秒超过250万亿次的运算能力。这款SUV的核心计算架构不仅支持深度学习功能,还为其AI驱动的主动安全和驾驶辅助系统提供了强大的支持。


沃尔沃表示,EX90只是未来软件定义汽车的一个起点,未来十年内的新车型将会基于英伟达的Drive Thor SoC,运算能力高达每秒1,000万亿次,能源效率是Orin的七倍。这意味着沃尔沃的新一代汽车将配备更多先进技术,包括更复杂的安全和驾驶辅助功能,以及基于生成式 AI 的车内体验。同时,沃尔沃还宣布将与其软件子公司Zenseact共同建立北欧最大的人工智能数据中心,以增强汽车安全软件的开发能力。


新闻拓展:

https://mp.weixin.qq.com/s/qF_WffyDxEfN6TSNTJ4-nw‍




05

快手与蓝色光标合作,Blue AI心影创作平台将接入可灵API




大平台动作


近日,快手旗下的可灵AI与蓝色光标宣布达成战略合作协议,双方将在AI视频生成技术研发、平台合作、场景共建、内容创作优化等多个领域展开深入合作。


可灵AI是快手自研的新一代AI创意生产力工具,提供AI视频、AI图片及相关可控编辑能力。蓝色光标自研AI行业模型Blue AI心影创作平台将首批接入快手可灵AI视频大模型API,通过将业内领先的AI视频生成大模型引入营销领域,推动营销行业AI应用加速。


据悉,Blue AI心影创作平台将充分利用快手可灵AI视频生成模型的积累,持续优化现有的视频生成工作流,提升视频内容处理的效率和精准度,推进智能视频理解与AI内容生成发展迈上新台阶。同时,双方将基于可灵AI共同进行内容创作优化,加速内容创作场景的应用,强化内容的专业度和精细度,为营销创作带来更加多样的功能体验。


新闻拓展:

https://mp.weixin.qq.com/s/T9NoJIk5sdxgMkYrq4F2Jg‍




06

Nous Research推出优化器DisTrO,普通网络条件也可以训练AI模型




新力量崛起


近日,凭借发布了开源的Hermes 3(基于Llama 3.1)而引起广泛关注的Nous Research,再次宣布了一项重大突破——DisTrO(分布式互联网训练)。


根据Nous Research的技术论文,DisTrO的效率提升惊人,使用它的训练效率比一种常见的算法——All-Reduce 提高了857倍,同时每一步训练所需传输的信息量也从74.4GB降低到了86.8MB。DisTrO的工作原理是,通过降低GPU之间的全梯度同步需求,将通信开销减少了四到五个数量级。这一创新,使得AI模型能够在速度较慢的互联网连接下进行训练,如今许多家庭能够轻松访问的100Mbps下载和10Mbps上传的速度都足够用了。


Nous Research在其社交平台上表示,通过DisTrO,研究人员和机构不再需要依赖某一家公司来管理和控制训练过程,这为他们提供了更多的自由去进行创新和实验。这种开放的竞争环境,有助于推动技术进步,最终惠及整个社会。


新闻拓展:

https://mp.weixin.qq.com/s/epbyp2YIbpaWinbq5TobZg‍




07

AI视频生成新进展,Vidu上线“主体参照”功能




新力量崛起


今年4月,生数科技联合清华大学发布了中国首个原创全自研,长时长、高一致性、高动态性的视频大模型Vidu。9月11日,生数科技在行业内首次发布“主体参照”(Subject Consistency)功能,该功能能够实现对任意主体的一致性生成,让视频生成更加稳定、可控,目前该功能已面向用户免费开放。


所谓“主体参照”,就是允许用户上传任意主体的一张图片,Vidu就能够锁定该主体的形象,通过描述词任意切换场景,输出主体一致的视频。该功能不局限于单一对象,而是面向“任意主体”,无论是人物、动物、商品,还是动漫角色、虚构主体,都能确保其在视频生成中的一致性和可控性,这是视频生成领域的一大创新。Vidu也是全球首个支持该能力的视频大模型。


生数科技董事长、CEO唐家渝表示,“主体参照”功能代表着AI完整叙事的开端,AI视频创作也将迈向更高效、更灵活的阶段。


新闻拓展:

https://mp.weixin.qq.com/s/DxvnA-e8gdddxHV2QB0T_g




08

红杉资本更爱AI软件下游公司,认为AI相关软件比AI模型更能带来利润




投融资风向


9月11日,在高盛集团于旧金山举办的一场活动上,风险投资巨头红杉资本合伙人Pat Grady表示,红杉资本认为,在人工智能领域创立的数十亿美元级公司,大部分将来自应用程序开发,而不是模型构建。


Grady提到,红杉资本在构建基础模型的公司上已经投入了大约1.5亿美元,涉及的企业包括Sam Altman的OpenAI、Ilya Sutskever的安全超级智能公司和Elon Musk的xAI等。但他表示:“我们在应用层投入的资金要多一个数量级,尽管应用层产生的收入要少得多。”


此外,Grady还提到,市场中对人工智能的热情和投资者的兴奋情绪,有时会导致他们过于乐观。“大家都觉得这个东西太酷了,这些人太聪明了,所以他们一定会成功。” 然而,红杉资本会尽量避免这种思维陷阱。他还对OpenAI即将推出的草莓模型表示了看好,称其性能 “相当不错”。


红杉资本希望通过对人工智能应用软件的投资,发掘出未来更多的商业潜力和市场机会。


新闻拓展:

https://baijiahao.baidu.com/s?id=1809955522002367740&wfr=spider&for=pc




09

人形机器人公司“加速进化”完成亿元Pre-A轮融资,聚焦双足机器人开发




投融资风向


人形机器人公司“加速进化”近日完成亿元Pre-A系列轮融资。本轮融资由彼岸时代、民银国际、中关村科学城及 iCANX 基金共同出资,老股东英诺天使跟投,资金将主要用于通用本体打造、提升软件开发能力。


加速进化CEO程昊认为,当前人形机器人热潮是在AI驱动下产生的。他强调,通用人工智能需要新的载体,特别是能够对物理世界产生影响的载体。因此,公司的目标是推动人形机器人从专用性向通用性转变。


在商业化方面,加速进化已经接到了人形机器人订单,计划在年内进行小批量量产并交付。同时,该公司也已启动新一轮融资,以进一步推动技术和产品的落地。


新闻拓展:

https://mp.weixin.qq.com/s/shu7LBirinuMbuFjIOg8UQ



息来源:WAIC综合整理






点击阅读原文观看WAIC 2024精彩

世界人工智能大会
聚焦人工智能行业前沿,跟踪世界人工智能大会信息
 最新文章