AI万象
全球首位机器人艺术家作品即将在苏富比拍卖,估价18万美元
道琼斯和《纽约邮报》起诉AI初创公司Perplexity侵权
大平台动作
突破性技术:OpenAI推出高效的sCM连续时间一致性模型
Anthropic重磅升级Claude 3.5系列模型,支持像人一样操控计算机
高通发布骁龙8至尊版,AI成为核心特性
智谱与中国三星官宣战略合作:AI手机与GLM大模型相结合
讯飞星火4.0 Turbo发布!多模态能力大升级
新力量崛起
Archetype AI发布“牛顿”物理学大模型,能从传感器数据中学习物理原理
投融资风向
IDC:到2028年全球AI支出将翻倍,高达6320亿美元
印度初创公司Neysa获3000万美元融资,剑指AI基础设施发展
01
全球首位机器人艺术家作品即将在苏富比拍卖,估价18万美元
AI万象
CBSnews于10月21日报道,苏富比拍卖行将于本月举办“数字艺术日”的拍卖活动,其中由类人机器人艺术家Ai-Da创造的《AI God》肖像画备受关注。
该肖像画对象是阿兰・图灵(Alain Turing),这位数学家和计算机科学家被认为是现代计算的始祖,图灵还被称为“AI之父”,是最早对现在所称的“人工智能”提供一些见解的人之一。
这幅肖像画尺寸为64x90.5英寸(约1.63*2.3 米),由Ai-Da机器人今年创作,签名为“A”,预计在苏富比网站上的列表中拍卖价格在12万美元到18万美元之间,拍卖将于10月31日开始。
Ai-Da机器人被描绘为女性,是由英国艺术经销商和画廊老板艾丹・梅勒(Aidan Meller)创建的一个项目。该机器人可以利用眼中的摄像头、人工智能算法和机械手臂进行绘画和作画。梅勒表示:“这件艺术作品与其他AI生成的作品不同之处在于,Ai-Da有一个实体表现。这是这种类型的机器人作品首次进入拍卖”。
Ai-Da机器人并不是首次亮相,她曾在2022年的格拉斯顿伯里音乐节上为许多知名音乐人创作肖像,这次拍卖的收益将会全部用于支持Ai-Da项目,以便继续推动机器人艺术创作的发展。
新闻拓展:
https://news.qq.com/rain/a/20241016A0A1LI00
02
道琼斯和《纽约邮报》起诉AI初创公司Perplexity侵权
AI万象
当地时间10月21日,新闻集团旗下道琼斯集团和《纽约邮报》起诉了人工智能(AI)初创公司Perplexity,指控后者大规模侵犯版权。
诉讼要求Perplexity停止使用这些新闻文章来回答用户的问题,并且还希望法院能下令销毁任何包含这些版权作品的数据库。Perplexity AI被指控在未经许可或支付费用的情况下,聚集了大量的受版权保护的内容,以便通过一种称为 “检索增强生成”(RAG)的机制,向用户提供答案。
新闻集团首席执行官罗伯特・汤姆森对此表示强烈不满,认为Perplexity的行为是对知识产权的滥用,损害了记者、作家和出版商的利益。他在声明中指出,“Perplexity无情地复制了大量受版权保护的内容,并且毫无羞耻地将其重新包装为原始来源的替代品。”
成立于2022年的Perplexity AI自称是一款“免费 AI 问答引擎”,旨在通过一种兼具聊天机器人和搜索引擎功能的方式来挑战谷歌。去年,该公司月活跃用户达到了1000万,而其最新的融资轮估值已达到约10亿美元。
除了道琼斯集团和《纽约邮报》之外,今年6月,Perplexity就因未经支付或注明出处而被指控抄袭CNBC和福布斯的内容。上周,《纽约时报》也向Perplexity发出了“停止侵权”通知,要求其停止使用该报的内容进行生成性AI的用途。
为了应对AI技术带来的挑战,新闻集团早前与OpenAI达成了一项多年合作协议,允许后者使用其新闻内容进行训练和回答用户问题。汤姆森表示,“我们更愿意与有原则的公司合作,而不是诉诸法律。但为了我们的记者和作家,我们必须挑战内容盗窃现象。”
新闻拓展:
https://new.qq.com/rain/a/20241022A00IV800
03
突破性技术:OpenAI推出高效的sCM连续时间一致性模型
大平台动作
10月24日,OpenAI的研究科学家路橙(Cheng Lu)与战略探索团队负责人宋飏(Yang Song)发布了一篇研究论文,提出了一些可简化、稳定化和扩展连续时间一致性模型的技术。
这一模型在生成多媒体内容(如图像、视频和音频)的速度上实现了飞跃,相较于传统的扩散模型,速度提高了整整50倍。具体来说,sCM能够在不到0.1秒的时间内生成一幅图像,而传统扩散模型则往往需要超过5秒。研究团队通过这项技术,成功地在仅需两次采样步骤的情况下,生成出高质量的样本。这一创新使得生成过程更为高效,而不会牺牲样本的质量。
sCM模型的最大亮点是,它能在不增加计算负担的情况下,实现更快的采样速度。OpenAI的最大sCM模型拥有15亿个参数,在一块A100GPU 上,生成样本的时间仅为0.11秒,使实时生成式AI应用更加可行。
在样本质量方面,sCM在ImageNet512×512数据集上经过训练,达到了1.88的Fréchet Inception Distance(FID)分数,这与顶级扩散模型相差不到10%。通过与其他先进生成模型进行广泛基准测试,研究团队证明了sCM在提供顶尖结果的同时,计算开销也显著减少。
未来,sCM模型的快速采样和可扩展性将为多个领域的实时生成AI应用开启新的可能性。从图像生成到音频和视频合成,sCM都提供了一个实用的解决方案,满足了对快速、高质量输出的需求。同时,OpenAI的研究还暗示了进一步优化系统的潜力,可能会根据不同产业的需求来加速模型的性能。
新闻拓展:
https://mp.weixin.qq.com/s/hPxOJrM6KqxMVKEJA-j5wQ
04
Anthropic重磅升级Claude 3.5系列模型,支持像人一样操控计算机
大平台动作
当地时间10月22日,Anthropic宣布Claude3.5系列模型的重磅升级,包括全新的Claude3.5Sonnet和Claude3.5Haiku。升级后的版本号称可以让人工智能全面接管用户的个人电脑,它能够执行多种基本任务,比如模拟输入键盘和鼠标点击,从而使用电脑上安装的任何应用程序。
新的Claude3.5Sonnet在各方面都有显著提升,尤其是在编码能力方面。它在SWE-bench Verified上的得分从33.4%提升到49.0%,超越了所有公开可用的模型,包括OpenAI的o1-preview模型。
新推出的电脑使用功能是一个全新的尝试。官方表示这并不是为Claude开发特定的工具,而是教授它通用的计算机技能,让它能够使用各种标准工具和软件程序。开发者可以利用这一能力来自动化重复的流程、构和测试软件,以及进行开放性研究等。
Anthropic的首席科学官贾里德・卡普兰在接受采访时表示:“我们即将进入一个新时代,人工智能可以利用你作为个人所使用的所有工具来完成任务。” 这项更新标志着Anthropic在将商业AI模型从传统的聊天框架扩展为全面的“AI代理”方面迈出了重要一步。
升级后的Claude3.5Sonnet现在可供所有用户使用,开发人员可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用计算机测试版进行构建。而新的Claude3.5Haiku将于本月晚些时候发布。
新闻拓展:
05
高通发布骁龙8至尊版,AI成为核心特性
大平台动作
美国夏威夷时间10月21日,高通在骁龙技术峰会上发布了全新旗舰移动平台——骁龙8至尊版。这款芯片采用台积电第二代3nm工艺制造,搭载高通自研的Oryon CPU架构,实现了性能和能效的双重提升。
骁龙8至尊版是高通首款采用全大核设计的移动平台,取消了此前大小核混合的设计思路。其CPU部分由两个主频高达4.32GHz的超级核心和六个主频为3.53GHz的性能核心组成,创下了手机处理器频率的新纪录。与上一代骁龙8Gen3相比,骁龙8至尊版的CPU性能提升最高可达50%,能效提升最高可达45%。
过去两个月,各大手机厂商都在强调AI+手机的概念,除了苹果的Apple Intelligence(苹果智能)以外,荣耀推出了“AI智能体”,vivo推出了“PhoneGPT”,而OPPO则推出了“AIOS”概念。去年骁龙峰会上发布的骁龙8 Gen3处理器,是高通首个专门为生成式AI打造的移动处理平台。今年的骁龙8至尊版不但在性能上提升巨大,更是将终端侧AI落地的概念进一步具象化。
骁龙8至尊版对高通AI引擎进行了全面升级,包括CPU、GPU、NPU等各个模块。其中,Hexagon NPU的性能和能效都提升了45%,传感器中枢的AI性能提升了60%,AI推理速度提升了45%。骁龙8至尊版还首次支持在终端侧离线运行个性化、多模态的AI助手,语音交互更加灵敏,几乎感觉不到延迟。
影像方面,骁龙8至尊版打造了全新的AI ISP,并与Hexagon NPU深度集成,能够直接在终端侧处理AI特性。NPU首次能够直接访问ISP上的原始RAW传感器数据,实现对4K60fps 视频拍摄进行实时AI辅助增强。此外,骁龙8至尊版还支持无限语义分割、实时AI补光、视频魔法消除等AI影像功能。
连接方面,骁龙8至尊版是全球首个支持AI增强5G和Wi-Fi连接的移动平台,集成骁龙X805G基带及射频系统。骁龙80基带实现了多个行业第一,包括首个支持下行6载波聚合、首个支持6个Rx接收器路径、首个支持AI/5G-A融合等。此外,骁龙8至尊版还支持AI增强的Wi-Fi7,峰值速度号称是竞品的2.4倍。
新闻拓展:
06
中国三星与智谱官宣战略合作:AI手机与GLM大模型相结合
大平台动作
10月22日,中国三星与智谱宣布战略合作,双方称将在AI手机领域展开深度共创,共同打造卓越体验的AI产品。
三星电子大中华区用户体验战略副总裁许元默表示:“此次深度合作,我们将三星AI硬件优势和对标全球体验的应用场景与智谱GLM大模型相结合,一起为用户打造更加优质、个性化的AI手机和智能服务。”
智谱CEO张鹏表示:“未来,我们将与三星携手,共同从生产力、创造力、娱乐等方面,为用户打造更加优质的全新AI体验。”
此次战略合作标志着AI技术在智能手机领域的应用迈入了一个新的阶段。通过集成GLM大模型,三星将能够提供更为精准的用户画像与推荐系统,使得AI能够更加人性化地满足用户的期望和需求。这种深度学习与自然语言处理的结合,有望实现机器学习算法在实际生活场景中的广泛应用。
此前高通宣布与智谱合作,为骁龙8至尊版适配优化GLM-4V端侧视觉大模型,支持丰富的多模态交互方式:
通过手机摄像头获取穿搭建议
利用视觉信息实现智能导航
通过车内摄像头识别遗留物品
拍摄画作进行风格解析
新闻拓展:
https://baijiahao.baidu.com/s?id=1813698686888575920&wfr=spider&for=pc
07
讯飞星火4.0 Turbo发布!多模态能力大升级
大平台动作
在10月24日举行的科大讯飞全球1024开发者节上,科大讯飞发布“星火大模型4.0Turbo版本”,底座能力再次升级,具备多模态视觉交互及超拟人虚拟人交互能力。
公司董事长刘庆峰介绍,星火4.0 Turbo在七大核心能力上全面超越国际竞品,特别是在数学和代码能力上表现尤为突出,且整体效率提升了50%。数学方面,该模型已验证超长思维链、树搜索和自我反思评价等算法,预期年底将大幅提升高难度数学处理能力。在对比测试中,星火4.0 Turbo在全球中英文14项主流测试集中斩获9项第一。
发布会上,科大讯飞还推出了10项基于讯飞星火底座能力的硬核产品与创新应用。这些产品包括超拟人数字人、星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型等。
其中,“星火超拟人数字人”是业界首次实现语义贯穿的“口唇-表情-动作”超拟人数字人生成。这意味着数字人可以更自然地与用户进行语音和视频通话,其表情和动作能够与说话内容相匹配,提供更真实的交互体验。科大讯飞的星火超拟人数字人还支持多模态交互,能够识别摄像头中的内容。
新闻拓展:
https://mp.weixin.qq.com/s/Q6LnxpiFNtd_iuEXM6lHpw
08
Archetype AI发布“牛顿”物理学大模型,能从传感器数据中学习物理原理
新力量崛起
近日,来自Archetype AI的研究人员开发了一个物理学基础大模型,名为“牛顿”(Newton),该模型仅通过分析传感器数据,就能准确地预测各种物理现象,甚至包括那些在训练过程中从未接触过的现象,这项突破性研究成果或将彻底改变物理研究的方式。
传统上,为物理现象构建AI模型需要将大量的物理定律和专业知识作为先验信息输入模型,这使得模型的应用范围受到限制,难以泛化到其他领域。而牛顿大模型则采用了全新的“唯象学”方法,完全不依赖任何物理定律或先验知识,而是通过分析海量的传感器数据来自行学习和理解物理世界的运行规律。
研究人员使用来自41个公开数据集的5.9亿个传感器数据样本对模型进行了训练,涵盖了电流、流体流动、光学等多种物理现象。经过训练的牛顿大模型能够对各种物理行为进行编码和预测,包括机械运动、热力学等,甚至可以预测城市规模的气象变化等复杂的非解析性物理过程。
为了验证模型的泛化能力,研究人员进行了一系列实验,包括使用弹簧质量系统模拟机械振荡,以及利用温差发电装置模拟热力学现象。实验结果表明,牛顿大模型能够准确地预测这些物理系统的未来行为,其预测精度甚至超过了专门针对特定物理系统训练的模型。
牛顿大模型的出现为物理研究带来了新的可能性。它可以帮助科学家们更快、更准确地分析实验数据,发现新的物理规律,甚至可以用于预测和控制复杂的物理系统。此外,该模型还具有“零样本推理”能力,这意味着它可以对从未接触过的物理现象进行预测,这为科学发现开辟了新的领域。
新闻拓展:
09
IDC:到2028年全球AI支出将翻倍,高达6320亿美元
投融资风向
10月24日,国际数据公司(IDC)发布了最新的全球人工智能和生成式人工智能支出指南,预计到2028年,全球在人工智能(AI)方面的支出将翻倍,达到6320亿美元。这一增长的主要驱动力是生成式人工智能技术(Gen AI)逐渐被更多产品整合,让人期待的同时也给企业带来了新的投资机会。
根据IDC的预测,从2024到2028年,全球人工智能市场的复合年增长率将达到29%。这意味着,企业在AI技术、应用程序和相关服务上的投入将显著增加。而生成式人工智能的投资尤为突出,其五年复合增长率高达59.2%。虽然目前生成式人工智能的支出仍然低于其他类型的AI应用,比如机器学习和自然语言处理,但随着时间推移,这一领域的投资将快速增长,预计到2028年,其支出将达到200亿美元,占到总支出的32%。
在支出类别方面,人工智能软件将成为最大的支出领域,预计占整个市场的一半以上。所有软件支出中,有三分之二将用于支持AI的应用程序和平台,其余则用于开发和部署AI应用。而在硬件方面,包括服务器和存储,支出将成为第二大类别,IT和商业服务的增长率也不容小觑,预计复合年增长率为24.3%。
各个行业的AI应用支出也有明显差异,IDC预测未来五年,金融服务行业将领跑,贡献超过20%的AI支出,其次是软件和信息服务以及零售。值得一提的是,商业和个人服务领域的AI支出增长最快,年均增长率达到32.8%。
AI基础设施配置将是主要的应用场景,但其增长率相对较低,预计复合年增长率为14.7%。而支出增长最快的应用场景包括增强索赔处理和数字商务,年均增长率分别为35.8% 和33.2%。在IDC所涵盖的42个AI应用场景中,30个应用场景的年均增长率将超过30%。
新闻拓展:
https://mp.weixin.qq.com/s/O1k9iZvtxhXJtIJFRVkADg
10
印度初创公司Neysa获3000万美元融资,剑指AI基础设施发展
投融资风向
近日,Neysa完成A轮融资获3000万美元,本轮投融资由Nexus Venture Partners、经纬印度Matrix Partners India、NTTVC联合领投。
Neysa是一家总部位于孟买的初创公司,由资深科技企业家Sharad Sanghi领导,Sanghi之前曾在数据中心供应商Netmagic工作超过27年,并于2016年被日本NTT数据收购。2023年,他与前同事Anindya Das一起创立了Neysa,专注于云基础设施和AI。Sanghi在采访中提到,他希望为企业提供基础设施即服务、平台即服务、推理即服务等服务,帮助开发者顺利开展AI相关工作。
Neysa的旗舰产品Velocis于今年7月推出,旨在为企业客户提供按需的计算基础设施。与此同时,Neysa还计划在年底前推出开发者平台和推理即服务。为了提升基础设施管理和AI工作负载安全性,该公司还在开发相关的可观察性工具。
Neysa目前正面临全球云服务巨头的竞争,包括AWS、谷歌云平台和微软Azure等传统供应商,以及CoreWeave和Lambda Labs等新兴公司。Sanghi 表示,Neysa的灵活性是其最大的竞争优势之一。他们提供公共云和私有集群的选择,并且其所有平台均基于开源技术,客户不会被锁定在某一特定平台上。
印度的人工智能市场正在迅速发展,根据IT行业协会Nasscom和咨询公司BCG的一份联合报告,预计到2027年,印度的AI市场将达到170亿美元。
新闻拓展:
https://techcrunch.com/2024/10/21/indias-neysa-bags-30m-to-compete-with-global-ai-hyperscalers/
信息来源:WAIC综合整理