AI反诈“奶奶”上线,24小时花式套路诈骗分子;AMD 全球裁员4%,约1000人|一周热门

学术   2024-11-16 08:24   北京  


一周热门将从【企业动态】【技术前瞻】【政策与安全】【专家观点】四部分,带你快速跟进大模型行业热门动态。



企业动态


OpenAI、谷歌和 Anthropic 正苦于打造更先进的 AI 模型


OpenAI 在 9 月份完成了对大型新人工智能模型 Orion 的首轮训练,并希望该模型能大幅超越 ChatGPT 背后技术的先前版本,但据两位熟悉此事的人士透露,这个模型并没有达到公司的预期性能。另据三位知情人士透露,谷歌即将推出的 Gemini 迭代版本也同样没有达到内部预期。与此同时,Anthropic 期待已久的 Claude 3.5 Opus 的发布时间也在推迟。


苹果推出带有更多 AI 功能的 Final Cut Pro 11 


Final Cut Pro X 推出十多年后,现更新为 Final Cut Pro 11,更新内容包括新的 AI 遮罩工具、直接在时间线中生成字幕的功能、空间视频剪辑功能以及一系列工作流程改进。


OpenAI 计划明年初推出 AI 智能体 Operator


OpenAI 正准备发布一款能够控制计算机并独立执行任务的自主 AI 智能体——Operator。该公司计划在 1 月份将其作为研究预览版和开发者工具推出。Operator 的开发预示着人工智能系统将向主动接触计算机界面转变,而不仅仅是处理文本和图像。


AMD 全球裁员 4%,约 1000 人


日前,AMD 表示,他们将在全球范围内裁员 4%,希望在由英伟达主导的日益增长的人工智能芯片领域站稳脚跟。根据美国证券交易委员会的一份文件,截至去年年底,AMD 拥有 26000 名员工。AMD 是图形处理器(GPU)的第二大生产商,仅次于英伟达。AMD 认为,到 2028 年,AI 芯片的总市场规模将达到 5000 亿美元,但目前其总销售额与英伟达相比相形见绌。


Anthropic 推出 prompt 简化新工具


Anthropic 推出了一套新的工具,旨在在其开发人员控制台中自动化和改进 prompt,此举有望提高企业 AI 开发的效率。新功能旨在通过改进指导 Claude 等 AI 模型生成响应的指 prompt,来帮助开发人员创建更可靠的 AI 应用程序。


DeepL Voice:基于语音和视频的实时文本翻译


DeepL 为该平台增加了一种新模式:音频。用户可以使用 DeepL Voice 听别人用一种语言说话,并实时自动将其翻译成另一种语言——英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。


NASA、微软推出 Earth Copilot,回答地球相关问题


NASA 正在与 Microsoft 合作创建一个 AI 聊天机器人——Earth Copilot,旨在更轻松地访问和理解有关地球的科学数据,其能够通过将 NASA 的广泛地理空间信息总结成易于理解的内容来回答有关地球的问题。目前,Earth Copilot 仅供 NASA 科学家和研究人员使用,他们将评估该工具的功能。他们后续将探索将其集成到 NASA 的可视化、探索和数据分析 VEDA 平台中,该平台已经提供了对该机构部分数据的访问。


马斯克将微软、Reid Hoffman 等列入被告名单


日前,在一份修改后的马斯克对 OpenAI 的起诉书中增加了新的被告,包括 Microsoft、LinkedIn 联合创始人 Reid Hoffman 以及前 OpenAI 董事会成员兼 Microsoft 副总裁 Dee Templeton。修改后的文件还增加了新的原告:Neuralink 高管和前 OpenAI 董事会成员 Shivon Zilis 和马斯克的人工智能公司 xAI。


在诉状中,马斯克的律师辩称,OpenAI 目前正在“积极试图消灭竞争对手”,如 xAI,方法是“迫使投资者承诺不为他们提供资金”。此外,它还涉嫌不公平地从微软的基础设施中获益,并在文件中将其描述为“事实上的合并”。


阿里通义大模型前核心员工被诉违反竞业协议


据《科创板日报》报道,有消息称阿里通义大模型前员工周畅违反竞业协议,阿里方面已起诉递交劳动争议仲裁申请书。公开资料显示,周畅于 2017 年入职阿里,曾担任阿里通义大模型技术负责人。今年 7 月周畅离职后,有媒体报道称,周畅已于 8 月加入字节,从事 AI 大模型相关工作。


彩智科技获数千万元天使轮融资


据《科创板日报》报道,彩智科技宣布完成数千万元人民币天使轮融资。本轮融资由智谱生态基金和盛景嘉成基金联合投资。融资资金将用于产品研发、市场拓展及团队建设。彩智科技成立于 2016 年,致力于基于国产大模型进行领域二次训练与创新应用开发,并研制针对大模型的高精度知识库及训用基础支撑平台。


亚信安全:已与智谱签署战略合作协议


据财联社报道,亚信安全日前在互动平台表示,公司此前已经与智谱签署战略合作协议,双方携手创立战略合作创新中心,主要围绕 AI + 安全技术创新、行业大模型应用、孵化创新等领域展开合作探索,推动 AI 与安全融合并深化在千行百业的落地应用。


腾讯推出 AI 智能工作台 ima


据《科创板日报》报道,腾讯宣布旗下 AI 智能工作台 ima 已正式上线,该平台除了能完成 AI 问答产品的功能(包括问答、创作文字、生成图片等)以外,还打通了微信公众号文章的生态,整个公众号世界里的知识都可为用户所用。


英伟达计划为人形机器人推出 Jetson Thor计算机


据《华尔街日报》报道,英伟达计划面向人形机器人市场推出 Jetson Thor 计算机。英伟达并不直接参与机器人制造,类似于谷歌向手机制造商提供安卓平台,将其定位为技术供应商。Jetson Thor 计算机隶属于英伟达 Jetson 紧凑型计算机平台,该平台专为 AI 应用设计,而 Thor 型号专注于机器人技术。


小米布局 AI 眼镜,预计明年 Q2 发布


据《36氪》消息,小米正计划推出一款 AI 眼镜,数月前已与歌尔合作,该产品预计于 2025 年 Q2 发布。对于这款产品的出货量,雷军的预期“在三十万台往上”。知情人士表示,小米 AI 眼镜将“全面对标 Meta Ray-ban”,搭载 AI 功能、音频耳机模块、摄像头模块,并将以小米自有品牌形式发布。对此,小米方面暂无回复。


阿里国际推出全球首个B2B AI搜索引擎Accio


据《科创板日报》报道,阿里国际面向全球商家推出了首个 B2B AI 搜索引擎 Accio。据悉,该产品页面的主体为对话框,通过对话式体验,主动理解用户需求,提供一步到位的智能采购服务,支持英语、德语、法语、西班牙语和葡萄牙语 5 种语言。


苹果最快将于明年 3 月推出基于 AI 的智能家居设备


据财联社报道,苹果公司最快将于明年 3 月推出基于 AI 的智能家居设备。该设备将拥有 FaceTime、Siri、Apple Intelligence 功能,并接入摄像头、门铃、并运行苹果的一系列 APP,在智能家居领域同亚马逊和谷歌公司竞争。



技术前瞻


世界上最小的视觉语言模型


Omnivision 是一种紧凑型、亚亿次(968M)多模态模型,用于处理视觉和文本输入,并针对边缘设备进行了优化。它在 LLaVA 架构的基础上进行了改进,具有以下特点:

  • 9 倍 token 减少:将图像 token 从 729 个减少到 81 个,降低了延迟和计算成本。

  • 提高准确性:利用可信数据进行 DPO 训练,减少幻觉。


国防科技大学推出 AI 材料科学家 MatPilot


在这项工作中,国防科技大学团队提出了一个人工智能(AI)材料科学家——MatPilot,其在新材料发现方面展现出了强大的能力。MatPilot 的核心优势在于其自然语言交互式人机协作,通过多智能体(agent)系统增强人类科学家团队的研究能力。



FinVision:用于股市预测的多智能体框架


在这项工作中,伊利诺伊大学芝加哥分校团队提出了一种专为金融交易任务设计的多模态多智能体(agent)系统,其采用了一个基于 LLM 的专业智能体团队,每个智能体都擅长处理和解释各种形式的金融数据,如文本新闻报道、蜡烛图(K 线图)和交易信号图。该方法的一个主要特点是集成了反思模块,可以对历史交易信号及其结果进行分析。这一反思过程有助于增强系统对未来交易情景的决策能力。



MagicQuill:智能交互式图像编辑系统


在这项工作中,来自香港科技大学和蚂蚁集团的研究团队及其合作者,提出了一个能够快速实现创意想法的集成图像编辑系统——MagicQuill。该系统拥有精简但功能强大的界面,只需极少的输入就能进行清晰的编辑操作(如插入元素、擦除对象、更改颜色)。这些交互由多模态大语言模型(MLLM)监控,实时预测编辑意图,从而避免了明确的提示输入。


语言模型是隐藏推理器:通过自我奖励增强推理


在这项工作中,Salesforce AI Research 团队提出了 LaTent 推理优化(LaTRO),这是一个原则性框架,它将推理表述为从潜在分布中采样,并通过变异方法对其进行优化。LaTRO 可使 LLM 同时改进其推理过程和评估推理质量的能力,而无需外部反馈或奖励模型。在 GSM8K 数据集上,与基础模型相比,LaTRO 平均提高了 12.5%,与 Phi-3.5-mini、Mistral-7B 和 Llama-3.1-8B 的监督微调相比,提高了 9.6%。



FrontierMath:AI 的高级数学推理能力评估 


人工智能系统可能擅长生成文本、识别图像,甚至解决基本的数学问题,但在高级数学推理方面,它们却碰壁了。新基准 FrontierMath 揭示了当今的人工智能离掌握复杂的高等数学还有多远。FrontierMath 由 Epoch AI 研究小组开发,收集了数百个原创的、研究级别的数学问题,这些问题需要深度推理和创造力,而人工智能仍然缺乏这些能力。



点击“阅读原文”,获取更多大模型论文



政策与安全


《通用人工智能业务守则》初稿发布


根据欧盟《人工智能法案》(AI Act),适用于通用人工智能模型提供商的业务守则初稿已经公布,同时还邀请各方提供反馈意见(开放至 11 月 28 日),起草过程将持续到明年,在未来几年正式合规截止日期到来之前。这项泛欧法律于今年夏天生效,在基于风险的框架下对人工智能的应用进行监管。但它也针对功能更强大的基础或通用人工智能模型采取了一些措施。


专家敦促采用复杂系统方法评估人工智能风险


随着人工智能日益渗透到我们生活的方方面面,专家们也越来越担心人工智能的危险。科学家们指出,要想了解这些威胁,还需要一种连贯的方法。他们呼吁从复杂系统的角度来更好地评估和减轻这些风险,特别是考虑到长期的不确定性以及人工智能与社会之间复杂的相互作用。



专家观点


Ilya Sutskever:我们又回到了好奇和发现的时代


Ilya Sutskever 最近表示,使用大量未标记的数据来理解语言模式和结构已趋于稳定。“2010 年代是扩展的时代,现在我们再次回到了奇迹和发现的时代。每个人都在寻找下一个目标,”Sutskever 说道。“现在,扩大正确的规模比以往任何时候都更加重要。”因为人工智能公司专注于预训练、推理改进和寻找“下一个目标”。


Gartner:到 2027 年,40% 的 AI 数据中心因电力短缺影响运营


据《科创板日报》报道,市场调查机构 Gartner 发布报告称,AI 和生成式 AI 正推动电力消费急剧增长,未来两年数据中心的增长率或超过 160%。该机构警告称,到 2027 年,40% 的现有 AI 数据中心将因电力供应不足而受到运营限制。


民生证券:AI 搜索有望成为首个商业化落地 C 端超级应用


日前,民生证券发布研报称,AI 搜索有望成为首个商业化落地的 C 端超级应用,全球科技巨头纷纷入局,传统搜索变革有望带来海量商机,形成软件+终端等多入口、平台型 AI 搜索与垂直型 AI 搜索的全新搜索模式,有望重塑搜索的整体行业。


中国移动王晓云:智能体是驱动 6G 发展的新动能


在 2024 全球 6G 发展大会上,中国移动通信集团有限公司副总工程师、首席科学家王晓云表示,智能体是驱动 6G 发展的新动能,实现 6G 商业闭环一方面要围绕智能体带来的新交互范式、新能力要素进行创新设计,另一方面要从关注功能到关注网络整体效能,通过 AI 降本增效。



其他


AI反诈“奶奶”上线,全天花式套路诈骗分子


O2 今天发布了其防欺诈团队的最新成员“Daisy”。作为“诈骗者关系主管”,这位先进的人工智能老奶奶的任务是与诈骗者交谈,用类似人类的喋喋不休的聊天方式尽可能多地浪费他们的时间,让他们远离真人。



AI 耳机创造了一个“声音泡泡”


华盛顿大学研究人员领导的一个团队创造了一种耳机原型,可以让听众创造出这样一个“声音泡泡”。该团队的人工智能算法与耳机原型相结合,可以让佩戴者听到一个半径为 3 到 6 英尺的气泡内的说话声。即使远处的声音比气泡内的声音大,气泡外的声音也会被平均降低 49 分贝(大约相当于真空和树叶沙沙声的差别)。该团队在《自然电子学》杂志上发表了他们的研究成果。


Keras 创建者 François Chollet 将离开谷歌


人工智能大牛 François Chollet 将离开谷歌,他已在谷歌工作近十年。这位 34 岁的法国开发者在 X 网站上发帖称,他将与“一位朋友”创办一家新公司,但他拒绝透露更多细节。Chollet 最为人熟知的身份可能是 Keras 的创建者,Keras 是一种高级别的开源 API,可用于创建人工智能模型和处理机器学习任务。


研究发现:人类读者更青睐 AI 生成的诗句


根据《科学报告》发表的一篇新论文,读者无法可靠地区分 AI 生成的诗歌和人类创作的诗歌,而且人们更有可能青睐 AI 的诗。这种对 AI 诗歌的积极评价倾向,可能是因为读者错将人类创作诗句的复杂性当作是 AI 写作的不连贯,以及低估了生成式 AI 表现出的与人类的相似程度。作者认为,参与者偏好 AI 诗歌是由于这些诗比知名诗人的作品更直白、更易读。此外,参与者预期自己会偏好人类写作的诗歌,而他们发现 AI 生成的诗歌更易阐释和理解,误以为自己的偏好表明了诗歌由人类所创作。


研究发现:美国工人采用人工智能的增长放缓


Slack 委托进行的一项新研究显示,33% 的美国员工表示他们正在工作中使用人工智能,增幅仅为一个百分点。如果人工智能的快速应用曲线放缓或趋于平缓,那么很多关于该技术的非常美好的假设——以及与之相关的非常高的市场估值——都可能发生变化。


只需 10 秒,AI 即可检测出手术中经常漏诊的癌症脑瘤


发表在 Nature 杂志上的一项研究表明,密歇根大学和加州大学领导的研究团队开发了一项名为 FastGlioma 的人工智能驱动的模型,可以在 10 秒内确定手术过程中是否保留了癌性脑肿瘤的任何部分,在识别肿瘤残留物方面的性能远远优于传统方法。“FastGlioma 是一种基于人工智能的诊断系统,有可能通过立即改善弥漫性神经胶质瘤患者的综合管理来改变神经外科领域,”资深作者、密歇根大学健康分校神经外科医生、密歇根大学医学院神经外科助理教授 Todd Hollon 表示。


像人类医生一样熟练的手术机器人


通过观看经验丰富的外科医生的视频,经过训练的机器人能够像人类医生一样熟练地执行相同的手术程序。约翰霍普金斯大学的研究人员在慕尼黑举行的机器人学习大会上展示了这一研究成果。只需输入相机信息,它就能预测手术所需的机器人动作。


用 AI 检测新生儿重症监护室婴儿神经系统变化


西奈山医院的临床医生、科学家和工程师团队在新生儿重症监护室的婴儿视频画面上训练了一种深度学习姿势识别算法,以准确跟踪婴儿的运动并识别关键的神经指标。这项基于 AI 的新工具的研究结果于 11 月 11 日发表在《柳叶刀》杂志的《电子临床医学》上,它将为新生儿重症监护室的连续神经监测带来一种微创、可扩展的方法,提供以前不可能提供的有关婴儿健康的重要实时见解。


成本低 20 倍,AI 驱动的电子鼻可高效探测漏油


研究人员训练了一种检测空气中化学物质的电子鼻,根据挥发性有机化合物的比例来识别石油的来源。由于石油是不同碳氢化合物的混合物,其比例因来源而异,因此电子鼻可用于定位污染土壤的石油泄漏点、监测炼油厂的环境以及进行油田研究。与目前用于测量气体混合物成分的精密设备相比,电子鼻的成本要低 20 倍。它的低成本将使其应用范围更广,包括实地研究。


利用 AI 改进脑癌诊断、监测和治疗


INDIANAPOLIS 团队发布了关于使用人工智能方法更准确地诊断、监测和治疗脑癌患者的新的良好临床实践建议,这是一套有助于确保临床试验结果可靠和患者得到保护的指导方针。据该团队称,医疗保健从业者可以使用预测、预后和诊断 AI 模型和解决方案,但它们的使用方式在不同的机构中差异很大。


Gen AI 模型可预测 4 年后的血糖水平


来自魏茨曼科学研究所、特拉维夫初创公司 Pheno.AI 和英伟达的研究团队开发了 GluFormer 模型,可以根据过去的血糖监测数据预测个人未来的血糖水平和其他健康指标。GluFormer 的 AI 功能可以帮助临床医生和患者发现异常情况,预测临床试验结果,并提前四年预测健康结果。


AI 可从活检图像中“看到”癌症基因特征


日前,来自斯坦福大学医学院的研究团队开发了一种人工智能驱动的计算程序,该程序可以仅根据活检的标准显微镜图像来预测肿瘤细胞内数千个基因的活动。研究团队表明,它可以使用常规收集的活检图像来预测乳腺癌的遗传变异并预测患者的预后。“这种软件可用于快速识别患者肿瘤中的基因特征,加快临床决策并为医疗保健系统节省数千美元,”生物医学数据科学教授、该论文的资深作者 Olivier Gevaert 博士表示。


只需几分钟,AI 比人类更快、更好地发现潜在疾病


华盛顿州立大学开发的一种人工智能模型可以比人类更快、更准确地识别动物和人体组织图像中的病理或疾病迹象。据 Scientific Reports 介绍,该模型可以大大加快疾病相关研究的步伐,还具有改善医疗诊断的潜力,例如在几分钟内就能从活检图像中检测出癌症,而这一过程通常需要人类病理学家花费几个小时。

学术头条
致力于学术传播和科学普及,重点关注AI4Science/大模型等前沿科学进展。
 最新文章