AI新闻早报|微软Ignite大会全面升级Copilot、阿里发布Qwen2.5-Turbo

文摘   2024-11-20 09:14   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态

早报搜集过往24小时全球AI新闻动态,周一至周六发送,内容的分类和摘要由AI Agent自动完成

封面图由AI生成

2024-11-20 全球AI新闻早报

今日热点

  • 微软大幅升级Microsoft 365 Copilot,推出AI驱动自动化功能:微软在Ignite 2024大会上重磅发布了Microsoft 365 Copilot的重大更新,核心功能包括Copilot Actions自动化工具、能理解视觉内容的Teams Copilot、多语言翻译的PowerPoint Copilot以及Outlook Copilot的日程安排改进等。Copilot Studio也即将公开预览,允许用户自定义AI代理,以实现企业流程自动化。 这些更新旨在通过AI提升生产力,已在众多《财富》500强企业中应用并取得显著的成本节约和效率提升,例如节省数百万美元的运输成本或每周节省数小时的工作时间。 微软还推出了针对不同行业和任务的AI代理,以及新的Windows 365 Link硬件。IT之家,Computer World,The Register,Digital Trends,Analytics India Tech

  • 大语言模型:阿里巴巴发布了其升级版开源大语言模型Qwen2.5-Turbo,该模型上下文窗口扩展至惊人的100万tokens,处理速度提升4.3倍至68秒,成本仅为0.3元/百万tokens。 在多个基准测试中超越了GPT-4o-mini,展现了强大的长文本处理能力和高性价比,但目前模型权重尚未开源,团队表示正在积极努力中,并承认在真实场景下的长序列任务稳定性仍需改进。 用户可在Hugging Face和魔搭社区体验Demo,并通过阿里云平台获取API服务。量子位,站长之家,IT之家,36氪
  • OpenAI早期内部邮件曝光马斯克对AGI控制权的野心:多封2017年OpenAI内部邮件显示,公司早期成员担忧埃隆·马斯克对人工智能通用技术(AGI)的控制欲,认为其言行不一,表面上不追求绝对控制,实际上却渴望掌握公司领导权。 这导致了马斯克与OpenAI其他创始人之间的冲突,最终马斯克在2018年离开OpenAI。 这些邮件的曝光,在马斯克近期行为背景下,更显其对权力和控制的追求,引发了人们对AGI发展方向的担忧。爱范儿,Futurism,36氪

产品发布

  • 北京大学等联合发布开源视觉语言模型LLaVA-o1:北京大学、清华大学等机构的研究团队发布了新型视觉语言模型LLaVA-o1,该模型具备自发性推理能力,通过独特的四阶段结构化推理机制(总结、描述、推理、结论)显著提升了在复杂视觉问答任务中的性能,并在多个多模态基准测试中超越了包括Gemini-1.5-pro和GPT-4o-mini在内的闭源模型。LLaVA-o1基于Llama-3.2-Vision-Instruct模型开发,仅使用10万条样本进行微调,并已开源代码和预训练权重,为视觉语言模型研究提供了新的方向。量子位,Marktechpost,IT之家
  • 微软将Azure AI Studio升级为Azure AI Foundry,旨在简化企业级生成式AI应用开发和部署。 微软在Ignite 2024大会上发布了Azure AI Foundry,整合了原有的Azure AI Studio以及新功能,例如AI代理服务、预建应用模板和行业特定模型。该平台提供统一的开发环境,支持模型微调、评估、基准测试和RAG功能,并注重数据隐私和安全合规,目标是帮助企业更轻松地构建、运行和管理生成式AI应用程序,提高AI应用落地率,并降低开发和运营的复杂性。The InfoWorld,Silicon Angle
  • 亚马逊AI版Alexa升级计划遭遇严重延误和技术挑战: 亚马逊计划对其语音助手Alexa进行重大AI升级,整合第三方服务并打造全球最佳个人助理。然而,该项目(代号Banyan)进展缓慢,存在严重延迟、用户满意度低、兼容性问题等,原计划2024年发布的目标被推迟至2025年。项目成功与否将决定Alexa的未来,亚马逊高管强调“情感”和“连接性”的重要性,但技术挑战和资源分配问题依然是主要障碍。Business Insider,Fortune
  • Perplexity AI搜索引擎推出购物功能,挑战Google和Amazon:  AI搜索引擎Perplexity上线了新的购物功能,允许用户直接在其平台上搜索、比较和购买商品,付费用户更可享受一键结账和免费配送等特权。该功能利用AI推荐产品,并包含视觉搜索功能“Snap to Shop”,类似Google Lens。Perplexity正积极拓展与零售商的合作,并计划通过广告盈利,以此挑战Google和Amazon等电商巨头在搜索和购物领域的领先地位。Fortune,Digital Trends,Dataconomy
  • Mistral升级Le Chat聊天机器人,增强多模态能力并获得微软投资: 法国AI初创公司Mistral为其聊天机器人Le Chat增加了图像生成、网络搜索、文档分析等功能,并发布了开源多模态模型Pixtral Large。这些更新得益于微软的1600万美元投资,并将Le Chat整合进Azure云平台。Le Chat还增加了任务代理功能,自动化处理重复性工作,提升用户体验。这些改进巩固了Mistral在欧洲AI领域的领先地位,展现其快速迭代和发展潜力。Tech Co

突发事件

  • 亚洲新闻机构ANI和德国音乐版权代理机构GEMA起诉OpenAI侵犯版权: 印度ANI通讯社和德国音乐版权代理机构GEMA分别对OpenAI提起诉讼,指控其未经授权使用其新闻内容和音乐作品训练AI模型,例如ChatGPT。ANI称OpenAI生成的虚假新闻损害了其声誉,GEMA则强调未经授权使用受版权保护的音乐构成侵权。这两起诉讼标志着全球范围内对AI公司使用未经授权内容训练模型的法律挑战日益增多,也凸显了AI发展与知识产权保护之间的冲突,其结果将对未来AI监管框架产生重要影响。(来源: IT之家,Maginative)

技术创新

  • 斯坦福大学利用AI技术创造出1000个高度逼真的人类智能体:斯坦福大学研究团队利用GPT-4模型对1052名志愿者进行深度访谈,并以此训练生成式AI智能体。这些智能体能够以85%的准确度模拟真实人类的行为举止,几乎完美复刻受访者的言谈方式,引发了人们对AI伦理和社会影响的广泛讨论。这项研究标志着AI在模拟人类互动方面取得了重大突破,也预示着虚拟世界中人物角色的拟真度将达到前所未有的高度。 站长之家

  • Niantic利用《Pokémon Go》玩家数据训练AI导航系统:Niantic公司宣布利用《Pokémon Go》玩家和Scaniverse应用用户提供的视觉扫描数据,训练其名为“大型地理空间模型”(LGM)的AI系统。该系统通过分析数百万张来自全球各地玩家拍摄的照片,构建高精度3D地图和VPS(视觉定位系统),能够更精准地确定位置和方向。这项技术不仅应用于Niantic的游戏,还将拓展至增强现实、机器人和自主驾驶等领域,但其数据采集方式也引发了公众对隐私的担忧。Ars Technica

  • MIT利用“测试时训练”技术提升大模型推理能力:麻省理工学院的研究人员通过“测试时训练”(TTT)技术,对Llama 3 8B模型进行优化,在ARC-AGI基准测试中取得了61.9%的准确率,超越了此前最佳成绩,达到了与普通人类相当的水平。该基准旨在评估人工智能的通用智能发展,MIT的研究强调了TTT技术在提升大模型推理能力中的重要性,并指出未来需要更多样化数据和任务来进一步增强模型能力。Analytics India Tech

  • 谷歌回应AI芯片设计质疑:近日,一篇发表于arXiv平台的论文《那颗芯片已经启航:对芯片设计中人工智能基础不足的怀疑态度的批判》质疑了AI在芯片设计中的应用效果,并对谷歌的一些说法提出质疑。论文通过对比实验和分析,论证了AI在提升芯片设计效率和质量方面的潜力,但也指出了现有方法的不足。谷歌首席科学家Jeff Dean参与了这篇论文的撰写,回应了此前对其自动AI芯片设计研究的质疑。机器之心

  • 代理式RAG技术超越传统RAG,引领AI系统新方向:  IBM等公司推出了结合AI代理的“代理式RAG”技术,赋予检索增强生成系统自主性和灵活性,使其能够自主执行任务、选择合适的检索工具并动态调整策略,从而更好地处理复杂任务。然而,该技术也面临质疑,有人认为其在核心AI系统足够强大的情况下是资源浪费,Google提出的检索交织生成(RIG)技术也提供了另一种思路。Analytics India Tech

商业合作

  • OpenAI斥巨资购买Dotdash Meredith内容授权: OpenAI与数字媒体公司Dotdash Meredith达成协议,每年至少支付1600万美元,获得旗下《食品与葡萄酒》等多个知名出版物的内容授权,用于训练ChatGPT等AI模型。这笔交易还包括Dotdash Meredith利用OpenAI技术提升自身广告定位和内容分发,标志着出版商与AI公司合作的新趋势,也引发了关于版权和作者权益的讨论。实际支付金额可能高于1600万美元,具体数字将根据后续计算而定。Engadget
  • 富士康与英伟达合作打造AI赋能的iPhone生产线: 富士康(鸿海)宣布与英伟达合作,利用英伟达Omniverse平台在台湾新竹工厂创建3D数字孪生,模拟和优化自动化生产线,以提升生产效率和供应链韧性。此举与苹果公司旨在实现iPhone生产自动化、减少人工依赖的战略相符,预示着未来iPhone生产将更加依赖AI和自动化技术,并可能影响相关就业市场。合作将首先在新竹工厂实施,之后逐步推广至全球,这间工厂与苹果的研发工作存在一定关联,苹果近期收购Darwin AI 也印证了其自动化生产的决心。Computer World
  • OpenAI曾考虑收购AI芯片公司Cerebras: OpenAI在2017年左右曾计划通过特斯拉收购AI芯片公司Cerebras,但因公司使命差异而放弃。尽管如此,OpenAI对自研AI芯片的决心未变,今年已选择博通为其芯片设计合作伙伴,并委托台积电代工生产,旨在降低对英伟达等外部供应商的依赖,保障自身业务的稳定发展。Cerebras是一家知名的AI芯片设计公司,已推出三代产品。IT之家

投资融资

  • 谷歌投资2000万美元推动AI驱动科学发现: 谷歌宣布投入2000万美元及额外200万美元云信用,通过Google.org资助科学家利用人工智能解决包括罕见病研究、材料科学和可持续性等领域的复杂科学问题。此举旨在促进公私合作,推动AI在科学研究中的应用,并与亚马逊等科技巨头在AI领域形成合作模式,共同促进科技进步。谷歌DeepMind CEO Demis Hassabis强调了AI的变革潜力和跨界合作的重要性。这笔投资也反映了科技公司日益重视利用AI推动科学和技术进步的趋势。Analytics Insight

  • a16z与Ryze Labs联手启动AICombinator项目,投资500万美元扶持AI开发者: 人工智能风投公司a16z和Web3投资公司Ryze Labs共同推出名为AICombinator的项目,设立500万美元基金,旨在支持a16z生态系统中致力于AI和加密货币领域创新的开发者。参与者将优先使用Eliza AI框架(用于创建交互式AI角色),并有机会获得资金支持。Ryze Labs看好AI代理的未来发展潜力,认为这是继DeFi后的重要范式转变,并凭借其在Web3领域的投资经验,助力AI技术发展与普及。AIthority

  • AI网络监控公司Selector Software获3300万美元B轮融资: Selector Software公司获得由Ansa Capital领投的3300万美元B轮融资,总融资额超过6600万美元。该公司利用人工智能技术为电信运营商等企业提供网络监控服务,通过创建网络基础设施的数字孪生体,将故障排除时间从90%缩短到几秒钟。此轮融资将用于提升其AI运营能力并进行全球扩张,计划在美国、加拿大、欧洲、新加坡、印度和日本设立办事处。该公司的技术已获得电信和云服务领域巨头的认可,展现出巨大的市场潜力。Silicon Angle

应用落地

  • Meta欲将Llama AI引入英国公共医疗系统:Meta正积极推动其开源AI模型Llama在英国国家医疗服务体系(NHS)中的应用,旨在缩短急诊室等待时间并提高效率。Meta全球事务总裁Nick Clegg表示,此举是为了促进Llama生态系统发展,利于未来整合创新。尽管存在AI潜在风险,英国政府和Meta均表示将采取适度监管,在支持创新和规避风险之间取得平衡。Llama下载量已接近3.5亿次,并已与多个国家政府展开合作。Engadget
  • ChatGPT Plus/GPT-4在医学诊断准确性方面超过部分医生:两项独立研究表明,ChatGPT Plus和GPT-4在疾病诊断方面的准确率分别超过了70%和90%,均高于部分医生单独工作时的准确率。一项研究发现,医生使用ChatGPT Plus后准确率略有提升,且效率更高;另一项研究指出,即使使用GPT-4,医生的准确率提升也较为有限,这可能是因为医生未能有效利用AI的建议。这些研究引发了对AI在医疗领域应用的讨论,并强调了人机协作及医护人员AI培训的重要性。Computer World,Readwrite
  • AT&T利用AI工具Ask AT&T提升员工效率:美国电信巨头AT&T推出的生成式AI工具Ask AT&T,已惠及超过10万名员工。通过自然语言查询数据库和代码优化等功能,该工具显著提升了软件开发和客户服务的效率,平均节省了10%到30%的工作时间。Ask AT&T每天生成约10亿字的内容,并已应用于供应链、合同管理等多个领域,未来还将扩展至人力资源和财务分析等方面,助力AT&T提升公司价值和客户满意度。Business Insider
  • 日立铁路与英伟达合作开发AI驱动列车技术:日立铁路集团与英伟达合作开发了名为HMAX的AI平台。该平台利用边缘计算技术实时分析列车传感器数据,预测并解决潜在问题。HMAX已在部分线路投入使用,显著降低了维护成本、服务延误时间和燃料消耗,并计划推广至更多铁路运营商及其他行业,例如丹麦哥本哈根地铁和能源领域。该技术通过自动收集和分析列车运行数据(如振动和温度),实现对列车状态的实时监控和预测性维护,最终提高运营效率和降低运营成本。Business Insider
  • 大曼彻斯特AI摄像头抓拍违规驾驶: 大曼彻斯特地区试运行的AI摄像头系统在五周内捕捉到超过3200起驾驶违规行为,其中包括812起驾驶时使用手机和2393起未系安全带的案例。该系统结合人工智能和人工审核,旨在提高道路安全,降低事故发生率,并支持大曼彻斯特到2040年消除道路死亡和重伤的目标。目前尚无司机因此受到起诉,但该项目旨在警示驾驶员遵守交通规则,降低交通事故风险。BBC Tech

新锐言论

  • 阿滕伯勒爵士对AI克隆其声音表示强烈不满: 著名自然纪录片制作人兼解说员大卫·阿滕伯勒爵士发现自己的声音被AI高精度克隆用于宣传新节目,这令他深感不安。BBC节目中展示了AI克隆声音与本人声音几乎无法区分的片段,引发了公众对AI技术滥用及身份认证的担忧。阿滕伯勒表示,这种行为盗用了他的身份,并可能用于传播虚假信息。尽管AI克隆本身也声明其并非本人,但其逼真程度令人震惊,凸显了人工智能技术发展带来的伦理挑战。Futurism

  • 科技投资者尼埃尔劝诫欧洲AI初创公司勿急于套现:  科技投资者克谢瓦尔·尼埃尔近期敦促欧洲的AI初创公司不要急于出售套现。《金融时报》报道了这一消息,尼埃尔的劝告可能基于对当前市场环境的判断,暗示他认为现在并非欧洲AI初创公司寻求被收购的最佳时机,应该优先关注公司发展和长期价值创造。FT

行业分析

  • ChatGPT两周年:AI技术进步与社会公平挑战并存:  OpenAI 的 ChatGPT 推出两年,全球用户已突破两亿,并引发了大型语言模型 (LLM) 领域的激烈竞争,Anthropic、Meta、Google 和百度等公司纷纷推出类似产品。然而,数字鸿沟依然巨大,大量人口无法享受到 AI 技术带来的便利。文章指出,过度依赖 AI 可能导致负面影响,需要在享受技术进步的同时,关注其潜在风险,确保 AI 技术能够促进社会公平与人类福祉,推动更均衡的发展。Forbes
  • OpenAI调整发展战略,寻求AI技术新突破:  由于“GPT”系列人工智能改进速度放缓,OpenAI 近期调整了发展战略,正在探索新的突破点,重新评估未来的研发方向和技术策略。这一转变反映了 AI 技术研发的挑战,也预示着 OpenAI 未来可能更加注重多元化技术和应用领域,从而继续引领人工智能技术发展,并可能推动整个科技行业出现更多创新性的人工智能产品和服务。The information
  • 大型语言模型水印技术失效: 谷歌 DeepMind 和 Hugging Face 合作开发的 AI 文本水印技术 SynthID,旨在区分 AI 生成内容和人类创作,但专家指出其存在三大核心问题:并非所有 LLM 都适用水印、无法控制令牌选择以及开源模型无法应用水印,导致该技术难以有效阻止 AI 生成的虚假信息传播。Carnegie Mellon 大学的研究也证实,现有水印技术无法可靠地区分 AI 和人类文本,单靠水印技术不足以解决问题。Analytics India Tech
  • Rossum报告揭示AI文档自动化发展瓶颈: Rossum 公司发布的《2025年文档自动化趋势》报告显示,尽管 AI 在财务管理中潜力巨大,但许多企业仍在依赖 Excel 进行自动化,并面临成本高、复杂性、集成困难以及培训时间长等挑战。报告调查了超过 470 名财务高管,指出 58% 的人仍使用 Excel,32% 的人将成本视为首要障碍。报告建议企业应将 AI 视为协作工具,并制定战略计划以充分利用 AI 自动化带来的机遇,避免被市场淘汰。AIthority

人事变动

  • 腾讯混元大模型技术负责人刘威离职:腾讯杰出科学家、混元大模型技术负责人之一刘威已离职。他拥有哥伦比亚大学博士学位,在AI领域经验丰富,曾任职于IBM沃森研究中心,2017年加入腾讯AI Lab,参与研发了腾讯混元大模型,在图像视频AI研究和模型研发方面做出了重要贡献。刘威离职后的未来动向备受关注。他曾在腾讯期间参与开发的混元大模型已应用于公司内部数百个业务场景,并于今年9月发布了升级版混元Turbo。IT之家,36氪

关注公众号后设🌟标,掌握第一手AI新动态


瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章