热点资讯 | OpenAI发布GPT-4o mini入局小模型竞争/2023年我国人工智能核心产业规模达到5784亿元

文摘   文化   2024-07-23 19:26   湖北  

热点资讯第【24】

一周热点概览


【1】OpenAI发布GPT-4o mini入局小模型竞争:具有处理50种不同语言的音频、视频和文本能力
【2】Mistral AI发布首款MathΣtral模型,专为数学推理研发
【3】新的AI搜索引擎Exa AI,目标是成为AI领域的Google
【4】微软AI设计应用Designer登陆iOS / Android
【5】AI模型可提供快速可靠的心脏健康评估
【6】Amazon推出Rufus AI购物助手
【7】麻省理工:大语言模型十分依赖记忆能力
【8】YouTube新规:用户可要求平台下架模仿自己面部、声音的AI合成内容
【9】英伟达等巨头被曝违规使用YouTube数据训练模型
【10】2023年我国人工智能核心产业规模达到5784亿元

一周热点

尽在ArtIgroup

NEWS

 01 

OpenAI发布GPT-4o mini入局小模型竞争:

具有处理50种不同语言的音频、视频和文本能力



7月18日,AI 初创公司 OpenAI 推出了新的 AI 模型,名为 “GPT-4o mini”,这是该公司最新的一项努力,旨在扩大其受欢迎聊天机器人的使用。


这一迷你 AI 模型是 GPT-4o 的一个衍生版本,GPT-4o 是 OpenAI 推出的速度最快、最强大的模型,具有处理50种不同语言的音频、视频和文本能力。该模型的 “o” 代表全能,OpenAI 计划在后续将图像、视频和音频整合到其中。GPT-4o Mini目前只处理图像和文本,据 OpenAI 称,它最终将支持音频、视频和其他内容类型。


>>性能与成本

GPT-4o mini的API价格为每百万输入标记15美分和每百万输出标记60美分,成本比GPT-3.5 Turbo便宜超过60%。在多任务语言理解(MMLU)测试中,GPT-4o mini的得分为82%,超越了Google的Gemini Flash(77.9%)和Anthropic的Claude Haiku(73.8%)。


>>模型特性

GPT-4o mini支持的上下文窗口为12.8万个标记,截止日期为2023年10月。该模型被描述为“功能最强、成本偏低”,计划未来整合图像、视频和音频能力,增强多模态处理能力。


>>市场定位

OpenAI此举是为了在小型AI模型市场中占据竞争优势,GPT-4o mini被认为是市场上价格最低的主流小模型之一。该模型从7月19日起向ChatGPT的免费用户、Plus用户和团队用户开放,并将在下周向企业用户推出。


>>对比与竞争

GPT-4o mini的推出标志着OpenAI在小型模型领域的进入,预计将与其他AI公司如Anthropic和Google的同类产品展开激烈竞争。GPT-4o mini的发布不仅在性能上超越了前代模型,还在成本上提供了更具吸引力的选择,可能会推动更多企业和开发者采用这一技术。




 02 

Mistral AI 发布首款MathΣtral模型

专为数学推理研发



7月17日,Mistral AI 推出专为数学推理和科学发现而设计的7B模型MathΣtral ,这不仅是对阿基米德2311周年的致敬,更是数学推理和科学发现领域的一次重大突破。

MathΣtral是一款专为数学推理和科学发现设计的7B模型,拥有32k的上下文窗口,这意味着它能处理更长、更复杂的数学问题。在Apache2.0许可下开源,这为学术界和开发者提供了极大的便利。


Mistral AI团队将MathΣtral贡献给科学界,希望加强在需要复杂、多步骤逻辑推理的高级数学问题上的研究。模型在STEM领域的专业特长,在各种行业标准基准测试中达到了同类别的先进推理能力。特别是在MATH基准测试中达到了56.6%,在MMLU基准测试中达到了63.47%。MathΣtral最引人注目的是其推理能力。这个模型证明了,通过更多的推理时间计算,可以实现明显更好的结果。在MATH基准测试中,通过多数投票,MathΣtral7B的得分高达68.37%,而在64名候选人中,通过强大的奖励模型,得分更是达到了74.59%。

项目地址:https://mistral.ai/news/mathstral/




 03 

新的AI搜索引擎Exa AI
目标是成为AI领域的Google


Exa AI,一家新兴的AI搜索引擎公司,最近宣布获得了1700万美元的A轮融资,由Lightspeed领投,Nvidia的NVentures和Y Combinator参投。不同于其他搜索引擎,Exa的目标是成为AI的专属搜索工具。其技术亮点:

向量数据库和嵌入模型:Exa使用这些技术来预测下一个相关链接,而不是下一个词,这使得Exa能够处理链接数据集,提供独特的搜索结果。

语义搜索:Exa能够理解查询的语义,而不仅仅是关键词匹配,提供更相关的搜索结果。

内容抓取:Exa可以从任何网页抓取完整、清理后的内容,为AI提供高质量的数据。

相似性搜索:通过URL或长文本找到相似的结果,使搜索更精准。大规模数据处理:能够处理多达100万条搜索结果,满足AI大规模数据处理的需求。

实时更新:每分钟爬取新的URL,确保AI始终获取最新的数据。

强大的过滤功能:可以按域名、日期范围或数据类别进行搜索,提供高度定制化的搜索体验。

简单的API集成:Exa提供简单易用的API,开发者只需几行代码即可集成和使用Exa的搜索功能。



 04 

微软AI设计应用Designer登陆iOS / Android



微软在 iOS / Android 平台上推出了AI设计应用 Designer 的预览版,该应用允许用户通过模版创建自定义图像、贴纸、贺卡、邀请函等,还能实现 AI 编辑、重新设计图像的进阶功能,用户可以免费使用15次进阶功能,Copilot Pro 订阅用户可以获得100次。


Designer 最初可以在网页端和微软自家 Edge 浏览器上使用,现在拥有个人微软账户的用户都可以在 Windows、iOS 和 Android 平台使用其免费程序。除了独立的应用,微软也在 Word、PowerPoint 中的 Copilot 助手添加了 Designer 支持,Copilot Pro 订阅者可以使用。




 05 

AI模型可提供快速可靠的心脏健康评估


来自英国东安格利亚大学、谢菲尔德大学和利兹大学的团队共同开发出一种智能计算机模型,可利用人工智能(AI)分析心脏磁共振成像(MRI)检查结果。这种自动化技术不仅能为患者提供快速可靠的心脏健康评估,还能显著节省时间和资源。论文发表于近日出版的《欧洲放射学实验杂志》上。

研究人员表示,AI模型能精确测定心脏腔室的大小和功能,其结果与医生分析的结果相当,但速度要快得多。标准的手动MRI分析可能需要45分钟或更长时间,而新的AI模型只需几秒钟即可完成分析。

来源于814名患者的这项回顾性观察研究数据,被用于训练AI模型。为了确保模型结果准确,研究团队随后使用了另外101名患者的扫描和数据进行测试。尽管已有其他研究探索了AI在解释MRI扫描中的应用,但最新的AI模型是使用来自多家医院和不同类型扫描仪的数据进行训练的,并对来自不同医院的不同患者组进行了测试。此外,AI模型通过提供显示所有四个腔室的视图,实现了对整个心脏的完整分析,而大多数早期的研究通常仅聚焦于查看心脏的两个主要腔室。




 06 

Amazon推出Rufus AI购物助手



在经过了五个月的测试后,Amazon 面向所有美国客户推出了AI购物助手 Rufus。


Amazon 介绍,通过点击 Amazon App 的相关图标,购物者可以调出一个文本聊天界面,并可以向 Rufus 提出一系列问题,例如识别某些产品的型号,询问某些商品的详细细节,比较不同的商品和获取订单更新。


除了网购方面的更新,Rufus 还能实现类似 ChatGPT 等聊天机器人的功能,例如生成名人传记、旅游建议或者写一篇短篇小说。




 07 

麻省理工:

大语言模型十分依赖记忆能力



麻省理工学院计算机科学和人工智能实验室(CSAIL)研究人员研究了语言大模型面对不同任务的变化情况,揭露了 AI 记忆和推理能力之间相互的作用,并发现:AI 的推理能力被高估了。


研究人员发现,像是 GPT-4,在十进制算术上表现不错,但是难以应付其他进制的计算,在和弦指法、空间推理、棋类游戏中,AI 都表现出了类似的问题,人类能够适应规则的改变,而 AI 的表现和随机猜测差不多,证明他们难以适应不熟悉的情况。


这表明,大语言模型能够在熟悉的任务场景中表现优秀,但面对陌生的情况,就会遇到困难,比起推理能力,现阶段的 AI 更依赖记忆能力。




 08 

YouTube新规:

用户可要求平台下架模仿自己面部、声音的AI合成内容


7月15日,随着 AI 生成影音内容的普及,YouTube 也随之进行了一些政策调整。据 PhoneArena 当地时间13日报道,用户现可要求 YouTube 下架由 AI 生成的模仿自己面部、声音的视频。


这一请求将根据 YouTube 的隐私请求流程提出,而不是像 deepfake 那样因为具有误导性而要求将其删除。YouTube 表示,申诉要求下架的主因是影片伤害当事人的「隐私权」,而且只有主要当事人才能要求删除,而不是因为深伪技术及误导性内容。


YouTube 方面称,平台将根据多种因素来决定是否下架内容。汇总如下:


内容是否为加工内容或合成内容;是否已向观看者披露内容为加工内容或合成内容;是否包含可明确识别个人身份的信息;内容是否逼真;内容是否涉及恶搞、讽刺或其他公共利益价值;内容是否涉及公众人物或知名人士的敏感行为,例如犯罪活动、暴力行为。


平台在收到了相关投诉后,将会给被投诉方(即内容上传者)48 小时的时间来处理投诉。若内容在该期间内已被删除,则投诉结束。反之,YouTube 将会对情况进行审查。另一方面,被投诉的内容上传者也可以采取将视频中的面部模糊处理等措施。不过,将视频设置为「私人视频」并不符合删除要求,因为其有可能随时恢复成「公开视频」。




 09 

英伟达等巨头被曝违规
使用YouTube数据训练模型

7月17日消息,据媒体消息,包括苹果、英伟达、Salesforce和Anthrophic在内的一些大型科技公司,被曝在训练AI模型时使用了来自谷歌旗下视频网站YouTube的未授权数据。这些公司使用了一个由第三方提供的数据集,其中包含从YouTube上抓取的大量视频字幕文本,违反了YouTube禁止从平台上未经许可抓取内容的规定。

报道指出,这些科技公司在训练AI模型时都使用了一个名为“YouTube Subtitles(YouTube字幕)”的数据集,大小为5.7GB,包含4.89亿个单词,来自Youtube上超过4.8万个频道中的17.35万个视频。该数据集由视频字幕的纯文本组成,包括视频博主上传的部分和Youtube自动转录的文本,除了英语外,通常还附带日语、德语和阿拉伯语等语言的翻译。



 10 

2023年我国人工智能核心产业规模达到5784亿元

7月14日消息,中国互联网协会副秘书长裴玮近日在2024中国互联网大会上发布《中国互联网发展报告(2024)》(下称《报告》)。《报告》指出,在人工智能领域,2023年我国人工智能产业应用进程持续推进,核心产业规模达到5784亿元。截至2024年3月,我国人工智能企业数量超过4500家,已有714个大模型完成生成式人工智能服务备案。
免责声明:以上内容来源整理自互联网,仅供学习参考,如有问题,请联系我们。
—END—






ArtIgroup

中国人工智能艺术教育协同创新平台


ArtIgroup
汇聚各高等院校和企事业单位的学术、专业、产业等资源,实现跨高校界限的紧密合作,打造一个“共创、共享、共赢”的平台,促使联盟成员群策群力,促进人工智能技术与艺术创作的深度融合,推动人工智能时代艺术设计教育的转型与发展。
 最新文章