生成式AI
一、 OpenAI 正式推出 GPT-4o 微调服务!每日附赠百万训练token
1. OpenAI推出GPT-4o微调服务,允许开发者使用自定义数据集进行微调,以提高特定应用场景中的性能和成本效率;
2. GPT-4o微调服务的费用结构包括训练费用和推理费用,同时提供免费训练tokens的优惠期;
3. 微调后的GPT-4o模型在多个行业基准测试中表现出色,如软件工程和SQL查询生成,显示了其在特定领域应用的潜力和企业级解决方案的实际价值。
https://mp.weixin.qq.com/s/3L22Y4sF_Qz4Z7yXk4l0sw
二、 微软「小而美」系列三连发!MoE新秀视觉小钢炮PK GPT-4o
1. 微软推出Phi 3.5系列三款新模型:Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct, 和Phi-3.5-vision-instruct,均支持自定义微调并可商业使用;
2. Phi-3.5-mini-instruct是轻量级模型,适用于算力受限设备,支持多语言和长上下文任务;Phi-3.5-MoE-instruct采用混合专家架构,专注于高质量推理任务;
3. Phi-3.5-vision-instruct为多模态模型,集成文本和图像处理功能,适合复杂的多帧视觉任务,表现优于多个竞争对手模型。
https://mp.weixin.qq.com/s/X1kDlk0PBPvPXslcTJS4KA
三、 英伟达首个AI NPC入驻游戏,国产大作,4B模型,2G显存
1. 英伟达推出首个AI NPC,使用的是Nvidia ACE技术,使NPC能理解玩家语音并动态响应,首次应用于游戏《解限机》中;
2. AI NPC使用的Minitron 4B模型,尽管只需2GB显存,却能在本地运行,提供快速响应,适用于所有型号的RTX GPU;
3. 尽管AI NPC的智能和响应速度有显著提升,玩家反馈其反应仍类似传统游戏NPC,显示出轻量级模型的局限性。
https://mp.weixin.qq.com/s/EsWhiFqhvewOvyi735QXGg
四、 1024帧、准确率近100%,英伟达「LongVILA」发力长视频
1. 英伟达推出LongVILA,一种全栈长视频视觉语言模型解决方案,支持高达1024帧的视频处理,准确率接近100%;
2. LongVILA采用多模态序列并行(MM-SP)技术,优化了内存使用和处理速度,提高了长上下文训练的效率和可扩展性;
3. 该模型在长视频字幕和指令遵循任务上表现出色,通过系统设计和模型训练策略的创新,显著提升了处理长序列视频的能力。
https://mp.weixin.qq.com/s/T6eMi3DPq9_291bWqcFRgw
五、 爆火神经网络架构KAN更新2.0!轻松应对经典物理学研究
1. KAN 2.0神经网络架构更新,支持研究者定制化使用,增强处理经典物理学问题的能力;
2. 新增功能如MultKAN、kanpiler和树转换器,提升模型的解释性和科学发现能力;
3. KAN 2.0展示在发现物理定律和构造定律方面的应用,未来计划扩展到更多科学领域。
https://mp.weixin.qq.com/s/cTy7kzVRNhaP7VSxyeHgfQ
六、 字节跳动推出Seed-ASR语音模型,能识别转录多语言和方言
1. Seed-ASR支持多语言和方言,能识别13种中国方言和7种外语,并计划扩展更多语言;
2. 采用数十亿参数的模型,结合音频编码器和大语言模型实现上下文感知的语音识别;
3. 通过自监督学习、监督微调、上下文微调和强化学习的训练过程,提高了长文本处理能力和专业领域的表现。
https://mp.weixin.qq.com/s/8K0VTh_doOeV2mOifCJhnQ
前沿科技
七、 咳咳咳,一咳就知道有没有病?谷歌AI模型 HeAR 听声识病!
1. 谷歌推出HeAR AI模型,通过分析咳嗽、说话和呼吸声音来识别疾病;
2. HeAR模型通过分析超过1亿次的咳嗽声训练,能够准确识别肺结核等疾病的早期征兆;
3. HeAR已在印度应用,帮助提高肺结核的早期检测能力,得到了联合国“终止结核伙伴关系”的支持。
https://mp.weixin.qq.com/s/0JenZVqHlyfwb_MNFHwVug
八、 AI又一突破!1岁前提前识别儿童“隐形杀手”,准确率超80%
1. 通过使用AI模型AutMedAI,研究者能在儿童12个月大之前准确识别自闭症,准确率达80.5%;
2. AutMedAI模型使用了基础医疗筛查和背景历史信息,依赖家长报告的数据,简化了特征选择,使得早期筛查更加实用和广泛适用;
3. 研究利用了大规模数据库SPARK,覆盖不同年龄、种族和性别的个体,确保了研究的广泛适用性和模型的泛化能力。
https://mp.weixin.qq.com/s/K0qI9mesiAiUvSWPCV66Hg
报告观点
九、 Scale AI华裔创始人:当前AI性能已停滞,主要由于“数据壁垒”
1. 当前AI性能停滞主要由于数据壁垒,即互联网上可访问的数据已被耗尽,需要更多多样化和专业化的数据来突破性能瓶颈;
2. AI技术堪比核弹,需要对最先进的AI系统采取封闭策略以防止潜在的负面后果;
3. 数据获取与治理是AI发展的关键,过度严格的数据监管可能抑制AI创新,需要更宽松的数据访问政策以支持AI技术的进步。
https://mp.weixin.qq.com/s/KsoW1idfazkZKjBpIyYS0g
十、 腾讯混元大模型负责人王迪专访:揭秘万亿 MoE 系统工程之道
1. 腾讯的万亿级MoE大模型涉及跨领域的系统工程,需要高效整合工程、算法、数据和业务应用;
2. 大模型开发对组织能力提出高要求,业务团队需明确模型能力边界,技术与业务需紧密协作以快速推出AI产品;
3. 腾讯通过内部一站式平台支持业务团队使用大模型,允许他们根据具体需求进行模型调整和优化,寻找技术的应用价值。
https://mp.weixin.qq.com/s/l-JiFVI9z6IBwY9hE1k-0Q
👇订阅下方合集,获取每日推送