腾讯研究院AI速递 20240822

学术   2024-08-22 00:01   广东  

生成式AI

一、  OpenAI 正式推出 GPT-4o 微调服务!每日附赠百万训练token

1. OpenAI推出GPT-4o微调服务,允许开发者使用自定义数据集进行微调,以提高特定应用场景中的性能和成本效率;

2. GPT-4o微调服务的费用结构包括训练费用和推理费用,同时提供免费训练tokens的优惠期;

3. 微调后的GPT-4o模型在多个行业基准测试中表现出色,如软件工程和SQL查询生成,显示了其在特定领域应用的潜力和企业级解决方案的实际价值。

https://mp.weixin.qq.com/s/3L22Y4sF_Qz4Z7yXk4l0sw

二、  微软「小而美」系列三连发!MoE新秀视觉小钢炮PK GPT-4o

1. 微软推出Phi 3.5系列三款新模型:Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct, 和Phi-3.5-vision-instruct,均支持自定义微调并可商业使用;

2. Phi-3.5-mini-instruct是轻量级模型,适用于算力受限设备,支持多语言和长上下文任务;Phi-3.5-MoE-instruct采用混合专家架构,专注于高质量推理任务;

3. Phi-3.5-vision-instruct为多模态模型,集成文本和图像处理功能,适合复杂的多帧视觉任务,表现优于多个竞争对手模型。

https://mp.weixin.qq.com/s/X1kDlk0PBPvPXslcTJS4KA

三、  英伟达首个AI NPC入驻游戏,国产大作,4B模型,2G显存

1. 英伟达推出首个AI NPC,使用的是Nvidia ACE技术,使NPC能理解玩家语音并动态响应,首次应用于游戏《解限机》中;

2. AI NPC使用的Minitron 4B模型,尽管只需2GB显存,却能在本地运行,提供快速响应,适用于所有型号的RTX GPU;

3. 尽管AI NPC的智能和响应速度有显著提升,玩家反馈其反应仍类似传统游戏NPC,显示出轻量级模型的局限性。

https://mp.weixin.qq.com/s/EsWhiFqhvewOvyi735QXGg

四、  1024帧、准确率近100%,英伟达「LongVILA」发力长视频

1. 英伟达推出LongVILA,一种全栈长视频视觉语言模型解决方案,支持高达1024帧的视频处理,准确率接近100%;

2. LongVILA采用多模态序列并行(MM-SP)技术,优化了内存使用和处理速度,提高了长上下文训练的效率和可扩展性;

3. 该模型在长视频字幕和指令遵循任务上表现出色,通过系统设计和模型训练策略的创新,显著提升了处理长序列视频的能力。

https://mp.weixin.qq.com/s/T6eMi3DPq9_291bWqcFRgw

五、  爆火神经网络架构KAN更新2.0!轻松应对经典物理学研究

1. KAN 2.0神经网络架构更新,支持研究者定制化使用,增强处理经典物理学问题的能力;

2. 新增功能如MultKAN、kanpiler和树转换器,提升模型的解释性和科学发现能力;

3. KAN 2.0展示在发现物理定律和构造定律方面的应用,未来计划扩展到更多科学领域。

https://mp.weixin.qq.com/s/cTy7kzVRNhaP7VSxyeHgfQ

六、  字节跳动推出Seed-ASR语音模型,能识别转录多语言和方言

1. Seed-ASR支持多语言和方言,能识别13种中国方言和7种外语,并计划扩展更多语言;

2. 采用数十亿参数的模型,结合音频编码器和大语言模型实现上下文感知的语音识别;

3. 通过自监督学习、监督微调、上下文微调和强化学习的训练过程,提高了长文本处理能力和专业领域的表现。

https://mp.weixin.qq.com/s/8K0VTh_doOeV2mOifCJhnQ

前沿科技

七、  咳咳咳,一咳就知道有没有病?谷歌AI模型 HeAR 听声识病!

1. 谷歌推出HeAR AI模型,通过分析咳嗽、说话和呼吸声音来识别疾病;

2. HeAR模型通过分析超过1亿次的咳嗽声训练,能够准确识别肺结核等疾病的早期征兆;

3. HeAR已在印度应用,帮助提高肺结核的早期检测能力,得到了联合国“终止结核伙伴关系”的支持。

https://mp.weixin.qq.com/s/0JenZVqHlyfwb_MNFHwVug

八、  AI又一突破!1岁前提前识别儿童“隐形杀手”,准确率超80%

1. 通过使用AI模型AutMedAI,研究者能在儿童12个月大之前准确识别自闭症,准确率达80.5%;

2. AutMedAI模型使用了基础医疗筛查和背景历史信息,依赖家长报告的数据,简化了特征选择,使得早期筛查更加实用和广泛适用;

3. 研究利用了大规模数据库SPARK,覆盖不同年龄、种族和性别的个体,确保了研究的广泛适用性和模型的泛化能力。

https://mp.weixin.qq.com/s/K0qI9mesiAiUvSWPCV66Hg

报告观点

九、  Scale AI华裔创始人:当前AI性能已停滞,主要由于“数据壁垒”

1. 当前AI性能停滞主要由于数据壁垒,即互联网上可访问的数据已被耗尽,需要更多多样化和专业化的数据来突破性能瓶颈;

2. AI技术堪比核弹,需要对最先进的AI系统采取封闭策略以防止潜在的负面后果;

3. 数据获取与治理是AI发展的关键,过度严格的数据监管可能抑制AI创新,需要更宽松的数据访问政策以支持AI技术的进步。

https://mp.weixin.qq.com/s/KsoW1idfazkZKjBpIyYS0g

十、  腾讯混元大模型负责人王迪专访:揭秘万亿 MoE 系统工程之道

1. 腾讯的万亿级MoE大模型涉及跨领域的系统工程,需要高效整合工程、算法、数据和业务应用;

2. 大模型开发对组织能力提出高要求,业务团队需明确模型能力边界,技术与业务需紧密协作以快速推出AI产品;

3. 腾讯通过内部一站式平台支持业务团队使用大模型,允许他们根据具体需求进行模型调整和优化,寻找技术的应用价值。

https://mp.weixin.qq.com/s/l-JiFVI9z6IBwY9hE1k-0Q

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章