腾讯研究院AI速递 20240902

学术   2024-09-02 02:24   广东  

生成式AI

一、  Covariant创始人宣布加入亚马逊,第四起大厂招聘收购项目

1. 亚马逊通过招聘方式收购了工业机器人公司Covariant的创始团队及部分员工,以推动其机器人技术发展;

2. 这是继微软、谷歌等公司之后,又一起大型科技公司通过收购或人才引进巩固AI领域领导地位的案例;

3. 亚马逊计划利用Covariant的机器人基础模型,进一步提升其智能和安全机器人技术,并整合该公司的技术和员工资源。

https://mp.weixin.qq.com/s/UHBxNAIKQq-lZvVElKbs7Q

二、  讯飞版「Her」横空出世全民开放!百变人设,情绪价值逆天

1. 讯飞星火版“Her”通过端到端统一神经网络,实现了超拟人语音交互,具备极速响应、情绪识别和情感共鸣等能力;

2. 系统支持多情感、风格和方言的灵活切换,并可模仿多种角色音色,使人机对话更加自然流畅;

3. 科大讯飞的技术突破将推动语音交互在智能家居、智慧汽车等领域的应用,预计在全球智能语音市场中占据重要位置。

https://mp.weixin.qq.com/s/IJUirqFaiYsilzyzKa-xvQ

三、  一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD

1. 智谱的GLM-4-Plus模型在KDD 2024上展示出优异性能,在逻辑推理和长文本处理等任务中逼近甚至超越GPT-4o;

2. 智谱发布了包括GLM-4V-Plus和CogView-3-Plus在内的多模态模型,展现了强大的图像理解和生成能力,支持复杂的时间感知视频理解;

3. 智谱在产品端推出了支持实时视频通话的生成式AI助手“清言”,进一步拓展了语音、视频等多模态互动功能。

https://mp.weixin.qq.com/s/4INZ0SxwRV79zPwj6p0G7w

四、  商汤清华等开源百亿级多模态数据集,可训练类GPT-4o模型

1. 商汤科技等机构开源了百亿级图文交错数据集OmniCorpus,包含86亿张图像和16,960亿个文本标记,规模是现有数据集的15倍;

2. OmniCorpus数据集优化了Trafilatura工具和图像过滤机制,确保了跨语言、高质量的数据提取,涵盖多种类型和语言的内容;

3. 基于OmniCorpus预训练的模型在VQA、Image Captioning等任务中表现优异,提升了多模态大模型的训练效果,可用于训练类似GPT-4o的模型。

https://mp.weixin.qq.com/s/Yk2wJ8hS8zJO8OnMe_TqLw

五、  8秒生成犯罪现场报告,美警用AI工具写文书,比人还靠谱?

1. 美国警察开始使用由GPT-4支持的AI工具Draft One生成犯罪现场报告,报告生成时间仅8秒,准确性高于人脑回忆;

2. Draft One能够从执法记录仪的音频中自动生成报告,减少警官文书工作时间,优化警务效率,但存在大语言模型的偏见和幻觉问题;

3. 尽管Draft One已广泛应用于轻罪案件报告,但在严重刑事案件中使用仍存在争议,AI生成报告的可靠性和法律责任引发关注。

https://mp.weixin.qq.com/s/QgD9K8Yjjh1qNXAebdzXWA

六、  港大等OpenCity大模型预测交通路况,零样本下表现出色

1. OpenCity是由香港大学联合华南理工大学和百度推出的交通预测模型,结合Transformer和图神经网络,能够有效处理复杂的时空依赖关系,实现精确的长期交通预测;

2. OpenCity在零样本条件下表现出色,展示了卓越的泛化能力,可在不同区域、城市和任务中无缝应用,减少了对重新训练的需求;

3. 通过Patch嵌入和时空上下文编码等技术,OpenCity显著提升了模型的扩展性和适应能力,在大规模交通数据上实现了高效预测,超越了多种基线模型。

https://mp.weixin.qq.com/s/J-AJlwCnt60K3l0YG1Jx4A

七、  英伟达推出Eagle系列模型,1024×1024像素高分辨率处理

1. 英伟达推出的Eagle模型能够处理高达1024×1024像素分辨率的图像,显著提升了视觉信息处理和理解能力;

2. Eagle采用多专家视觉编码器架构,不同编码器针对特定任务进行专门训练,实现更全面的图像理解;

3. Eagle模型开源,并在法律、医疗、电子商务等多个行业具有应用潜力,同时面临伦理责任和AI偏见等问题的挑战。

https://mp.weixin.qq.com/s/hyugdWDyU4acJi8eZY-7Cg

前沿科技

八、  逼真到被打假!OpenAI投的新一代机器人NEO身穿衣服丝滑做家务

1. 1X Technologies推出的新一代家务机器人NEO,采用仿生设计和柔性驱动技术,使其更像人类且安全性更高,能够执行复杂的家务任务;

2. NEO的手部具有20个自由度,可完成精细操作,如整理橱柜和递物,AI技能的加入使其能够在实际环境中不断学习和适应;

3. NEO因其逼真外观和动作被质疑为真人伪装,实际为柔性驱动和类肌肉拉线技术实现的高仿真机器人,预计今年内发售。

https://mp.weixin.qq.com/s/Z-d-udJieOX2cnldFWTp9Q

报告观点

九、  邵亦波:AI将成为我们追求完满性的有力工具,但需要个体参与创新

1. 邵亦波认为AI将成为人类追求完满性(Wholenes)的有力工具,但智慧和意志需要通过创新产品赋予AI,个人选择在这一过程中至关重要;

2. 完满性分为头脑、心灵和身体的整合,自我不同部分的整合,以及与整个宇宙的连接,AI可帮助人类更好地理解和实现这些层次;

3. AI的强大能力带来机遇和挑战,人类必须做出明智选择,以引导AI促进长期幸福与和平,避免被错误编程左右。

https://mp.weixin.qq.com/s/0zpwQdzoSUrGqXlTmf8O6g

十、  陶哲轩:谈计算机辅助数学史,AI时代数学研究将进入前所未有规模

1. 陶哲轩认为,AI将使数学研究规模空前扩大,未来可能同时处理数千个问题,探索更广泛的问题空间;

2. 机器辅助计算在数学领域的应用由来已久,AI和大语言模型在数学研究中的作用日益增强,如GPT-4和证明助手等工具已开始辅助数学证明和推理;

3. 虽然AI目前在直接解决数学问题上仍有局限,但其在生成有见地的猜测和发现数据间联系方面展示出巨大潜力,未来将进一步推动数学研究的创新。

https://mp.weixin.qq.com/s/mDsC83MU8UQhCWjJESZOUQ

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章