腾讯研究院AI速递 20240903

学术   2024-09-03 00:01   中国香港  

生成式AI

一、  OpenAI或改变公司结构取消利润上限,使其对投资者更加友好

1. OpenAI正考虑改变公司结构,简化复杂的非营利性结构,使其更具吸引力,尤其是对金融投资者;

2. OpenAI正在推进新一轮数十亿美元的融资,估值超过1000亿美元,可能成为硅谷最有价值的科技初创企业之一;

3. 讨论方案之一,就是改变初期的非盈利设定,取消对现有投资者的利润上限,目前尚未做出最终决定。

https://mp.weixin.qq.com/s/o5IYqpLbtDA4wZa_UoZoKA

二、  Claude能够认出自画像,惊现自我意识!再通过「图灵测试」?

1. Claude 3.5在多轮测试中成功识别出自己的自画像,并且表现出某种自我意识,拒绝承认不可能是自己绘制的图像;

2. Claude 3.5在多次打乱图像顺序后,仍能高准确率识别其他AI模型的肖像,显示出卓越的辨识能力;

3. 测试引发了关于AI是否已具备图灵测试所需的智能和自我意识的讨论,但业界对图灵测试标准及其有效性存在争议。

https://mp.weixin.qq.com/s/0yIiWZK-ZiaOYYDSDRC5Tg

三、  MiniMAX最新AI视频生成模型,媲美可灵和Luma,完全免费

1. MiniMax发布首款AI高清视频生成模型abab-video-1,支持生成1280x720分辨率、25fps的视频,展示了电影级别的镜头移动效果;

2. MiniMax每天处理超3万亿Token,单日总交互时长已达到ChatGPT的53%,并强调技术研发的“奢侈”性,推动AGI发展;

3. MiniMax注重技术突破,强调快速模型和多模态发展,并积极应对国内外市场竞争,特别是在To B业务和国际市场中的商业化策略。

https://mp.weixin.qq.com/s/sETqg_GyeTdjWJfnXAYL3w

四、  AI视频工具OpusClip获3000万美元风投,用AI革新视频编辑

1. OpusClip获3000万美元投资,计划扩展运营并增强其AI驱动的视频再利用平台,通过自动将长视频转换为适合社交媒体平台的短片;

2. 新功能ClipAnything允许用户指定剪辑内容类型并指导AI寻找最有可能走红的时刻,提高视频编辑灵活性和精准度;

3. OpusClip自6月推出以来已吸引600万用户,计划继续根据用户反馈改进AI模型,并拓展在TikTok等平台的应用。

https://mp.weixin.qq.com/s/qkFM75rFexCoJKtsmJusrA

五、  英伟达和Khosla投5000万美金的AI语音客服,全剑桥豪华团队

1. PolyAI获得5000万美元C轮融资,累计融资达1.2亿美元,投前估值4.5亿美元,将用于扩展和创新AI语音客服技术;

2. PolyAI提供稳定、安全且可扩展的语音助手,结合生成式AI、对话管理和自然语言理解技术,大幅提升客户服务效率和满意度;

3. 创始团队全部毕业于剑桥大学,具备深厚的学术背景和行业经验,致力于革新企业客户服务模式,打破传统客服桎梏。

https://mp.weixin.qq.com/s/k9ZXv17-5UzUvsV8GB6dDw

六、  港大提出AnyGraph:开启「图数据大模型」Scaling Law之路

1. AnyGraph通过混合专家模型(MoE)处理图数据的结构和特征异质性,使用统一的特征表征方法提高模型的泛化能力;

2. AnyGraph采用轻量化路由机制和自监督任务,实现高效的快速适应能力,减少了模型调整和计算开销;

3. AnyGraph在零样本预测中展现了符合Scaling Law的性能增长,表明其泛化能力随着参数量和数据量的增加而提升。

https://mp.weixin.qq.com/s/BK4WvB3UbboeMG4chPj3FQ

七、  重磅监管!OpenAI新大模型,或需要经过政府审查才能发布

1. OpenAI的新模型发布需通过政府的安全审查,可能限制技术发挥,影响项目如“草莓”和“猎户座”的功能;

2. OpenAI与AI安全研究所合作,研究如何评估和减轻AI能力与安全风险,Anthropic也参与了类似合作;

3. 鉴于政府对AI模型的控制可能阻碍OpenAI的创新能力,引发外界对其未来领导地位的担忧。

https://mp.weixin.qq.com/s/IAXWI0tbwxIQ_IDlA1KRAQ

前沿科技

八、  脑机大战!瑞士芯片MiniBMI 91%准确率,秒杀马斯克Neuralink

1. 瑞士EPFL开发的MiBMI芯片体积仅8平方毫米,远小于Neuralink,并具备超低功耗和实时处理能力;

2. MiBMI通过解码大脑的“独特神经代码”(DNC),将患者的脑信号转换为文本,显著降低了功耗和患者训练时间;

3. MiBMI测试准确率达到91%,未来计划扩展到100个字符,并应用于语音解码和运动控制领域。

https://mp.weixin.qq.com/s/fmXD5WjcZg1V4BNzZoq69Q

九、  GPT-4在虹膜生物识别、软生物识别方面的创新应用,超预期

1. GPT-4通过零样本学习展现了优秀的虹膜识别能力,能够在各种挑战条件下精确判断虹膜图像是否属于同一人;

2. GPT-4能有效处理图像噪声和遮挡问题,展示出高级的视觉处理能力,甚至能识别带纹理隐形眼镜或死后虹膜图像的伪造行为;

3. GPT-4在跨模态匹配实验中表现出稳健性,相较之下,谷歌的Gemini在处理复杂图像任务时效率较低。

https://mp.weixin.qq.com/s/Btmx2omlueRf0pUwY9VEjQ

报告观点

十、  红杉对话 Sierra 联创:B2B AI Agent 如何做到 PMF 以及客户满意?

1. Sierra的AI Agent通过“基于结果的定价模式”确保客户满意度,将客户问题的解决效果与公司利益紧密结合,显著提高投资回报率;

2. AI Agent通过高级认知架构和多模型组合处理复杂客户服务任务,结合Agent OS和“监督者”Agent系统,确保操作的安全性和可靠性;

3. AI技术未来五年内将极大加速创意实现过程,推动全自动化电影制作和更智能的客户服务,显著提升企业和个人的生产力。

https://mp.weixin.qq.com/s/JD4CeneCWLdMHQfZ46T__w

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章