腾讯研究院AI速递 20240823

学术   2024-08-23 00:01   广东  

生成式AI

一、  多亏Transformer,Mamba更强了!仅用1%计算达新SOTA

1. Mamba架构通过利用Transformer模型的预训练知识,实现了仅用1%的计算量达到新的SOTA性能;

2. 研究团队开发了MOHAWK蒸馏方法,通过三个阶段的蒸馏过程优化SSMs模型,有效提升了模型的性能和效率;

3. 该蒸馏方法不仅适用于Mamba模型,还可应用于其他非Transformer架构,展示了广泛的适用性和潜在的行业影响.

https://mp.weixin.qq.com/s/KGbaGPe8uvUq2xaJRVuI6w

二、  OpenAI与Condé Nast达成技术合作,测试ChatGPT搜索

1. OpenAI与Condé Nast合作,测试ChatGPT在搜索功能中的应用,旨在提升AI驱动的新闻发现和传播;

2. 合作允许OpenAI在其产品中展示Condé Nast的品牌内容,重塑数字内容的访问和互动方式;

3. Condé Nast是一家全球性媒体集团,拥有多个知名刊物和广泛的国际影响力,合作有助于OpenAI在内容多样性和版权问题上的进一步发展.

https://mp.weixin.qq.com/s/gi_8DjldIAJi0u8U1XvQuQ

三、  Anthropic工程师体验分享,和「AI搭子」Claude共度完美一天

1. Claude作为多功能助手,能够提供从烹饪建议、健身指导到专业工作支持等多方面帮助;

2. Claude在文档制作、数据可视化等复杂任务中,展现出高效的工具价值,节省时间并提供创造性建议;

3. Alex通过与Claude的多轮对话,深入探讨各类主题,展示了AI超越搜索引擎的互动能力,但引发了用户对过度依赖AI的担忧。

https://mp.weixin.qq.com/s/S2ApE42d2NnMDfkW_oZkEg

四、  Midjourney网页版终于来了!免费畅玩顶尖text2image模型

1. Midjourney网站现对所有新用户开放,提供最新模型V6.1的25次免费试用机会;

2. 用户可通过修改提示和细节,使用英文提示词生成高清图片,体验顶尖的text2image模型;

3. 提供的示例包括多种主题和风格,如异国动物园摄影、极简艺术设计和野生动物摄影等,展示模型的多样化应用能力.

https://mp.weixin.qq.com/s/pWLZHUSFUVa_am84Dk1ELQ

五、  难倒了Midjourney和FLux的问题,被Ideogram 2.0解了!

1. Ideogram 2.0版本通过优化文本渲染能力,解决了AI生成图像中的文本问题,提升了模型在多种风格如写实、设计、3D和动漫的生成质量;

2. 与Midjourney和Flux相比,Ideogram 2.0在文本内容的准确性和整合度上表现更优,尤其在复杂文本嵌入和多风格渲染上展现出明显优势;

3. Ideogram 2.0的推出引发了行业内的竞争反应,如Midjourney宣布免费试用.

https://mp.weixin.qq.com/s/YlpE97X5pPnu8QliOcszxw

六、  D-ID 推出一款 AI 视频翻译工具,提供语音克隆和口型同步

1. D-ID推出的AI视频翻译工具能够克隆说话者的声音并同步嘴唇动作以匹配翻译的文字,提升视频本地化的自然度和准确性;

2. 新工具支持30种语言,目标是帮助创作者和企业在营销和社交媒体等领域节省本地化成本,同时提供一个月的免费试用;

3. D-ID的视频翻译技术面向单一说话者,要求视频中的人物始终面向摄像头,以确保最佳翻译效果.

https://mp.weixin.qq.com/s/fjwRan9yWE17_t4mJOkr-w

七、  比尔·盖茨要用 AI 对付蚊子,人类和蚊子的「战争」迎来终局?

1. VectorCam利用AI模型VectorBrain,通过卷积神经网络和YOLO模型精准识别蚊子种类、性别和腹部状态,识别准确率达90%以上;

2. 系统设计简化,配备易操作的成像设备和手机应用,即使非专业人员也能快速上手,在疟疾传播区有效应用;

3. HumBug通过手机捕捉蚊子飞行声音,识别蚊子种类,进一步简化监测流程,但仍处于早期开发阶段。

https://mp.weixin.qq.com/s/b-bemvm07V9Z-HQK-CgQug

前沿科技

八、  国产机器人黑马NAVIAI首次登场,打螺丝堪比擎天柱!国家队全栈自主研发

1. 领航者2号NAVIAI机器人实现了全栈自主研发,具备41个自由度、拟人化操作及高精度工业作业能力,展现出科技与人文的融合;

2. 机器人采用先进AI技术,如大模型结合强化学习,实现高效决策与灵活作业,适应多种复杂场景;

3. 浙江人形机器人创新中心通过集结顶尖人才,推进全链自研,已在实际工业场景中成功应用。

https://mp.weixin.qq.com/s/i2YjWTFDwqbCwK487s3DSw

九、  意念玩《黑神话》指日可待?马斯克Neuralink受试者玩起CS,画CAD

1. Neuralink的第二名试验患者Alex成功使用AI植入物进行高级活动,如玩《反恐精英2》和使用CAD软件设计3D对象;

2. 该技术通过脑机接口(BCI)实现,允许Alex通过思维控制光标和执行复杂的计算机任务,展示了接口的高速度和准确性;

3. 马斯克预计在未来几年内将有数百至数百万人使用Neuralink,展望了脑机接口技术将AI与人类融合的未来可能性.

https://mp.weixin.qq.com/s/c9O4fDL2oSMOXTGI5fIbng

报告观点

十、  红杉:创业公司需要建立一种允许犯错的文化,生存的唯一途径是尝试新事物

1. 红杉资本的Doug Leone强调创业公司需要建立一种允许犯错的文化,以适应快速变化的市场和技术环境;

2. 创业者应选择经验丰富的合作伙伴和投资者,这对公司的长期发展至关重要;

3. 面对潜在的经济低迷,创业者应在早期筹资时保持谨慎,并适当增加资金储备以应对不确定性.

https://mp.weixin.qq.com/s/gaxGwl43bMvL0U4EeurMag

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章