腾讯研究院AI速递 20241104

学术   2024-11-04 00:01   广东  

生成式AI

一、  o1满血版泄露!奥数题图片推理轻松搞定,奥特曼上线剧透o2

1. OpenAI泄露了完整版o1,用户可以通过官网体验其功能;

2. 泄露模型展示了强大的图像推理能力,能处理复杂的数学题;

3. 有网友认为此次泄露可能是故意策划的,旨在为即将发布的模型制造预期。

https://mp.weixin.qq.com/s/hzXIVc0wYJV3mOaAE8H-tA

二、  Claude升级:学会识别和分析PDF中的图片、表格等视觉元素

1. Anthropic公司推出的Claude AI助手更新增强了对PDF文档中图片和表格的分析能力;

2. 新功能使Claude能够识别图表、读取表格数据并进行计算,从而提升文档处理效率;

3. Claude在数据分析、文献研究和财报分析等领域提供了多种实用应用场景,帮助用户提取和分析信息。

https://mp.weixin.qq.com/s/bprok6HQhcPi225LYZNNvQ

三、  全球首款AI游戏,无需游戏引擎,视频模型直出「我的世界」

1. 初创公司Decart和Etched推出Oasis,全球首款无需游戏引擎的实时可玩AI游戏模型;

2. Oasis通过数百万小时的游戏视频训练,能够实时生成开放世界游戏并支持多种玩家操作;

3. 新模型利用Transformer架构和Etched的Sohu芯片,提供高效的视频生成能力,未来有潜力在交互式视频领域引领创新。

https://mp.weixin.qq.com/s/GSf5vr1oUYTcvM6PLaxTPg

四、  Runway Gen-3 Alpha Turbo:AI视频摄像机控制,创意无限!

1. Runway推出的Gen-3 Alpha Turbo模型提升了AI视频生成的保真度和一致性,并增加了先进的摄像机控制功能;

2. 用户能够精确控制摄像机运动,实现平滑环绕和戏剧性变焦,创造沉浸式观影体验;

3. Gen-3 Alpha Turbo支持动态控制和行业定制化,满足特定艺术和叙事需求,为视频创作者提供无限创意空间。

https://mp.weixin.qq.com/s/u_P5R_o3_scdIyw-NdDyTQ

五、  Suno AI音乐平台推出了Personas的突破性功能:固定风格

1. Suno AI推出Personas功能,允许用户提取和复用歌曲的声乐风格、情感和音乐特点,增强个性化创作;

2. 用户可以创建公开或私密的Persona模板,促进音乐创作的社交价值,增加互动;

3. 该功能简化创作流程,使用户能快速生成具有个人特色的音乐作品,目前向专业版和高级会员开放。

https://mp.weixin.qq.com/s/Pc5MBoE_qxuxFjd0zggNOw

六、  3D建模标杆Autodesk收购的Wonder Dynamics发布AI工具

1. Wonder Dynamics推出Wonder Animation技术,能将视频一键转化为可编辑的3D场景,简化动画制作流程;

2. 新工具支持多摄像机拍摄,实时估计角色动作,提高动画制作的灵活性和效率;

3. 该技术不依赖传统动作捕捉设备,利用AI进行运动捕捉,增强小型工作室和独立开发者的创作能力。

https://mp.weixin.qq.com/s/0NaI9HWYN39Ni4OyTcMc_g

七、  D-ID发布两款数字人工具Express和Premium+,生产力UP

1. D-ID推出Express和Premium+两款虚拟人工具,帮助企业在营销、销售和客户支持等领域提升交互效果;

2. Express虚拟人仅需一分钟训练,支持头部动作同步,适合快速生成内容;Premium+需五分钟训练,支持更复杂的肢体动作,提供更高的真实感;

3. 新工具具有个性化、便捷性和经济高效等特点,支持多语言和大规模内容创作,提升品牌参与感和转化率。

https://mp.weixin.qq.com/s/df_vmxrglglvSP5hYjil-g

八、  精准狙击!ChatGPT搜索前1分钟,谷歌宣布了自家AI搜索

1. ChatGPT正式推出搜索功能,允许用户通过自然语言查询实时信息,并提供参考链接,标志着AI搜索的新时代;

2. 同时,谷歌也发布了自家的AI搜索功能,名为Grounding,强调实时更新和准确性,双方在AI搜索领域展开激烈竞争;

3. 新功能使用户能快速获取全面的信息,同时改善了搜索体验,但仍存在内容质量不稳定和幻觉等问题。

https://mp.weixin.qq.com/s/5ATeCL99oEdR3UkV7qqKow

前沿科技

九、  2mm芯片植入视网膜,盲人重获阅读能力,马斯克老部下创业

1. 由马斯克前部下创立的Science公司开发了一款2mm的视网膜植入芯片PRIMA,使盲人能够恢复部分视力,重新获得阅读和辨别面孔的能力;

2. PRIMA通过与带摄像头的眼镜配合使用,利用红外光将视觉信息转换为电信号,但患者所看到的图像与正常视力存在差异;

3. 初步临床试验结果显示,患者视力显著提高,使用植入物后可在视力表上平均多看清五行,表明该技术具有良好的安全性和应用前景。

https://mp.weixin.qq.com/s/uhjLXCpuZMhkF3GSlrK_QA

报告观点

十、  OpenAI华人科学家翁荔:如何培养出下一代聪明且安全的AI

1. OpenAI研究副总裁翁荔强调,AI的安全性是其智能化与自主化发展的基础,确保其符合人类价值观至关重要;

2. 通过提供多样、准确的数据和基于人类反馈的强化学习(RLHF),可以减少AI的偏见,提升其输出质量;

3. AI安全不仅是研究者的责任,公众的参与同样重要,社区共同努力可以塑造一个安全、可靠的AI环境。

https://mp.weixin.qq.com/s/IFINmOlRE1kOeNZY1BINOQ

十一、  Altman 携高管「回答一切」,Reddit的AMA,Ask Me Anything

1. Sam Altman表示AGI可在现有硬件上实现,Ilya对未来的洞察力至关重要;

2. 预计到2025年,ChatGPT将能独立执行任务,AI产品线将迎来重大突破;

3. LLM架构的突破可能推动AGI的发展,所有LLM基准测试将在2025年前趋于饱和。

https://mp.weixin.qq.com/s/_-7zn3h_6Np1H5lXS5906g

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章