生成式AI
一、 o1满血版泄露!奥数题图片推理轻松搞定,奥特曼上线剧透o2
1. OpenAI泄露了完整版o1,用户可以通过官网体验其功能;
2. 泄露模型展示了强大的图像推理能力,能处理复杂的数学题;
3. 有网友认为此次泄露可能是故意策划的,旨在为即将发布的模型制造预期。
https://mp.weixin.qq.com/s/hzXIVc0wYJV3mOaAE8H-tA
二、 Claude升级:学会识别和分析PDF中的图片、表格等视觉元素
1. Anthropic公司推出的Claude AI助手更新增强了对PDF文档中图片和表格的分析能力;
2. 新功能使Claude能够识别图表、读取表格数据并进行计算,从而提升文档处理效率;
3. Claude在数据分析、文献研究和财报分析等领域提供了多种实用应用场景,帮助用户提取和分析信息。
https://mp.weixin.qq.com/s/bprok6HQhcPi225LYZNNvQ
三、 全球首款AI游戏,无需游戏引擎,视频模型直出「我的世界」
1. 初创公司Decart和Etched推出Oasis,全球首款无需游戏引擎的实时可玩AI游戏模型;
2. Oasis通过数百万小时的游戏视频训练,能够实时生成开放世界游戏并支持多种玩家操作;
3. 新模型利用Transformer架构和Etched的Sohu芯片,提供高效的视频生成能力,未来有潜力在交互式视频领域引领创新。
https://mp.weixin.qq.com/s/GSf5vr1oUYTcvM6PLaxTPg
四、 Runway Gen-3 Alpha Turbo:AI视频摄像机控制,创意无限!
1. Runway推出的Gen-3 Alpha Turbo模型提升了AI视频生成的保真度和一致性,并增加了先进的摄像机控制功能;
2. 用户能够精确控制摄像机运动,实现平滑环绕和戏剧性变焦,创造沉浸式观影体验;
3. Gen-3 Alpha Turbo支持动态控制和行业定制化,满足特定艺术和叙事需求,为视频创作者提供无限创意空间。
https://mp.weixin.qq.com/s/u_P5R_o3_scdIyw-NdDyTQ
五、 Suno AI音乐平台推出了Personas的突破性功能:固定风格
1. Suno AI推出Personas功能,允许用户提取和复用歌曲的声乐风格、情感和音乐特点,增强个性化创作;
2. 用户可以创建公开或私密的Persona模板,促进音乐创作的社交价值,增加互动;
3. 该功能简化创作流程,使用户能快速生成具有个人特色的音乐作品,目前向专业版和高级会员开放。
https://mp.weixin.qq.com/s/Pc5MBoE_qxuxFjd0zggNOw
六、 3D建模标杆Autodesk收购的Wonder Dynamics发布AI工具
1. Wonder Dynamics推出Wonder Animation技术,能将视频一键转化为可编辑的3D场景,简化动画制作流程;
2. 新工具支持多摄像机拍摄,实时估计角色动作,提高动画制作的灵活性和效率;
3. 该技术不依赖传统动作捕捉设备,利用AI进行运动捕捉,增强小型工作室和独立开发者的创作能力。
https://mp.weixin.qq.com/s/0NaI9HWYN39Ni4OyTcMc_g
七、 D-ID发布两款数字人工具Express和Premium+,生产力UP
1. D-ID推出Express和Premium+两款虚拟人工具,帮助企业在营销、销售和客户支持等领域提升交互效果;
2. Express虚拟人仅需一分钟训练,支持头部动作同步,适合快速生成内容;Premium+需五分钟训练,支持更复杂的肢体动作,提供更高的真实感;
3. 新工具具有个性化、便捷性和经济高效等特点,支持多语言和大规模内容创作,提升品牌参与感和转化率。
https://mp.weixin.qq.com/s/df_vmxrglglvSP5hYjil-g
八、 精准狙击!ChatGPT搜索前1分钟,谷歌宣布了自家AI搜索
1. ChatGPT正式推出搜索功能,允许用户通过自然语言查询实时信息,并提供参考链接,标志着AI搜索的新时代;
2. 同时,谷歌也发布了自家的AI搜索功能,名为Grounding,强调实时更新和准确性,双方在AI搜索领域展开激烈竞争;
3. 新功能使用户能快速获取全面的信息,同时改善了搜索体验,但仍存在内容质量不稳定和幻觉等问题。
https://mp.weixin.qq.com/s/5ATeCL99oEdR3UkV7qqKow
前沿科技
九、 2mm芯片植入视网膜,盲人重获阅读能力,马斯克老部下创业
1. 由马斯克前部下创立的Science公司开发了一款2mm的视网膜植入芯片PRIMA,使盲人能够恢复部分视力,重新获得阅读和辨别面孔的能力;
2. PRIMA通过与带摄像头的眼镜配合使用,利用红外光将视觉信息转换为电信号,但患者所看到的图像与正常视力存在差异;
3. 初步临床试验结果显示,患者视力显著提高,使用植入物后可在视力表上平均多看清五行,表明该技术具有良好的安全性和应用前景。
https://mp.weixin.qq.com/s/uhjLXCpuZMhkF3GSlrK_QA
报告观点
十、 OpenAI华人科学家翁荔:如何培养出下一代聪明且安全的AI
1. OpenAI研究副总裁翁荔强调,AI的安全性是其智能化与自主化发展的基础,确保其符合人类价值观至关重要;
2. 通过提供多样、准确的数据和基于人类反馈的强化学习(RLHF),可以减少AI的偏见,提升其输出质量;
3. AI安全不仅是研究者的责任,公众的参与同样重要,社区共同努力可以塑造一个安全、可靠的AI环境。
https://mp.weixin.qq.com/s/IFINmOlRE1kOeNZY1BINOQ
十一、 Altman 携高管「回答一切」,Reddit的AMA,Ask Me Anything
1. Sam Altman表示AGI可在现有硬件上实现,Ilya对未来的洞察力至关重要;
2. 预计到2025年,ChatGPT将能独立执行任务,AI产品线将迎来重大突破;
3. LLM架构的突破可能推动AGI的发展,所有LLM基准测试将在2025年前趋于饱和。
https://mp.weixin.qq.com/s/_-7zn3h_6Np1H5lXS5906g
👇订阅下方合集,获取每日推送