#1.
GPT-4o17人团队揭秘!
清北上交中科大6位华人领衔
1. Omni团队成员背景:17位成员中,6位华人毕业于清华、北大等名校,有丰富的学术和工业界经验;
2. 技术成就:Prafulla Dhariwal和团队的努力使得全多模态模型GPT-4o成为可能,提升了人机交互;
3. 团队影响力:Omni团队的小规模却高效的协作,推动了AI技术的前沿发展,受到业界高度评价。
#2.
顶级风投a16z创始人对谈AI与创业,信息量爆炸!
#3.
OpenAI首次科学家离职,
同时超级对齐团队负责人离职。
Ilya Sutskever,OpenAI的首席科学家,在服务近十年后离开公司。Jakub Pachocki接任为首席科学家,此前在GPT-4及其他重要项目中扮演核心角色;
OpenAI创始团队对Ilya的贡献表示深切的感激,他的离开被视为一个时代的结束。
OpenAI超级对齐团队领导人Jan Leike和首席科学家Ilya Sutskever同时宣布离职,引发关于AGI实现的广泛猜测;
超级对齐团队旨在解决AGI安全对齐问题,但多位成员离职可能表明内部对AGI发展的分歧或不满;
网友和社区对这些离职事件反应强烈,对OpenAI的未来方向和AGI研究进展提出疑问。
#4.
对标GPT4o!
谷歌发布Project Astra,
全民AI代理时代来了
谷歌DeepMind发布全新AI代理Project Astra,可实现跨文本、音频、视频的多模态实时推理;
Astra具有高级多模态理解能力,可通过设备如手机和谷歌眼镜进行实时环境解读和交互;
尽管Astra在语音情感输出和数据响应效率方面略逊于GPT4o,但仍提供广泛应用的可能性。
#5.
谷歌Gemini 1.5轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
Gemini 1.5引入了工程和基础设施优化、MoE架构,提升了处理跨模态内容的长上下文检索和推理能力;
Gemini 1.5 Flash版本专注于高效计算,使用TPU优化运算,实现较低延迟和快速响应,比GPT-4 Turbo快5倍;
Gemini 1.5 Pro表现出色,尤其在数学问题解决中,未使用辅助工具达到91.1%的突破性表现,有效减少专业任务完成时间26-75%。
#6.
谷歌文生图模型Imagen 3,写实效果超强!堪比真人拍摄照片
Imagen 3优化了文本解析能力,能详细捕捉长文本提示中的细微细节,并提高嵌入文字的生成准确性;
模型支持多种艺术风格,尤其在生成写实风格图片方面表现出高质量,与真实摄影难以区分;
Imagen 3将面向多个领域推出,提供从快速草图到高分辨率图像的多版本优化,满足广泛的创作需求。
#7.
讯飞发布会议耳机Pro 2,
耳端生产力革命
讯飞会议耳机Pro 2集成viaim AI会议助理,能实时记录、摘要和提取会议信息,显著提高会议记录效率;
耳机支持录音、转写、翻译及存储功能,变身全功能会议工具,满足现代办公需求;
结合生成式AI技术,TWS耳机不仅增强了生产力工具的功能,也为用户的办公场景提供了多元化的交互方式。
#8.
李飞飞创业方向「空间智能」,让AI真正理解世界
李飞飞强调「空间智能」作为AI理解真实世界的关键技术,此技术能够使AI通过视觉、洞察力到行动的转变,增强其对三维空间的理解和互动能力;
她在TED演讲中提出,通过让计算机在三维世界中学习和行动,能模仿自然界中视觉与行动的良性循环,推动机器人学习和行动的能力;
李飞飞的创业公司及斯坦福实验室正在开发能让AI执行复杂三维任务的技术,如机械臂根据口头指令执行任务,显示空间智能在未来应用的广泛前景。