排序按照拼音/英文首字母顺序作为中国领先的创新者社区,极客公园自成立之初便与国内技术创新的浪潮同频共振,见证了一代又一代技术商业领袖的成长与蜕变。自 2011 年 1 月首次推出 InnoAwards 以来,极客公园便致力于通过其记录和展示科技互联网领域的年度发展与变革。「年度创新力量 TOP 50(InnoForce 50)」是「InnoAwards」精神的延续,已陪伴中国互联网走过超 10 个年头,每一年我们都从中看到新的可能。在过去一年里,随着业界对人工智能技术的不断探索,这一轮技术与创新成果的可用度大幅提升,不仅通过各种产品形态深入我们的生活,以越来越细小的触角影响着每一个人;也给那些站在浪潮之巅的极客们提供了更加先进可用的底层技术,使得开发者们凭借很小的团队,甚至一人之力,就能打造出成熟的产品,并获得成功。今天,极客公园再次推出 2024 年度「InnoForce 50」,旨在发现过去一年中,在人工智能技术领域及其交叉领域实现了创新突破的产品、技术、组织、项目和个人开发者。2024 年度「InnoForce 50」主要关注 3 个维度:创新性、实用性和社会价值增溢。我们相信,科技的使命既是解决现实世界中的真实问题,也是仰望星空的浪漫主义梦想。因此,2024 年度「InnoForce 50」的关键词是突破、想象、以人为本——技术与商业的突破,早期但足够前沿的创新,以及技术与商业的价值成长带来的社会温度。2024 年度「InnoForce 50」不仅是对业界过去一年科技创新成果的认可,更是对未来创新潜力的期待。以下为 2024 年度「InnoForce 50」:豆包是字节跳动推出的 AI 对话助手,通过自然语言交互,豆包可以像朋友一样跟用户聊天、回答问题,豆包 PC 版则更像个人助理,帮助用户更好地工作和学习。目前在各大应用市场中,豆包 App 的月活跃用户数、用户留存率和总下载量均在 AIGC 类应用中排名第一。在底层大模型技术栈远未收敛的 2024 年,豆包赢得了广泛的用户使用,验证了其定义的三个产品设计原则——「拟人化」、「离用户更近」和「个性化」,既满足了当下的用户需求,也为用户带来更好的体验。以「离用户更近」的设计原则来说,豆包的产品迭代方向,致力于让豆包到用户身边,随时嵌入用户的不同使用环境中伴随用户,而不是用户到豆包身边。为此,豆包很早便发力优化语音交互体验,包括基于大模型的 ASR 和超自然的 TTS 音色,让用户可以随时在户外语音唤起它,带来与真人对话的体验。同时,为了帮助用户提高工作学习效率,豆包推出了浏览器 Web 应用、桌面客户端,以及网页插件版,让用户在读 PDF、写代码等任何场景下,都可以通过划词选中、截屏等方式,唤醒它帮助用户就近解决任务。值得注意的是,今年豆包发布了首款 AI 智能体耳机 OlaFriend,用户只需直接触摸耳机或说出唤醒词「豆包豆包」,就能与它语音交流,把用户在手机里用的「豆包」App 调到耳机里,离人更近。2024 年,豆包以模型技术驱动的产品能力,赢得用户喜爱。从其技术产品的进步速度来看,字节跳动正在大模型领域已经形成了「集团化作战」的团队和资源集结,正在快速追赶全球水平。游戏本体销量在全球范围内超过 2000 万份,并获得了全球玩家一致好评。同时,《黑神话:悟空》在全球掀起了一股西游文化浪潮,成为了一个在全球产生的内容作品,让中国传统文化释放了全新的魅力。《黑神话:悟空》的创造者——游戏科学公司,名字源于「游戏开发是一门需要勤奋与灵感并重的严谨学科」的寓意,这家创业公司也践行了这个原则。在《黑神话:悟空》之前,开发团队也曾产出数款在商业上已经取得成功的游戏,但开发团队没有止步于「复制商业成功」,而是坚持了创业团队创造世界级游戏作品的初始目标,在第一次 3A 游戏的尝试里,以六年磨一剑的坚持,最终交付了超越行业和用户预期《黑神话:悟空》。游戏科学团队的成功很好地运用科技支撑了审美。团队在游戏开发中充分运用了科技的力量——比如曾在开发一年后,果断选择切换到虚幻 5 引擎平台进行开发,利用虚幻 5 引擎对于 3D 扫描实景后更高效进行建模的能力,极大的提升了开发效率,并因此获得了充分利用中国文化古迹遗产,创造世界级视觉体验的能力。同时也在传统西游文化基础之上,进行了世界观的创新设定,创造了与时代共振的故事表达,构建了引人入胜的视觉和感动人心的游戏故事。这让它成为了 2024 全球游戏行业难得一见的「清流」。也带给了游戏玩家期待已久的「更纯粹的快乐」。《黑神话:悟空》的成功,无论是从产品创新还是游戏产业未来发展的角度,对于中国游戏领域都有着启发意义,值得作为年度创新产品给予掌声和鼓励。今年 6 月,快手推出了首个全球用户可用的,真实影像级视觉生成大模型平台可灵 AI,展示了国内大模型技术的创新实力。在技术上,可灵 AI 突破了传统图像生成与时序模块的局限,采用自研的 Diffusion Transformer 和 3D VAE 架构,结合高效的 3D Attention 时空建模模块与升维隐空间解码,精准建模复杂运动,生成符合运动规律的视频;采用 flow 模型替代传统 DDPM 方案,显著提高计算效率,同时通过专用语言模型优化用户输入提示词,提升视频描述质量,并支持多种控制信息输入和自回归时序扩展。这些创新使可灵 AI 在高帧率、复杂运动和多样化生成能力上树立了行业标杆。自发布以来,可灵 AI 凭借其独特的技术特性与广泛应用场景,持续吸引全球用户并快速迭代升级。从最初的基础功能到最新的 1.5 版本模型,可灵 AI 在画质、美感、动态质量及语义响应度上不断取得突破,为用户带来更高水准的创作体验。其生成的视频能够达到 1080p 分辨率、最长 2 分钟的高品质效果,同时支持文生视频、图生视频、一键续写及多次续写等功能。到目前为止,可灵 AI 服务用户已超 500 万,累计生成 5100 万个视频,超 1.5 亿张图片。快手对 AI 技术的投入效率很高,除了可灵 AI,还有 π数字员工等产品也值得关注。π数字员工是一款基于快意对话模型的多 Agents 协同平台,其具备全天候接待、高效服务、降低成本等功能,适应多行业需求,代表了快手 AI 技术的高效应用。小米 SU7 是小米汽车推出的第一款产品,发布后迅速成为爆款,在原本并不属于热门细分市场的纯电轿车品类里,创下了 7 个月完成 10 万台交付目标的行业速度。这个超越所有人预期的结果背后也有着很多创新的思考。在技术层面,作为电动汽车的立身之本,小米虽然入局较晚、但非常深度的参与了三电系统的研发。自主研发的超级电机小米 V8s 拥有全球最高的转速;优秀的电控能力,让小米 SU7 的能耗表现比肩特斯拉,达到行业第一梯队水准;CTB 倒置电芯技术不仅可以减少电池厚度,还能在发生碰撞时最大程度保证乘员舱安全。在智能化领域,小米 SU7 依托于小米澎湃 OS,打造出流畅的屏幕、智能语音交互体验。同时,小米 SU7 支持车内硬件和小米生态内其他硬件进行共享,进一步打通人车家全生态体验。而在外观设计上,小米 SU7 以低风阻和高颜值作为两个重要原则,在达到 0.195 超低风阻系数的基础上,依靠极致的轮轴比、轮高比、配色方案,打造一款外观破圈的产品,甚至完成了对女性用户群的跨越,比如小米 SU7 女性用户占比达到了接近一半的比例。这是过去主流汽车产品很难实现的结果。作为小米旗下首款智能电动汽车产品,小米在 3 年的周期内,从 0 到 1 交出了小米 SU7 这款完成度极高的产品。它不仅充分运用了小米产品定义能力的优势经验,在行业内打造了诸多创新的功能点,也充分运用了传播和品牌和销售推广上的创新思路,给整个行业带来了突破性的思考。在目前大热的人形机器人、具身智能赛道,宇树科技是最头部的公司之一。今年团队发布了第二款人形机器人 G1,引起全行业关注。首先是硬件性能强,如果说其去年发布的首款人形机器人 H1 拥有全球几乎规格最高的动力性能,G1 性能依然强劲,用到 23-43 个关节电机,有超越常人的灵活性;由模仿和强化学习驱动,AI 技术持续迭代;同时力控灵巧手能实现精准操作。其次,G1 价格仅 9.9 万元,将人形机器人平均数十万、乃至百万元的价格降了下来。这背后主要依靠团队对硬件成本的工程化控制能力。目前,掣肘人形机器人应用落地的两大技术难点是,一是能否干活,二是成本能否下降。G1 对这两个问题做了很好的回答。因此,宇树的人形机器人本体(硬件)出货量领先,被全球各大科研机构和科技公司购买、用作研究。H1、G1 底层技术主要迁移自宇树研发多年的四足机器狗技术。2013 年,还在读研的创始人王兴兴,自己设计电机、控制算法等,用不到两万块研发出了第一台四足机器狗 XDog。2016 年,王兴兴创立宇树科技。宇树的技术实力源于创始人的热爱与坚持,也来源于团队对技术路线的独立判断,比如宇树坚持电驱、而非主流的液压路线,被证明是更正确的。技术之外,宇树的核心目标是做好产品、服务好用户。在务实的基础上,宇树科技一步步向人形机器人的技术星辰大海中走去。2024 年,DeepSeek(深度求索)不断突破。DeepSeek-V2 开源 MOE 模型,上线即被视为「神秘的东方力量」,其多个模型版本在 LMSYS 全球大模型竞技场榜单上屡创佳绩,并创新性地引入了 MLA(Multi-head Latent Attention)结构,大幅降低了推理成本。持续释放创新成果的背后,是其在组织目标、人才、创新机制上的独特选择。在组织目标上,DeepSeek 致力于研究和探索 AGI 的未解之谜,以期用前沿技术推动整个 AI 生态发展。DeepSeek 以技术提升为核心,坚定选择开源路线,在商业化道路上形成了自己的风格。当前,DeepSeek 团队体量在百人上下,但却形成了一套高效的组织创新机制。在人才招揽上,DeepSeek 强调热爱、好奇心以及扎实的基础能力。其团队的组织方式主要是自下而上。每个人带着自己独特的成长经历和想法探索,遇到问题自主协调训练集群和人才合作。只有当一个想法显示出潜力时,组织才会自上而下地组织和调配资源。举例来说,DeepSeek 引发大模型价格战的模型结构创新 MLA,最早来自一个年轻研究员的个人兴趣,后续是由组织自上而下探索验证。在当下产业结构调整的创新环境中,DeepSeek 创新路径极具启发意义:比资本和信心更稀缺的,是如何组织高密度的人才,实现有效创新。2024 年之前,理想汽车的智能驾驶技术曾被视为「差生」。去年,CEO 李想还在反思在智驾领域的投入偏晚。然而,进入 2024 年,理想却迅速迎头赶上,成功弥补了智驾的短板。特别是理想智驾驶团队推出了创新的「端到端+VLM」双系统模式,类似于心理学中的「快思考」和「慢思考」的结合,可以大幅提升智能驾驶的反应速度与决策能力。理想汽车的成功不仅依赖于技术创新,更源于其高效的组织架构与灵活的研发流程。借鉴华为的组织架构,理想采用了集成产品开发(IPD)流程+矩阵型组织架构,并结合自身特点进行了深度优化,确保各部门之间的高效协同。同时,随着智能驾驶技术路线从规则转向端到端,在数据收集、样本制作、自动化训练等领域减少了人的参与度。与此同时,理想汽车适时调整了人力配置和组织架构,形成了以 RD(Research Development)和 PD(Product Development)为核心的双轨研发体系。前者专注于下一代人工智能的发展,后者则聚焦于现有技术的量产与用户维护,确保了技术的持续进步与市场需求的快速响应。在智能汽车迅速迭代的时代,理想智驾团队的创新思路为我们提供了新的启示:创新的技术也需要创新的组织形态来助推,技术的革命背后需要首先用组织的成长和变化来匹配。作为起家于农业、以农业为基本盘的公司,拼多多长期支持国内农业的发展。近两年,拼多多支持中国工程院院士、中国农业大学教授张福锁团队的「科技小院」项目,并于今年推出了「科技小院强农兴农人才培养行动计划」,探索公益性人才培养模式。「科技小院」由张福锁和团队于 2009 年在河北省曲周县首创,是扎根生产一线的农业创新组织。目前,全国已有 157 个研究生培养单位积极参与,牵头建设了 1800 多个科技小院,覆盖 31 个省级行政区和新疆生产建设兵团。该项目已取得初步成果。以曲周县第四疃镇下面的攻关千亩方为例,其为瘠薄、轻度盐渍化的中低产田。这一年来,在曲周各科技小院师生、各科研单位努力下,该土地实现:粮食周年亩产达 1.52 吨、较全县平均增产 42%;化肥效率 55kg/kg、增长 40%、减排 46%;水分利用效率 2.16kg/m³、节水 30%;亩节本增收 795 元。在连续两届支持科技小院大赛之外,拼多多还帮助各地科技小院重点支持的农产品打造成爆品,送往千家万户。例如,科技小院重点研究的丹棱桔橙「爱媛 38 号」,近年来在拼多多平台打开销路,当地不少果农开起了线上店铺,直接服务消费者。「科技小院」项目是学界和产业的双向合作,推动了我国农业的供给侧升级和高质量发展。flomo 浮墨笔记在 2024 年的产品更新中,成功运用大模型技术实现了更智能的笔记分析与管理,使其在同类笔记产品中获得了优秀的用户口碑。flomo 诞生之初的目的是在全平台支持用户随时随地记录想法。它允许用户通过微信、App、网页等多种渠道,快速捕捉灵感,无需担心格式差异,保持笔记的实时更新。2024 年其更新的「相关笔记」和「找一找」功能,让笔记的回顾和整理变得井然有序。「相关笔记」通过深度学习分析用户记录,以单条笔记为出发点,智能推荐笔记库中与之有内在关联的其它笔记;「找一找」则是以提问的方式挖掘过往的笔记内容。其背后的 AI 技术是让 flomo 脱颖而出的关键。这种「学习」和「理解」的能力,使得 flomo 能够主动建立知识间的联系,让个人知识库不再是静态的积累,而是能够动态地支持用户的创新和决策。同时,通过使用 API,flomo 与阅读软件等应用联动,极大扩展了笔记的应用场景。flomo,在良好的产品设计和交互设计基础上,合理地运用了大模型技术,让用户的思维碎片从深度和广度上得到链接与扩展,释放了笔记产品更多潜力,在个人知识管理工具中,为用户交付了更高的产品价值。Monica 作为一款 All-in-One 的 AI 助手,主要以浏览器插件的产品形态,实现了 AI 功能的分发。在 AI 技术栈远未收敛的今天,Monica 精准切中了当下的用户需求:在既有场景里用 AI 优化流程和用户体验。Monica 致力于把大模型「低垂的果实」和用户场景理解到极致,将最趁手的 AI 体验第一时间带给用户。2024 年,Monica 以「速度」刷新用户体验和价值。在 GPT-4o、Claude 3.5、OpenAI o1 系列上线的第一时间,用户即可通过 Monica 解锁最新 SOTA 模型,用上新模型驱动下的网页内容新交互。比如随着接入模型的新进展,Monica 的专业搜索、DIY Bot、Artifacts 写小程序、记忆等功能深受用户喜爱。同时,Monica 以对用户场景的深入研究见长,以满足在用户特定场景下的痛点和个性化体验。比如 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的网页里呈现出不同的交互形态和功能,以适配特定场景的用户需求,今年已更新数百个网页的个性化 AI 体验。同时,Monica 也支持用户自行修改默认配置,以满足个人的最佳使用习惯。功能更新快、场景积累深厚、基于用户的个性化迭代,Monica 在信息获取和处理上带来了高效的体验,也赢得了用户的喜爱。2024 年,Monica 用户数量翻番,达 1000 万。同时,其保持着可观的盈利,在海外同类产品中,位居头部。Monica 的表现验证了在当下,套壳到极致,既是 TPF、也是 PMF,最后都通往用户价值。BaaS 电池租用服务是蔚来为用户提供的一种创新的电池租赁服务,该服务允许将车辆和电池分离购买,旨在降低购车门槛,提高了产品竞争力,同时推动电池管理和健康保障,进一步减少能源浪费和环境污染。BaaS 服务最早于 2020 年推出,作为一种创新的服务型产品,它可以依托于蔚来独有的换电体系,为用户提供差异化购车和补能体验。但也正因为前期需要投入大量资源建设换电站,蔚来换电体系曾在初期遭受到行业质疑。2024 年,蔚来已在全国布局超过 2600 座换电站,第四代换电站最快可实现 2.5 分钟满电出发的补能体验。同时,「可充可换可升级」的服务体系,允许用户日常选择标准容量电池,长途出行选择更大容量电池。目前,超过 95% 的蔚来用户在购车时选择了标准续航电池版本,进一步降低购车成本的同时,也可以避免能源浪费。本年度,蔚来公司连续 6 个月销量突破 2 万台,蔚来长期在补能领域的研发和创新,终于兑现成了体系化的优势,超 7 成用户在新购车了选择了 BaaS 方案。BaaS 的推广,既为用户提供了智能电动汽车时代更灵活的购车方式,也让蔚来换电的体系化优势进一步凸显。作为最早系统性投入研发物理世界 AGI 的公司之一,智平方 2024 年推出了 Alpha Bot 机器人解决方案,成为最早进行商业化推广的智能机器人公司之一。智平方推出的通用智能机器人 Alpha Bot 系列,可以像人类一样迅速适应新环境,灵活执行多种任务操作。其背后搭载的是智平方全栈自研的端到端具身大模型 AI2 Brain。智平方通过自有数据、原创模型结构与训练方法,在空间智能基础模型方面取得了显著的技术进展,为 AI2R Brain 提供了无与伦比的空间感知能力;加上独特的端到端架构设计优化以及软硬垂直整合技术,在非结构化场景中,AI2R Brain 的泛化任务成功率业界领先,其端侧运行速度也在全球领先。目前,智平方推出的 AI2R Brain MaaS 服务与 Alpha Bot 机器人解决方案已经得到头部互联网企业、国际头部车企等行业客户的技术认证。智平方由国家创新领军郭彦东博士创建,核心团队有多年硬核 AI 原创研发经验、智能硬件主机厂大规模量产经验。团队致力于构建一个可拓展的机器人体系,解决智能机器人在广泛、多样的真实场景中进行规模化交付的世界难题。2024 年,百度文库凭借 AI 技术上的创新突破,重构为一站式 AI 内容获取和创作平台,提升用户创作效率的同时,进一步推动了内容创作的智能化转型。除了 14 亿专业文档之外,基于文心大模型,百度文库推出智能 PPT、智能文档、行业研究报告、AI 全网搜索、智能有声画本、智能漫画等上百项 AI 功能,覆盖学习办公、家庭教育、兼职赚钱场景。截至 2024 年 10 月,百度文库 AI 用户数累计超 2.3 亿,AI 功能累计使用次数超 28 亿。百度文库与百度网盘也全面融合,在两个产品原有优势上实现了进一步打通、重构,并发布了 AI 创作新物种「自由画布」,后者不仅突破了内容创作的传统界限,还推动了公域与私域内容的自由流动,为用户提供从内容生产到消费的全流程服务。通过技术赋能,百度文库为个体提供了更多创作与就业机会,促进了更广大人群的创作能力提升。海螺 AI 是国内头部的大模型公司 MiniMax 旗下生产力产品。通过 MiniMax 出色的语言大模型,海螺 AI 能实现对话、文档理解、图片识别、文本写作等功能。尤为特别的是,在国内的生产力工具里,海螺 AI 是率先推出语音交互功能的,口音逼近人声、低延时,交互流畅自然,比 GPT-4o 做得更早、效果出色。此外,今年 9 月海螺 AI 又上线了文生视频功能,对标 Sora,产品表现力在国内产品中处于上乘,核心在于指令跟随、对高动态信息的表现力、以及视频的高分辨率和高帧率等。国内外不少用户使用该功能,做出了逼近电影大片的效果,用户反响很好。这反映了该公司的多模态(文本、语音、视频等)产品策略,它相信每扩展一种模态、用户的渗透率会随之提高,而让大模型真正被普通人用起来,正是该公司的愿景。作为最早成立的大模型公司之一,MiniMax 坚持技术和产品双轮驱动,认为技术决定产品、产品又会助力技术。除了海螺 AI 外,MiniMax 底层模型技术还支撑另一款重要产品「星野」,其主打虚拟社交、为用户提供情绪和陪伴价值。凭借在长文本处理、效率工具、以及搜索助手方面的持续投入和功能更新,Kimi 智能助手在 2024 年聚焦生产力场景,成功在众多 AI 助手中打造出了自身的独特辨识度。Kimi 通过支持上传超长文本文档,并快速对文字进行摘要、搜索、翻译、答疑等操作,首先在学术科研人士、互联网从业者和内容创作者等对于文本处理要求较高的行业人士中,产生了口碑传播。2024 年,Kimi 进一步加强了其长板,在上半年更新了 200 万汉字的无损上下文功能,相当于能够一次性看完四大名著。下半年,Kimi 更新了搜索功能,利用其长上下文的优势,以及通过提升 AI 的深度思考能力,通过理解、拆解问题,Kimi 一次搜索可以阅读五百个网页界面,为用户提供更好的搜索结果。2024 年 5 月,Kimi 还尝试了 AI 原生应用的商业化探索。当用户量激增、推理出现高并发时,系统会弹出打赏界面,引导用户付费支持。通过使用用户友好的产品设计,这一商业化尝试并没有引起用户的反感,反而得到一定的支持,是中国原生 AI 应用商业化的一次积极尝试。在头部的大模型公司中,Kimi 是最坚定地投入 C 端策略的公司之一。但对于普通用户而言,分清各家 AI 助手的能力如何,其实并不容易。通过坚定的战略投入,用户友好的体验优化,和以「长文本处理」作为核心特色,Kimi 成功获得了一批自己的忠实用户,并成功塑造了独有的用户认知。2024 年年初推出的秘塔 AI 搜索,推出不到两个月,就获得了数百万访问量,到 2024 年下半年,已经稳居国内 AI 应用访问量前列,表现出色。颠覆了过去搜索引擎的形态,在秘塔 AI 搜索中,用户输入问题后可以直接得到答案,而不是去浩如烟海的网页中自己阅读和判断。这是典型的这波生成式 AI 出现后才能成立的场景。秘塔 AI 搜索自建了网页索引库,在用户提出搜索词后,以自己的算法找到关联的网页,再使用 AI 总结搜索到的网页,交叉验证,直接给出最后的结论。自研了百亿参数的小模型,秘塔率先在 AI 推理成本和 AI 应用能力上做到了相对平衡。通过对用户的搜索需求进行简洁、深入和研究三层分级,秘塔进一步分化用户需求,深入、研究层级能够自动呈现相关事件等更多信息,而简洁模式通常只有一段回答。在 2024 年一年中,秘塔 AI 搜索还不断扩大了搜索范围,目前可搜索范围除了网页还包括学术网站、播客和文库,并上线了图片分析、AI 辅助撰写研究报告、专题知识库的功能。在搜索这个公认更适合大厂参与的领域,秘塔 AI 搜索利用新的 AI 技术对搜索带来的变革,带来了新的用户体验,获得了一批稳定使用其搜索服务的用户,成为了 2024 年最被认可的 AI 原生应用之一。新上线不久的纳米搜索,基于 360AI 搜索在 AI 搜索领域的积累,展示出了很强的产品能力,迅速成为了国内 AI 搜索的突出力量之一。第三方平台数据显示,360 AI 搜索单月最高访问量突破 3 亿。AI 搜索是此次生成式 AI 革命中的重要原生应用场景,但对于 C 端用户而言,存在着产品同质化的问题。不同于其他仅提供简单答案的 AI 搜索,纳米搜索作为全新的「多模态内容创作引擎」,以「搜学写创」为核心能力,实现了多种场景的「AI 生产闭环」。其技术创新与应用包括,构建 CoE 专家协同技术架构提升多语言和多模态搜索能力、引入多模型协作与慢思考模式大幅拓展了 AI 搜索的功能和应用深度。比如多模型协作模式,可以让不同大模型接力回答用户问题,引入一个大模型对另一个大模型的回答进行判断,再引入另外的大模型进行总结处理。模型接力的方式新颖有趣,纳米搜索利用了多家大模型公司的综合能力,用属于 AI 原生产品的构筑方式,真正提升了用户获得答案的质量。在搜索领域深耕多年,360 已经搭建起涵盖千亿网页与专属知识库的庞大索引库,拥有强有力的数据护城河,同时 360 自建了万卡 GPU 算力集群,结合 100 多座数据中心、10 万多台服务器,构筑了坚固的算力护城河。凭借着「360 安全卫士」以及「360 系浏览器」在国内的用户基础和强大的产品更新能力,纳米搜索有机会为更广大的用户带来全新的智能搜索体验。支付宝旗下 AI 生活管家「支小宝」作为服务型的 AI 原生应用,开创性地以对话式交互重塑了用户与服务的连接。
「支小宝」以 AI 为核心,通过连接支付宝丰富的生态系统,为用户提供了涵盖点餐打车、订票挂号及查询附近吃喝玩乐等一站式便捷服务。其场景感知系统能够根据用户的生活习惯及特定时间、空间智能推荐专属服务,真正做到「越用越懂你」。目前,「支小宝」已累计服务 1.5 亿用户,并延展至出行、政务等领域,推出多个专业智能体,如乌镇峰会智能体「桐小乌」、黄山景区文旅智能体「黄小松」等,通过与智能体的连接,「支小宝」为用户创造便捷的生活服务体验。「支小宝」背后是蚂蚁百灵大模型的强大技术,其在对话式 AI 交互中的应用,不仅突破了传统图形用户界面的限制,更率先在行业内实现了生成式 AI 能力的生活化落地。在日常生活中,「支小宝」能感知用户场景,记住通勤、饮食、娱乐等习惯,在不同时间节点提供定制化的智能服务。早上提醒带伞、地铁站调出乘车码、午餐时间推荐餐厅,甚至规划周末出游攻略——「支小宝」以独特的「AI 陪伴」模式,在点滴之间渗透到用户生活中,成为高效贴心的数字管家。作为 AI 原生产品的典范,「支小宝」不仅展示了支付宝对 AI 场景化应用的深刻理解,也成为行业探索「拼应用」的最佳实践。以支小宝为起点,蚂蚁集团的 AI First 战略正引领 AI 服务生态走向未来,为用户带来更加丰富、多元的智能化体验。成立于 2023 年的 AI 应用开发框架 Dify,一直是一个对开发者颇有帮助的开发平台。其在 2024 年更新功能后,在开发者中受到了更多的关注和好评。灵活构建、可靠调试新兴的 AI 应用,对于传统应用开发者来说是一个全新的挑战。为了解决这一问题,Dify 集成了数百种大语言模型,为 AI 应用开发者提供了许多开箱即用的工具,让对大语言模型不够熟悉的开发者,也能经过简单的调试,设计出属于自己的 AI 工具。2024 年,Dify 更新的 AI agent、AI workflow 功能,设计出了流程化的方式,补齐目前 AI 应用开发开发的短板。开发者不必再依赖特定大模型提供的有限工具开发 AI 应用,而是可以通过拖拽、点选等简单的操作,在 AI 不同的工作节点中利用不同模型能力优势,以及多种外部工具来实现丰富的能力,制造出可复制、迁移的应用。方便的导入、导出功能,让 Dify 在开发者中广受欢迎,开发者可以在彼此 Dify 的工作流基础上,进一步构建自己的应用。AI 开发者社群中,甚至出现了专门围绕 Dify 设置的 AI 开发课程、AI 开发比赛和 AI 应用社区。Dify,作为一个开源、中立的工具,让开发者避免了重复造轮子,提升了开发者的生产效率,也在某种程度上,让今年的 AI 应用开发生态更加繁荣。硅基流动是国内 AI 基础设施方向的创业公司,团队专注为生成式 AI 开发者和企业打造高效能 AI 基础设施平台,通过算法、系统和硬件的协同创新,跨数量级降低大模型开发门槛与应用成本,加速 AGI 进程。
团队推出的大模型云服务平台 SiliconCloud,提供极速响应、价格亲民、品类齐全、体验丝滑的模型服务,可让生成式 AI 开发者与企业能够零门槛开发和使用模型,实现应用需求方和开发者能力的快速对接。SiliconCloud 不仅上线了数十款全球最新、最强大的开源模型,还通过自研推理引擎套件(SiliconLLM & OneDiff)大大降低大模型推理成本,用技术让开发者实现 Token 自由。公司自研的 SiliconLLM 大模型推理引擎,通过内核、框架、机制和模型协同优化,使得推理效率达到业内 SOTA,响应速度较同类开源产品最快达 10 倍以上,同时在 MoE(混合专家)架构、超长上下文、超低延迟等要求严苛、需求复杂的推理场景达到业界领先的产品能力。SiliconCloud 公测上线一个月便获得了爆发式增长,平台用户日均调用数百亿 Token,受到众多 AI 开发者和企业客户的青睐。硅基流动,用 AI Infra 技术降低了 AI 算力的成本,为生成式 AI 开发者与企业在「生产力」层面提供快速助力,实现 AI 的快速普及。硅基智能是一家专注于数字人领域的科技创业公司,在 AI 时代,团队利用自研的炎帝大模型让数字人快速落地各种商业场景。2024 年底,硅基智能推出全球首个具备感知能力的多模态大模型 DUIX ONE,实现了 AI 数字人「看得见、听得见、会思考、高情商、有具身形象」的全感知能力。当 AI 数字人通过观察到用户表情和动作,能更好地捕捉用户情绪波动,给用户带来更真实和更具深度的连接。基于 DUIX ONE 多模态⼤模型技术的核⼼成果,硅基智能创始人成为全球首位将自己硅基化的 CEO,同时硅基智能也面向用户推出了个人数字分身服务,可实现「语⾳识别、情感理解、智能互动、能看会听多模态能⼒」的⾼度融合,为⽤户提供数字化⼈格的构建。某种意义上,该服务展示了「数字永生」的可能性。通过大模型 + 数字人技术,硅基智能已将数字人产品在十多个行业、数十个商业化场景成功落地,加速了数字人业务的进化和市场开拓。作为一款基于讯飞星火4.0 Turbo 技术的创新 AI 智能文档工具,讯飞智文彻底改变了传统 PPT 制作的方式,将办公效率提升到全新的高度。
多种生成方式任你选择;大模型联网搜索,内容丰富、结构清晰、时效为先;AI 文生图输入想法即可生成高清图片,解决配图难题、避免版权问题;在线编辑模组自由定制,操作灵活,一站式的创作流程迅速提升工作效率。讯飞智文作为大模型时代下的数字生产力工具,不仅实现了技术创新,更紧贴用户需求,在职场、教育、商务等多个场景中都能提供实际的帮助,成为个人和团队提升工作效率与创作质量的好帮手。有赞新零售是有赞旗下智能化消费者运营解决方案,致力于通过全域客户精细化运营,帮助品牌零售商深挖客户全生命周期价值,提升老客户复购率。在存量经济时代,全域经营成为吸引消费者的关键。有赞新零售推出了一体化产品组合,打造「连接-触达-转化-忠诚」消费者旅程可复制的运营方法论,全维度整合消费者数据形成精准客户画像,开展自动化精准营销和会员增值营销,帮助商家提升复购率、客单价和客户转化率,实现全生命周期、全场景、全链路业绩提升。另外,借助企业微信助手和导购助手等数字化工具,商家能够高效沉淀私域流量,并实现高效转化,推动新零售模式下的业务增长与品牌价值提升。2024 年,在 AI 的加持下,有赞新零售把导购产品升级为「智能导购」,通过帮助导购发现精准商机,指导导购营销和维护客户,帮助每位导购每个月多做 2500 元业绩,获得利润增量。凭借其全域经营与智能化运营的独特优势,有赞新零售不仅推动了商家的成功转型,也为新零售模式的未来发展奠定基础。在 2024 年,纵苇科技以其在智能制造领域的创新自研和卓越的市场表现,成功引领了生产力的新浪潮。
纵苇科技的成绩,首先体现在其产品的创新性上。智能磁驱系统作为纵苇科技的核心产品,底层算法由纵苇科技全自研开发,是国内柔性制造领域的先锋产品。公司不仅实现了产品的国产化,更在技术上实现了对欧美同类产品的超越。纵苇科技的市场表现同样令人瞩目。在成立后短短三年内,实现了客户数量从 0 到 100+家的飞跃。公司产品已成熟应用于新能源电池、3C 电子、汽车零部件、消费品和医疗等多个行业领域的头部客户,积累了丰富的标杆客户交付案例和全球化的产品交付经验。2024 年,纵苇科技订单规模实现一倍以上增长,客户数量增长 3-4 倍,更为重要的是,纵苇科技切实地帮助客户实现了显著的降本增效。公司通过磁驱输送技术的创新应用,全流程数控实现数据留存,以及将一次性设计的生产线变成模块化复用,可以将设备生产节拍提升 2-10 倍以上,精度达到 5 微米级别,同时为客户节省大量运营维护成本。今年,纵苇科技在香港、新加坡、韩国、越南、泰国、德国等地先后开设研发生产及服务中心,以期实现业务增长并进一步扩大全球影响力。纵苇科技以其在工业自动化领域的创新突破、快速的商业化进程以及对客户降本增效的显著贡献,不仅在技术上实现了国产化,更在全球市场上展现了中国智造的力量,其卓越的表现无疑是对「数字生产力」的最佳诠释。一车多用,随时变形,汽车圈一个近乎科幻的难题,被长安启源 E07 破解了。这辆能在 SUV 和皮卡两种车型之间随意「流动」的产品,给爱车的人带来了极大惊喜。作为一款颇具科幻感的新能源 SUV,通过可移动的后挡风玻璃、可下翻挡板设计,让长安启源 E07 可以在几秒钟内从一台城市 SUV,变形成一台真正能作为生产力的的皮卡车。为了达到「变形金刚」的效果,长安团队需要重构车身结构和比例,精细地设计两段式开启的后挡风玻璃以及下翻式尾门,在确保皮卡形态可用的情况下,仍要保证车辆在造型、耐用和安全性上不妥协。同时,顶配版 440KW 的双电机、空气悬挂+CDC 智能魔毯悬挂的组合,也让车辆在动力、操控和驾乘享受上得到极大提升。「可城可野」、「可享受可拉货」,不再是空谈。设计和结构上的巧思、更重要的,团队在打造一辆用户需要但甚至不太敢想的产品上的义无反顾,是长安启源 E07 获得 2024 年度汽车产品的资格和底气。越野,已经成为中国新能源车的新战场。长城的坦克系列,是中国越野车型的先行者。
2024年长城推出了坦克 500 Hi4-Z,通过动力、布局和结构件上的创新,让新能源越野车的标准再次升级。
为让带「大梁」的硬派越野车能覆盖全部工况,长城 Hi4-Z 通过采用功率分流+三挡前驱模块的高集成创新设计,双电机分布式布置,解决发动机功率分流难题。在结构方面,Hi4-Z 的研发团队成功研发出全球集成度最高的泛越野变速箱及动力电池系统。在硬件布置上, Hi4-Z 搭载前后桥机械差速锁,物理加持实现前后轴各自的绝对同转,拉高泛越野的脱困能力上限。
动力方面,坦克 500 Hi4-Z 搭载 2.0T 发动机和前后大功率驱动电机,三擎联动,可实现百公里加速 4.6 秒;纯电续航里程 WLTC 201 公里,完美做到「一周只充一次电,一次就能开一周」,综合续航近 1100 公里;得益于功率分流 3 挡的前驱模块,发动机可以做到全速域的高效直驱。
搭配高水准的智能座舱系统,以及精心打造的内饰,坦克 500 Hi4-Z 坐实了覆盖越野和城市的「泛越野新能源 SUV」概念,通过技术满足了用户对于旷野的想象,和对舒适、节能与安全的保证。
A0 级纯电小车市场的产品,一直是廉价、凑合的代名词。吉利星愿以优秀的动力配置、充足的内外空间以及高水准的车机,将 A0 级汽车市场标准提高到令人吃惊的程度。作为一款定价 8 万元左右、长度 4 米 1 的纯电小车,吉利星愿并没有因为车型定位而进行减配,反而通过巧思在空间、设计和智能等方方面面,让产品成为媲美 A 级轿车、但同时又能在城市通勤的利器。4 米 4 以下的小型车,往往因为尺寸问题导致产品在空间、动力和配置上差强人意。为了创造足够的驾乘空间,吉利团队将电驱和电机后置,对车辆底盘进行重构,改动小到空调和滤芯的位置也不放过,最终让星愿拥有了媲美 A 级轿车的内部空间、70L 的前备箱和 375L 的后备箱。搭配银河 Flyme Auto 智能座舱、85KW 电机以及后独立悬架,让吉利星愿无论在智能交互还是驾驶操控上,都达到了令人意外的水平。不将就,真正从用户角度和行业痛点解决出发,通过重构底盘和车身结构,打造出超出人们期望的 A0 级纯电小车,这是吉利星愿获得 2024 年度汽车产品的根本原因。进入 2024 年,中国品牌在豪华 SUV 和 MPV 市场站稳脚跟,但轿车尚未突破。浑身黑科技的腾势 Z9GT,是中国品牌冲击豪华轿车市场的又一次尝试。
腾势成立于 2010 年,定位高端电动汽车制造商,最开始股东为比亚迪和戴姆勒(各持 50%),目前已成为比亚迪全资子公司。Z9GT 是腾势「Z」系列的首款车型,采用轿跑 GT 的设计风格,定位为「D 级智能豪华旗舰 GT」,并全球首搭比亚迪自研的「易三方」整车智能控制技术平台。多年的持续研发,使比亚迪积累了丰富的技术储备,腾势 Z9GT 首搭的「易三方」技术平台便是最新成果之一。易三方全球首创三电机独立驱动与后轮双电机独立转向。其中,三电机独立驱动系统提供最大功率接近 1000 匹马力,使腾势 Z9GT 能够以 3 秒级完成百公里加速。同时,后双电机的扭矩主动控制能力与后轮双电机独立转向系统相结合,通过融合控制可以实现如圆规掉头、低附路面增稳系统和智能蟹行等多项智能功能。不仅如此,腾势 Z9GT 的最小转弯半径仅为 4.62 米,尽管车身长度近 5.2 米,但其转向灵活性甚至超过了小型 A0 级车。腾势 Z9GT 的发布,不仅在产品创新层面具有突破性意义,更为中国车企的品牌向上跃迁提供了重要启示。这一车型的成功值得获得年度汽车产品的认可与赞誉。小鹏 MONA M03 是 2024 年上市的一款新车。在 10-15 万元价格区间,它首次搭载了多项越级的智能化功能,重新定义了 A 级智能轿车的标准。同时,上市后首月交付即破万,成为本年度竞争激烈的智能电动车市场中,通过技术下放带动市场销量的典型代表。
小鹏 MONA M03 用多指飞屏、四音区独立语音控制等功能,取代了传统的车内交互形式,带来更加便捷和智能的座舱体验。在智能驾驶层面,标准版即搭载同级唯一的全场景智能泊车系统,让停车变得轻松高效;顶配版更是支持不限城市、不限路线的 XNGP 高阶智能辅助驾驶,首次将 L2+级别高阶智驾下放至 A 级车型。早在 2022 年,小鹏就和阿里云在自动驾驶算力上合作,将自动驾驶模型训练效率提升 600 倍。2024 年,小鹏全面拥抱基于 AI 的端到端智驾开发范式,发布了全新一代「AI 鹰眼视觉方案」,用视觉感知模块实现了和激光雷达同等的体验,实现技术降本。同时,自研芯片「小鹏图灵」成功流片,也为下一步在智驾安全、车端大模型等提供了更强的计算储备。这一年,中国新能源车市场渗透率来到 50%,智能化竞争将成为未来 10 年的角力重点。小鹏 MONA M03 是其中一个通过技术降本,从而将智能化下放并获得市场认可的成功创新案例。DJI Neo 是大疆在空拍机领域为解决纯小白新手「畏难情绪」和「选择困难」两大难题而推出的性价比之作。作为一款性能强劲的掌上无人机,DJI Neo 引发了行业的广泛关注。DJI Neo 仅重 135g,主打零门槛掌上起降,无需遥控器也可轻松完成拍摄;其搭载了 AI 智能算法,能跟随取景框中的对象,带来智能跟拍玩法。同时,DJI Neo 支持多种操控方式,既可以无遥控飞行拍摄,也可像普通航拍机一样搭配遥控器使用;也可搭配穿越摇杆、飞行眼镜,感受第一视角飞行体验的魅力。DJI Neo 的定价显著低于同级别专业无人机,延续了大疆在硬件成本控制上的行业优势。这让更多用户能轻松享受到无人机技术给生活带来的乐趣。目前,手持小型无人机领域的两大挑战,在于复杂环境下的飞控稳定性以及价格如何打动更多用户。DJI Neo 对这两个痛点提供了清晰的答案。DJI Neo 体现了大疆深耕无人机技术的同时对用户需求的深刻洞察,同时也延续了其通过技术创新助力创作自由的愿景。在无人机的技术蓝海,通过 DJI Neo,我们看到了 Vlog 拍摄的更多可能。在折叠屏技术日趋成熟的背景下,「如何做好一部让人眼前一亮的手机」却成为了新时代的难题,而华为 Mate XT 非凡大师无疑是中国手机品牌在 2024 年最有代表性的回答。通过在大屏态下对易用性的深度打磨,同时提升折叠状态下的便捷体验,使得华为 Mate XT 非凡大师的整体体验更加全面。得益于这种设计思路,华为 Mate XT 非凡大师采用了业内领先的铰链技术,使屏幕观感自然且耐用。无论在展开或折叠状态下,用户都可以无缝切换使用各种应用,打破了移动终端的使用边界,为日常生活和办公场景提供了全新的操作体验。借助华为 Mate XT 非凡大师的多任务处理能力,让用户可以同时运行多个应用,高效处理各种信息需求。此外,华为还充分利用折叠屏的特性,提供了更符合用户直觉的交互体验。2024 年,折叠屏手机已然成为未来智能设备发展的重要趋势。华为 Mate XT 非凡大师在保持硬件创新的基础上,成功将移动设备形态推向了一个新的高度,为未来多样化的智能设备形态铺平了道路。界环 AI 音频眼镜是一款将眼镜、耳机、AI 大模型等结合在一起的全新形态的智能音频硬件。不同于其他同品类 AI 硬件的探索,界环 AI 音频眼镜把「先好做一副眼镜」作为了最重要的产品优先级。团队重点对产品在轻量化、长续航、时尚感等多个方面进行了打磨,佩戴体验感、产品售价均接近传统眼镜。得益于上述设计原则,产品的日均佩戴时长超过 7.2 小时,媲美智能手机的使用时间,加上独特的佩戴位置,让眼镜可以通过音频形式进行更智能的交互,为 AI 大模型接入硬件提供了先决条件和应用场景。界环推出的 AI 通知播报功能,通过调取手机中相关应用数据,通过大模型进行筛选、总结、归纳,让海量通知既可以做到「长短短说、废话少说」,又能依托音频形式高效、实时传递,在过往基于视觉的交互上,开拓了新的以语音互动为主的 VUI 全新交互范式。同时,界环不仅可以做到线上配镜开箱即用的服务,也在线下进驻 48 城 262 家门店,为这款智能硬件提供了堪比传统眼镜的配镜服务,大幅降低了购买门槛。2024 年,「AI+眼镜」成为新形态 AI 硬件探索中的一个共识方向。界环 AI 音频眼镜在做好用户服务的基础上,将 AI 大模型的能力成功接入可穿戴设备,并为未来提供了更多可能。2024 年, AI 手机迅速成为硬件主流赛道,OPPO Find X8 Pro 是其中最引人瞩目的产品之一。在 Find X8 系列上,OPPO 用自己的产品哲学,向行业公布了「打造一台好用的 AI 手机」的配方:支持端侧 AI 能力的硬件 + 收纳完善 AI 能力的系统生态。作为 AI 能力的基座,ColorOS 15 为各种 AI 提供了协同的智能调度能力,确保 AI 功能高效流畅运行;同时根据用户使用习惯自我学习,自动提供诸如 AI 一键问屏、 AI 千里长焦等个性化的操作体验。更重要的是,Find X8 Pro 通过 ColorOS 15 与硬件深度协同,实现了优秀的软硬一体化 AI 体验。比如基于 AI 的智慧屏幕显示与隐私保护功能,不仅实用且贴合用户使用习惯。Find X8 Pro 之所以在市场中独树一帜,不仅因为其完善的 AI 能力,更因为 OPPO 在产品打磨与用户体验上的坚持,充分展现了对智能手机未来发展的深刻洞察,是一款真正「超越用户期待」的 AI 手机。以「骨气双单元」为底层技术,韶音 OpenRun Pro 2 引领了运动耳机的新风潮。作为 2024 年运动音频设备领域的突出产品,韶音 OpenRun Pro 2 体现了运动耳机设计与技术创新的结合。这不仅是一款耳机,更是一种倡导运动与健康生活方式的科技实践。OpenRun Pro 2 的亮点在于对开放式声学技术的深度优化。它采用韶音自研的 DualPitch 骨气双单元技术,通过数字分频技术发声,采用骨传导单元发出中高频声音,定向声场低音单元发出气传导低频声音,突破了传统运动耳机音质的局限,为用户带来更加清晰、饱满且富有层次感的听感体验。延续开放式设计的安全优势,用户在跑步、骑行时依然能感知周围环境,从容应对复杂场景。为了满足运动人群的需求,耳机采用了符合人体工学的设计,极致轻量化及贴合性让长时间佩戴几乎无负担。在产品研发中,「音质细节」「运动体验」成为了 OpenRun Pro 2 的两大关键词。开发团队捕捉到用户的核心需求,如更优质音效、更长续航,并快速通过用户反馈改进产品细节。尤其在续航方面,OpenRun Pro 2 支持长达 12 小时的持续播放,结合快充功能,进一步解决了高频使用者的电量焦虑。此外,OpenRun Pro 2 支持 IP55 级防护,不论是日常通勤还是专业训练,它都能成为可靠的运动伙伴,在极限运动环境下也表现出色。作为 2024 运动耳机领域的重要新品,OpenRun Pro 2 重新定义了运动耳机的边界:它不仅满足了用户对音质和佩戴体验的极致追求,还进一步探索了科技助力生活方式转变的可能性,成为运动科技产品领域的标杆之作。进入 2024 年,智能驾驶的竞争焦点已从拼算力、拼算法转向全场景落地,地平线是首个推出软硬一体智驾方案的公司。Horizon SuperDrive(简称 HSD)是地平线面向下一代全场景高阶智驾系统打造的产品。依托端到端的世界模型、数据驱动的交互博弈以及专为下一代高阶智驾而生的征程 6,HSD 不止拥有高度拟人的优雅从容姿态、超强通行效率,更能提供全国一致的极致智驾体验,让用户享受体验无断点、模式无切换、全场景无差别的安全美好出行。这背后主要得益于地平线原生的软硬结合优势,以及特有的「铁人三项」(技术+工程+产品)系统能力。早在 2016 年,地平线便提出了自动驾驶端到端演进理念,并持续取得技术创新与突破:2022 年推出感知端到端算法 Sparse4D;2023 年地平线学者提出 UniAD 端到端大模型,并荣获 CVPR 2023 最佳论文奖。SuperDrive 依托地平线软硬结合的技术优势,以及强大的系统工程能力,帮助车企实现更高效的高阶智驾规模化量产。地平线 SuperDrive 方案,通过软硬件的技术突破,实现了高效的全栈计算,为智驾的规模化落地提供了高度适配的解决方案,值得年度技术突破奖项的认可与赞赏。2024 年 9 月 11 日,蓝箭航天在酒泉卫星发射中心成功完成了朱雀三号 VTVL-1 试验箭的 10 公里级垂直起降返回飞行试验。这是国内首次实现火箭发动机空中二次起动、跨音速大动压环境下「栅格舵-冷气姿控-发动机」联合制导控制,以及高空风实时风修技术验证,使得中国商业航天在可重复使用运载火箭技术上取得了重大突破。蓝箭航天空间科技股份有限公司(蓝箭航天)是一家 2015 年成立的航天运输系统创建及运营企业,致力于构建以中大型液氧甲烷运载火箭为中心的「研发、制造、试验、发射」全产业链条,打造航天领域的科技综合体,为全球市场提供高性价比、高可靠性的航天运输服务。朱雀三号 VTVL-1 试验箭搭载天鹊-12A 液氧甲烷发动机,具备强大的起飞推力和多次点火能力。此次飞行中,火箭在历经发动机关机、无动力滑行后,成功空中二次起动,通过在线制导控制算法,调节发动机推力和飞行状态,实现了精准软着陆。此次试验验证了四项可重复使用火箭核心技术:火箭发动机二次起动、「栅格舵-冷气姿控-发动机」联合制导控制、不锈钢箭体结构的复用性能及射前实时风修正技术。这是中国民营火箭公司在可回收火箭领域的突破性进展。群核科技是一家专注于 3D 软件和空间数据的公司,旗下有 3D 云设计平台酷家乐、群核空间智能平台等多款产品。群核科技构建了一套基于 GPU 高性能计算的物理世界模拟器,并已运用在室内空间场景下的实时渲染、工业生产制造,以及虚拟物理世界训练等场景中。基于其沉淀的空间认知能力和物理正确的数据,群核科技实现了多项技术突破。其自主研发的百亿级参数模型—多模态 CAD 大模型,能够实现物理正确的 3D 结构化数据的识别和生成,对物理世界产生的或存在的设计数据进行翻译、兼容和数据流转。相比语言大模型对空间描述的模糊与不确定性,CAD 大模型能够实现对空间更准确和结构化的表述,这是 AI 在物理世界产生价值的基础。在数据层面,群核科技推出了面向空间智能技术训练需求的技术产品:群核空间智能平台。该平台拥有全球最大的室内场景认知深度学习数据集,能为 AIGC、具身智能、AR/VR 等企业开放物理正确的 3D 空间数据资产,以及空间认知解决方案。团队还携手英特尔、慕尼黑工业大学推出全球首个高视觉与物理逼真度环境数据合成与训练仿真平台 SPEAR SIM。在「空间智能」渐热的当下,群核利用在 3D 数据方面的技术积累,正在加速「AI 进入物理世界」的进程。自 Qwen 系列模型开源以来,不论在模型性能还是生态影响力,都创造了中国开源大模型的历史。截至 2024 年 9 月底,全球开源社区基于 Qwen 系列二次开发的衍生模型数量突破 7.43 万,超越 Llama 系列衍生模型的 7.28 万。这表明 Qwen 系列开源模型成为最受开发者欢迎的模型群,在实际生产环境中得到了广泛应用与部署。受开发者欢迎背后,Qwen 系列开源模型在训练数据、架构等多方面技术上实现了突破。在预训练方面,Qwen2.5 使用了超过 18T tokens 的大规模文本数据进行预训练,数据类型多覆盖领域广,并且使用了精细的指令微调以及在线强化学习等后训练方法,更好地提升能力和对齐人类偏好。得益于技术不断迭代,最新系列 Qwen-2.5 在编码和数学方面的知识显著增加,能力也大大提高。其模型能够丝滑响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据(如表格)、生成结构化输出(尤其是 JSON)等方面,Qwen2.5 都进步明显。同时,在长上下文最多支持 128K tokens,最多可生成 8K tokens。坚持技术创新,自 2023 年 8 月开源以来,Qwen 系列模型在全球开源社区生态中已形成重要影响力。作为 3D 打印药物领域的代表企业,三迭纪以其独创的熔融挤出沉积(Melt Extrusion Deposition, MED®)3D 打印药物工艺,在技术创新和行业应用中的卓越表现,成为制药行业底层技术变革的重要推动者。三迭纪立足于专有的 3D 打印药物技术,实现药品的数字化开发与连续化生产,改变药物的递送、开发和生产方式。凭借创新的 MED®3D 打印药物工艺,三迭纪获得 TCT Awards 最佳医疗应用奖,是首个荣获该奖项的中国企业。在技术创新以外,三迭纪与全球药企合作兑现了巨大的商业价值。2024 年 7 月,三迭纪与免疫治疗公司 BioNTech 达成了超过 12 亿美元的研究合作与平台技术许可协议,通过 3D 打印技术开发口服 RNA 药物。通过持续的技术创新和产品开发,三迭纪在全球 3D 打印药物领域产品数量、专利数量和产能方面名列前茅,奠定了行业标杆地位。无界方舟致力于多模态大模型技术创新与应用,并依托此技术推出了全球首款基础智能体 Arki One。利用跨模态融合与推理技术,Arki One 实现了超低延迟的音视频互动(400 毫秒),支持随时通过语音打断,具备完善的情绪系统,支持 21 种多语言互动。团队还创新性地引入了神经辐射场 Nerf 技术,能够在音频的驱动下高效地渲染出逼真的人物动画,并实现百毫秒级的虚拟数字人动作驱动。Arki One 独创终身记忆系统,通过结构化知识图谱和参数化记忆模型,可在复杂环境中不断学习和积累知识,从而实现对每位用户的个性化 AI 定制。Arki One 还能通过用户的交互、规划、行动和反馈进行反思,逐渐构建起对用户及世界的深入认知。此外,凭借团队自主研发的 Action Q 技术,Arki One 能够通过自我监督的强化学习,在多变的环境中迅速掌握新技能,显著提升了 AI 的推理和执行能力。无论是在虚拟世界还是物理世界的任务中,Arki One 都能将 AI 转化为真正的生产力。对于高度复杂的任务,Arki One 能够创建一群虚拟的 AI 智能体专家组成「AI 团队」,通过智能体之间的协作来解决难题。通过技术的不断进步,无界方舟的 Arki One 为用户带来了高度智能化和个性化的体验,极大地拓展了个人与企业用户的智能体验领域。ReelShort 是枫叶互动(Crazy Maple Studio)2022 年面向海外推出的短剧平台,也是首家将国内一分钟短剧落地北美市场并验证市场需求的平台。ReelShort 有着其独特的内容生产策略和竞争优势:成立之初就选择在北美市场从零开始搭建产业链,并积极推行内容本地化生产;同时,Crazy Maple Studio 的产品矩阵——Chapters、Kiss 以及 ReelShort,分别覆盖网游、网文、短剧,从产业链侧为 ReelShort 的商业化打下了坚实的基础。
ReelShort 的爆款方法论聚焦于通过本土化内容生产和精准投流,实现对欧美市场的深度覆盖。首先,在内容制作方面,ReelShort 优先推出符合欧美本土文化的自制短剧,以强大的产能应对市场需求;同时,ReelShort 通过与国内版权方合作获取剧本,结合欧美市场的价值观,借助美国本土编剧的改编能力,精准地重塑故事,提升本土化亲和力。通过大量生产海外自制剧,ReelShort 有效应对了内容供给瓶颈,形成了明显的差异化优势。与竞争对手相比,ReelShort 更具效率与速度,能够快速满足用户多样化的内容需求。到今年 9 月,ReelShort 已实现全球双端内购收入约 1.42 亿美元,是 2023 年全年收入(2888 万美元)的 4.92 倍,增长势头强劲。小冰公司是 AI 数字人领域最全面的技术公司之一,在相关的数字人、语音、大模型三大技术栈均有全面、领先的技术覆盖。其中,数字人技术覆盖从「1:1 复刻的超高精度定制」到「最低门槛、无需训练的 0 样本驱动」;语音技术覆盖「可实现完美声音复刻的精品 TTS」、「3 分钟高效复刻的小样本 TTS」,以及「无需训练、十秒可完成声音克隆的 TTS 大模型」。此外,小冰还有自研的千亿、百亿级大模型和独创的情感交互大模型,可满足不同场景的人机交互部署。
除了技术栈,小冰针对不同的使用场景,开发了一系列针对 B 端市场的 AI 数字员工产品。包括功能性、可用性居市场第一的数字员工平台 & App;数字人直播平台;支持用户自主构建 agent 的大模型平台;针对政企场景的数字人名片、数字人交互大屏等。在过去「小样本」数字人产品的基础上,今年小冰在数字人领域实现了进一步的技术突破,推出首个「零样本」数字人产品。拍摄 40 秒素材,等待 10 分钟可以看到数字人成品。「零样本」数字人低门槛的特性,帮助广大的中国小微企业主可以低成本开展经营活动,应用包括导购、分销、客服、咨询、培训等场景,比传统「硬件+演员」节省约 90% 的投入。今年以来,小冰在数字人领域的业务拓展快速增长。目前小冰框架已孵化出数以千万计的 AI 数字人,To B 注册企业用户数超过 10 万。小红书的社区和电商正在以令人惊叹的默契和速度逐渐融合在一起。
月活用户已达 3 亿的小红书平台,以其独有的去中心化流量分发机制,和以笔记为中心的独特社区文化,让人与人之间真实的交流、分享,正在重塑用户与商家、用户与用户之间的关系,革新用户的消费体验与商家的商业模式。不论社区还是电商,小红书奉行以「人」为核心的理念,让用户的真实需求在社区自由生长。平台基于用户需求,建立起以买手和主理人为特色的电商角色,也在不断打通社区与电商之间的通路,让海内外一批又一批品牌商家在小红书上开始经营,令小红书电商从传统电商的「多、快、好、省」模式中突破出来,向「个性化」生长。同时促进了平台商品的多样化供给,为消费者提供更多选择,也为个体创业者和小品牌创造新的机会。此外,小红书的外溢价值还在不断增加:过去两年间,露营、户外、Citywalk、钓鱼等曾经的小众生活化内容在小红书线上线下掀起一波波热潮;数据显示,截至 2023 年底,近 70% 的月活用户使用搜索,「搜索」正在成为小红书的一个新标签;小红书的用户基础以及社区笔记的共创效果,正在成为国内个人开发者做产品宣发与导流的天然场域。总而言之,小红书的成功,在于其深刻理解并满足用户的个性化需求,使个体的声音借助平台的力量得以共鸣,实现个性需求的商业规模化,从而在中国互联网商业中建立了独特的影响力。过去两年,中国播客内容迎来大爆发,小宇宙 App 作为最大的中文播客产品起了关键推动作用。据官方数据,2023 年小宇宙新增了 32610 个播客节目、30 多万个单集,是增长最快的内容平台之一。
2020 年推出时,当时市面上没有专门的中文播客 App,小宇宙弥补了中文播客产品的空白。在产品设计上,小宇宙做了多项开创性的尝试,包括极简主页、播客评论区、点赞进度条、评论区时间戳等等,给播客听众带来了更好的收听体验、推动了播客在国内的用户渗透。此外,小宇宙的推荐机制、播客广场功能等,也给了很多新播客被看到的机会,保持了良好的创作者生态。今年,借助 AI,小宇宙又推出了「问问小宇宙」播客 AI 检索服务。用户可以在搜索框输入自己感兴趣的关键词,页面会弹出相关播客,也会生成相应的 AI 回答。通过不断改进产品体验和内容生态运营,小宇宙吸引了越来越多人听播客,而这又吸引了越来越多人做播客,从而形成正循环。这背后,源于团队对播客本身的热爱、专注,这让他们更早看到了播客被低估的价值:陪伴感、真实感、信任感,依据自己对这件事的正确理解、以及产品的一步步改进,陪伴和推动了中国播客产业的繁荣。在小宇宙上,人们通过音频见到更大的世界、获得认知的提升和情感的陪伴,人们也通过音频自我表达、打造个人 IP、获得自己的影响力。商业之外,小宇宙创造了更广的价值。作为全球第一大云厂商,亚马逊云科技在大模型时代主动引领云的变革,积极布局 AI 算力层、中间层和应用层,延展了云计算的价值厚度。2024 年,亚马逊云科技凭借强大的技术创新能力、全面的服务生态以及稳定可靠的基础设施,助力客户在生成式 AI 时代,完成从提供软件工具,到直接交付生产力的跃迁。在算力层面,亚马逊云科技通过自研芯片如 Trainium 和 Inferentia,为客户提供了更高效、更经济的训练和推理计算资源。在应用层,Amazon Q 通过提供智能化和定制化的解决方案,帮助企业在数据分析、客户服务和运营优化等方面实现了显著的提升。在中间层,亚马逊云科技延展了 PaaS 能力,推出了 Amazon Bedrock 服务。其通过标准化的流程和工具,帮助企业快速定制模型、构建和部署生成式 AI 应用。Amazon Bedrock 通过集成多种 AI 模型和工具,简化了 AI 应用的开发流程,使企业能够更专注于业务创新,而无需过多担心底层技术的复杂性,通过 Amazon Bedrock 标准化的服务就可以定制化模型、定制化 AI 应用。具体来说,Amazon Bedrock 为客户提供来自 6 个领先模型供应商的最受欢迎的 24 个基础模型,同时提供微调、知识库、代理、模型评估等各种丰富的功能,满足客户在不同场景下的不同需求。Amazon Bedrock 通过提供强大的模型支持、易用的开发环境和灵活的基础设施,极大地降低了生成式 AI 应用的开发难度和成本,帮助企业更快地实现 AI 驱动的创新。成为独立开发者的 8 年,Baye 的探索体现了:独立开发不仅是一种商业模式,更是一种生活方式。多年来,他不断打磨自己在产品设计、产品开发、增长运营的全栈能力和全面视角,并利用不断变化的技术做出多款高完成度的产品,这体现在「熊猫吃短信」、「OpenCat」等多款产品中。在这个过程中,独立开发者 Baye 也实现了个人自由与秩序之间的平衡。以「OpenCat」为例,它是一个 All-in-One 的大模型助手客户端,用户可以一站式地选择接入不同模型,生成图片、与 AI 进行多模态对话、使用 AI 键盘写作助手等。在 Baye 看来,「OpenCat」是常见的做工具客户端的逻辑,最关键的是「快」,第一时间实现产品,再围绕用户体验打磨。他在 OpenAI API 推出的第二天,就做出了 OpenCat 的产品原型并在苹果应用商店通过审核上架。同时,他在第一时间构思好产品功能实现地图,在社交平台公开建立(Build in Public),比如让用户投票最想要哪一个功能,这种用户驱动的产品迭代思路也让「OpenCat」的产品高效迭代。当前,OpenCat 已累计有数十万用户,其中有不少比例的付费用户。今年,随着大模型工具领域的产品生态发生变化,Baye 推出了新产品——Miley AI,并快速迭代产品。作为一款私人秘书的定位,Miley AI 集齐了「独立开发者三件套」赛道,利用大模型把 To Do、记账、笔记的需求于一体,让 AI 离用户更近、成为更懂用户的个人秘书,帮用户安排日程、记账、了解健康状况等。不断尝试、快速验证,Baye 提供了独立开发者以用户驱动产品的样本。在感知到分段双语对照的翻译需求后,开发者 Owen 以一己之力迅速做出了「沉浸式翻译」浏览器插件。该插件一经推出即迅速增长,仅 5 个月后用户量便自然增长至 40 万。自那以来,分段双语对照的翻译模式也被广泛采纳,成为行业最佳实践。沉浸式翻译出圈背后,体现了 Owen 作为开发者的创新精神和产品审美。在双语翻译的既有需求下,Owen 革新了全文翻译的传统方式,以分段对照的新思路来解决网页翻译需求,为用户消除了分屏幕对照浏览的繁琐流程,大幅降低了阅读外语网页的障碍,也成为最实用的创新产品之一。同时,沉浸式翻译完成度高、产品简洁易用,这在沉浸式翻译团队的后续产品迭代中得以延续。今年,该团队顺着用户反馈,不断完善边缘 case,并扩大了用户场景。其相继推出了 PDF 双语翻译、Word 双语翻译、e-Pub 双语翻译、视频双语翻译、图片翻译、漫画翻译等多项功能。在解决方案上,团队通过引入上下文识别、提取专有名字和关键词的核心步骤,进一步提高了翻译质量和对不同文本格式的兼容性。当前,无论是对免费用户还是付费用户,沉浸式翻译作为工具,都带来了丝滑流畅的用户体验。在升级迭代中,该工具始终从用户需求出发,没有掉入加功能和加 AI 的陷阱,体现了兼具创新性和启发性的产品开发思路。作为国内最早一批接触 AI 绘图的开发者,秋风基于 Stable Diffusion 做了一款 AI 绘图工具 MewXAI。在敏锐把握用户需求后,MewXAI 通过微调出古风、流光女孩等风格,迅速赢得用户的喜爱,最高时 MewXAI 一个月涌入 20 万新用户,小红书平台自发产生数4000多万带 MewXAI 标签的贴子。随着 AI 绘图的竞争格局发生变化,先后涌现出不少像妙鸭、Remini 等现象级产品,秋风迅速思考自己的生态位并转型。他先后尝试了 AI 二维码、AI 艺术字、视频生成模型等服务,最终瞄向了出海赛道下,AI 视频编辑的场景。2024 年 2 月,秋风做出了 GoEnhanceAI。作为一款一站式 AI 视频编辑平台,可以将真人视频转换为动画、还有文/图生视频,视频/图像换脸等,当前已有百万的月访问量,以及可观的盈利。辞职成为独立开发者的一年半,秋风不断获得正反馈的成绩体现了其作为超级开发者的判断力、行动力和适应力。除了懂开发,他在产品开发的过程中也体现了超级开发者的全栈能力:建立社群、运营推广、Learn in Public、Build in Public、商业化,这些让他在开发产品的过程中不断接近 PMF(产品市场匹配)。始于兴趣驱动,在独立开发者甚至是创业者中建立自己的生态位,秋风的探索体现了超级开发者创业的敏捷与能量,不需要融资输血,以用户、场景为中心,快速适应新变化的迭代,小组织也可以有大能量。作为独立开发者,赵纯想对「如何利用 AI 时代的红利」做产品有独特的思考和实践。他开发的「胃之书」「陌生人闹钟」等多款 App 产品,有着强烈的个人特色:通过游戏化、动漫化的情节设计,富有特色的用户界面,传递出独特的审美和品味,赢得了用户和口碑。举例来说,胃之书 App 是一款由多模态大语言模型驱动的食物洞察和记录应用。上线 72 小时,用户注册量即突破 10000。随即成为苹果应用商店美食佳饮类畅销榜前三。陌生人闹钟 App,每天会由随机陌生人的早安播报,并由多模态大语言模型实现语音的审核和分发,为用户提供个性化的唤醒体验。在产品设计上,选择了 1999 年 Apple MacOS 9 的设计语言风格。在产品开发过程中,赵纯想在小红书社区 Build in Public,以用户需求驱动产品迭代,把产品收敛为有特定情绪价值的边界。对于一个人连续不断地开发 App 这件事,他认为:自己开发的产品是手工制品,不是互联网行业。他不去做既有的衣食住行刚需场景,而是追求特定场景下的情绪机制,通过产品设计、动画效果、情绪把控,提供情绪价值。在这个过程中,AI 的作用是让一个人做独立开发这件事算得过账,并「导演」出印着独特烙印的「影片」。他的实践为独立开发者在 AI 时代做产品带来了一种有价值的探索。作为一名 15 岁的少年,张铭瀚开发的产品 Chat Nio 在今年被收购。在他看来:去掉年龄标签,他目前的开发成果并不亮眼,在产品设计、代码架构、商业化设计等多方面都有足够的优化空间。但这也是他的独树一帜:极致的兴趣驱动、超强的动手能力,成就了少年开发者张铭瀚。2023 年初,为了让身边人可以在 QQ 里用上 ChatGPT,张铭瀚在 Github 上发现了「chatgpt-mirai-qq-bot」项目,加入项目发起人「lss233」开源共建。通过这一项目,用户可以在 QQ 里拉一个 AI 聊天机器人聊天、一对多发消息、甚至使用 RAG 定向搜索的功能等。在加入共建的过程中,张铭瀚顺着表层功能得到了一系列用户需求,比如接 API 付费、部署在云端等,这便是 Chat Nio 产品的来源。从共建「chatgpt-mirai-qq-bot」项目中快速习得的开发经验和体感,以及衍生出来的需求,张铭瀚做了开源项目 Chat Nio。这是一个从 C 端聊天机器人到底层模型、云计算等的全栈解决方案。其支持接入各大模型,并支持对话分享、自定义预设、云端同步、弹性计费和订阅计划模式、图片解析、联网搜索、模型缓存等功能。Chat Nio 最高时月活 10 万+,4 个人的团队实现了 20 万 MRR 和 5 万元单月净利润。超强动手能力背后,是张铭瀚对编程的兴趣与热爱。小学以来,他自学了 Turbo Pascal、C 语言、Python、VBScript 等多种主流编程语言,也在校园比赛和开源项目中不断实践,在这个过程中,开发产品始终是他最想做的事。