就在东大人工智能企业深度求索推出的DeepSeek R1大模型在全球科技界掀起滔天巨浪之时,白宫内部已是风声鹤唳,川普总统更是接连收到三个足以让他夜不能寐的噩耗。美媒纷纷惊呼,美国七大高科技龙头企业,这次恐怕是麻烦大了!
DeepSeek R1大模型的横空出世,不仅彻底改写了人工智能领域的游戏规则,更是对美方长期以来鼓吹的高成本、高性能芯片加算力中心的大模型训练模式发起了猛烈冲击。这难道不是一个天大的笑话吗?一个仅仅花费了557万美元训练出来的模型,竟然能与美国企业耗资几十亿美元打造的大模型相媲美,这怎能不让白宫坐立不安?
负责白宫人工智能领域的专业顾问大卫·萨克斯,在福克斯新闻上对着镜头,一脸忧虑地谈论着DeepSeek-R1模型。他试图从技术的角度解释这一现象,声称DeepSeek-R1模型是通过“模型蒸馏”技术对OpenAI的模型进行了优化。但这样的解释,在事实面前显得如此苍白无力。难道美国科技界真的无法接受一个事实:那就是东大人工智能企业,凭借算法和训练手段上的优化,就能取得如此惊人的成就吗?
美方人工智能产业界的反应更是让人啼笑皆非。他们纷纷质疑DeepSeek-R1模型的训练过程,认为这背后一定有什么不可告人的秘密。难道他们真的无法相信,一个几百人的团队,仅凭几百张低效能计算卡,就能训练出如此强大的模型吗?这种骨子里的傲慢,让他们失去了对事实的客观判断,也让他们在面对东大人工智能的崛起时,显得如此手足无措。
然而,东大人工智能企业对美方带来的“认知震撼”还远未结束!彭博社的一则报道,再次让白宫震惊不已。DeepSeek-R1-Distill等多个小型模型的上线,以及华为云系统正在使用东大昇腾处理器适配DeepSeek-R1模型的消息,无疑为深度求索公司的未来发展奠定了坚实基础。这意味着,即便美方对深度求索公司进行“算力限制”,也无法阻挡DeepSeek模型的崛起。而昇腾处理器的出现,更是彻底打破了英伟达在算力中心构件上的技术垄断,这怎能不让美国科技界感到恐慌?
紧接着,深度求索公司又放出了一个大招——Janus-Pro-7B多模态模型的发布。这款模型不仅支持图像输入模式,还能进行文生图的快速生成,其性能瞬间大败了OpenAI的DALL-E 3模型和Stable Diffusion大模型。更令人震惊的是,这款模型竟然可以在普通电脑上运行,而且还是完全开源的!这难道不是一个颠覆性的创新吗?分析人士指出,深度求索公司可能还有一款文生视频的高性能大模型正在开发或已经开发完毕,这无疑将再次引发全球高级生成式人工智能领域的“海啸”。
而阿里云人工智能团队(通义)发布的Qwen2.5-VL视觉理解模型,更是让美国科技界感到了前所未有的压力。这款多模态开源模型在文字、图像、视频处理方面表现出色,一举拿下了13个相关测试项目的第一名。其总体性能和各项关键指数与GPT4o和Claude3.5不分伯仲,甚至在个别领域还略微领先。这难道不是一个奇迹吗?
面对东大人工智能的迅猛发展,白宫这次是彻底坐不住了。当地时间1月28日,美方突然宣布对东大大模型和人工智能企业进行所谓的“安全调查”。美媒认为,这是由于担忧美国七大高科技龙头企业可能遭受重创而进行的自保行为。但这种做法真的能解决问题吗?难道他们不知道,真正的竞争是在技术、在创新、在人才吗?