点击上方蓝字,再点服务,点击听广播!
1 月28日凌晨,国内火爆的AI大模型公司DeepSeek称遭受大规模恶意攻击!
分析称,DeepSeek推出的低成本人工智能模型可能会使推动牛市的科技估值难以为继。
Murphy & Sylvest财富管理公司的保罗·诺尔特(Paul Nolte)表示,“我们不知道这是不是股票市场的‘斯普特尼克时刻’,但这肯定是一个警钟,提醒我们并不是市场上唯一的玩家,将极高的估值赋予这些股票,认为它们垄断了市场,这是一个巨大的错误,现在正在被重新评估。”
对于Miller Tabak的马特·马利(Matt Maley)来说,DeepSeek最新的人工智能模型更具成本效益,并且运行在技术要求较低的芯片上,这引发了对人工智能热潮能带来多大收益的严重质疑。
DeepSeek发布新款人工智能模型
当地时间1月27日, DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。
JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。
北京时间1月28日凌晨,就在美国科技股暴跌之际,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态人工智能模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。
页面显示,Janus-Pro是一种新颖的自回归框架,统一了多模态的理解与生成。它通过将视觉编码分离为独立的路径,解决了以往方法的局限性,同时仍然采用单一的统一Transformer架构进行处理。视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还提升了框架的灵活性。
Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性使Janus-Pro成为下一代统一多模态模型的有力候选者。
Janus-Pro是一款统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。Janus-Pro构建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。
在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入。在图像生成方面,Janus-Pro使用了来源于此的分词器(tokenizer),其下采样率为16。
编审:林伟青、李红忠、林勤生
新闻超广角
粤听精选
请到广东过大年:董宇辉游广东:每天都有仪式感!
请到广东过大年:出文旅单曲,摆创意花市,这个春节深圳有多卷?
请到广东过大年:广东给全球游客的一封邀请函
点击阅读原文收看