DeepSeek再放大招,但万万没想到……

时事   2025-01-28 11:40   广东  

 直新闻是深圳卫视全媒体新闻品牌

由《直播港澳台》团队出品


更多分析请下载直新闻APP


参与评论请在新浪微博@直新闻



1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社区信息显示,Janus-Pro是去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。


两代模型生成的图像对比。


相比此前的Janus,Janus-Pro实现了三大改进:优化训练策略,扩展训练数据,扩展更大的模型尺寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。


据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。


在引爆全球科技圈后,直新闻也尝试提问DeepSeek,请它总结自身火爆出圈的原因。它的回答是:


关于“DeepSeek为什么那么火?”,DeepSeek如是说。


但与此同时,1月28日,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。



来源丨综合

排版丨季靳玮
编辑丨郭永佶
审校丨曾子瑾
监制丨王云霞
更多精彩内容 搜索微博“直新闻


直新闻
直新闻,直抵人心、直通世界。深圳卫视《直播港澳台》栏目订阅号。
 最新文章