英特尔Gaudi 2D AI加速器针对DeepSeek Janus Pro模型进行优化

科技   2025-02-02 12:02   广东  

近日,DeepSeek发布JanusPro模型,其超强性能和高精度引起业界关注。英特尔Gaudi 2D AI加速器现已针对该模型进行优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化,有效满足行业应用对于推理算力的需求,为AI应用的落地和规模化发展提供强有力的支持。


作为一款创新性的AIGC模型,DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构,突破了传统AIGC模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支持。在此基础上,Janus Pro通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了10亿参数和70亿参数两个版本,在性能与精度上展现了较强的竞争力。


在Janus Pro统一的Transformer架构下,文生图模型的吞吐量高低已经从依赖加速器的高算力向充分利用HBM内存高带宽和大容量转换。英特尔Gaudi 2D凭借2.45TB/秒的高带宽和96GB HBM 大容量内存,为JanusPro 模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小(BatchSize)的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。

与此同时,结合英特尔Optimum-Habana框架的优化,英特尔Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约10秒即可生成16张高质量的图片,性能表现卓越。而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本,为AI应用的高效部署提供便利。


△利用英特尔Gaudi2D AI加速器运行DeepSeek Janus-Pro-7B模型生成

此外,DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持,能够为客户创造更好的总体拥有成本(TCO),推动AI的普惠。

一直以来,英特尔始终秉承开放的态度,并通过软硬件相结合的方式推动AI应用落地。目前,英特尔丰富的AI产品组合,包括英特尔至强处理器、英特尔Gaudi AI加速器、英特尔酷睿Ultra处理器和英特尔锐炫显卡等,已经针对业界超过500个开源AI模型提供支持,广泛涵盖DeepSeek、Llama3.1和通义千问等。同时,英特尔深耕开放生态,不仅以开放生态系统软件实现针对性优化,也通过打造企业AI开放平台(OPEA)为这些模型提供支持。

往期精彩文章

净利暴跌63%!ST计划关厂并裁员3000人!
ASML营收创历史新高:中国大陆净系统销售占比跌至27%!
DeepSeek掀起AI算力革命:英伟达暴跌17%!台积电暴跌13%!
Q1财测不及预期,股价大跌7.5%!TI 回应在华倾销被调查传闻
传瑞芯微前副总经理陈锋将加盟安谋科技!
传台积电6万片晶圆报废!内部人士回应
传字节跳动今年将采购240亿元国产AI芯片!
瑞芯微副总经理陈锋辞职!
寒武纪遭前CTO梁军索赔42.9亿元!
黄仁勋宴请35位供应链大佬:每桌菜价约1182元!
前华为悍将李健出任荣耀CEO!赵明:选择放手和离开!
全栈自研!又一家国产GPU厂商启动IPO!引发“寒王”暴跌?
美国将算能/智谱/科益虹源等25家中企列入实体清单!
详解美国对华晶圆代工限制新规(附完整规则)
荷兰宣布对特定测量和检测设备出口管制!

行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116

芯智讯
“芯智讯”——有料的科技新媒体!专注于半导体产业链、智能手机产业链、人工智能、AR/VR、智能硬件及汽车电子等相关领域。
 最新文章