祝贺！门头沟驻区企业智子引擎全新发布——

政务 2024-11-19 17:41 北京

随着多模态大模型的快速发展，当前主流多模态大模型具备完成多种任务的能力（图文描述、视觉问答、文字识别、图标理解、目标检测等）。但是，这些不同的多模态任务往往具有完全不同的数据分布，导致在模型训练过程中遇到“多任务冲突”的问题，尤其在模型参数量较小时，这种问题尤为突出。如何才能在有限增加模型参数量以及训练成本的条件下，高效地扩展模型容量，缓解多模态大模型“多任务冲突”问题？

近日，针对这一挑战，来自北京市门头沟区的大模型初创公司智子引擎的研究团队开源了基于MoE架构的多模态大模型Awaker2.5-VL。Awaker2.5-VL通过设置多个专家，扩展了模型在不同任务上的能力，有效地缓解了多模态“多任务冲突”的问题。该模型还对MoE中门控网络的路由策略进行了细致的研究，并设计了一个简单且十分有效的路由策略，提升了模型训练的稳定性。Awaker2.5-VL在MME-Realworld和MME-Realworld-CN都位列榜首，且是目前唯一在该Benchmark上“及格”（超过60分）的模型。考虑到MME-Realworld主要面向自动驾驶、遥感、视频监控等复杂场景，Awaker2.5-VL在MME-Realworld上的出色表现很好地展示它在落地应用中的巨大潜力。目前，Awaker2.5-VL的论文和代码已经公开，后续还会更新更强的版本。

2024年，智子引擎已经成功地将Awaker2.5-VL应用于门头沟本地产业，其中有多个复杂的实际场景，包括国家电网、社会治理、服务型机器人等。在即将到来的2025年，智子引擎将继续在门头沟区进行产业深耕，探索Awaker2.5-VL更多的落地应用场景。

来源：中关村门头沟园管委会智子引擎

编辑：李季

http://mp.weixin.qq.com/s?__biz=MzA5NzM5MDUyNA==&mid=2654593740&idx=1&sn=337f933346dd1aec4610bc70f5015c0f

北京门头沟

看京西向未来

最新放假通知！

周末，北京西部北部预报有雪！大降温来了→

门头沟今年首个供地项目开工建设

祝贺！门头沟驻区企业智子引擎全新发布——

在门头沟“寻找美丽中华”

这首《京西京西》很上头！朋友圈都在听——

长安街西延线上，缘何崛起这片医疗器械“心”动力的策源地？

来吗？水峪嘴村“云村民” 已超4000人

斋堂水库对外开放啦！时间、预约方式——

重磅！北京取消普通住房和非普通住房标准

北京国有资本运营管理有限公司领导到门头沟区调研

亮了！

少用或不用融雪剂，门头沟公路分局开展铲冰除雪演练

狗咬私家车？社区法庭带来“示范庭审”

延长至63周岁！明年起实施

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉