企业选择开源AI模型的全面分析与指南

科技 2024-10-17 16:16 北京

点击上方“蓝色字体”，选择 “设为星标”

关键讯息，D1时间送达！

随着开源AI模型的普及，企业在选择合适的模型时面临诸多挑战。Endor Labs通过对各种开源AI模型的全面分析，为企业提供了详细的参考，帮助他们根据业务需求做出最佳选择。文章深入探讨了不同开源模型的性能、安全性和可扩展性，帮助企业在AI技术的应用中更好地实现创新与效率提升。

AI的发展类似于开源软件早期的“西部蛮荒时代”——各种模型彼此构建，拼凑着来自不同地方的不同元素。

这与开源软件类似，带来了可见性和安全性方面的问题：开发者如何知道这些预构建模型的基础元素是否值得信赖、安全且可靠?

为提供更为详细的AI模型信息，软件供应链安全公司Endor Labs发布了用于AI模型的Endor Labs评分平台，该新平台对当前Hugging Face上超过90万个开源AI模型进行评分，Hugging Face是全球最受欢迎的AI平台之一。

“毫无疑问，我们仍处于早期阶段，”Endor Labs的创始工程师George Apostolopoulos在接受记者采访时表示，“当涉及到模型的‘黑箱’问题时，挑战非常大，从互联网上下载二进制代码是有风险的。”

四个关键因素评分

Endor Labs的新平台使用50个预设指标，根据安全性、活动性、质量和受欢迎程度对Hugging Face上的模型进行评分。开发者不需要对特定模型有深入了解，他们可以向平台提出诸如“哪些模型可以进行情感分类?”、“Meta最受欢迎的模型是什么?”或“流行的语音模型有哪些?”等问题。

平台随后会告知开发者模型的受欢迎程度、安全性，以及这些模型的创建和更新日期。

Apostolopoulos称AI模型中的安全性“复杂且有趣”。模型存在众多漏洞和风险，容易遭受恶意代码注入、恶意拼写攻击(typosquatting)和用户凭证泄露的攻击。

“随着这些问题变得更加普遍，我们迟早会看到攻击者无处不在，”Apostolopoulos说道，“攻击向量太多，难以建立信任。因此，可见性非常重要。”

Endor Labs专注于保障开源依赖项的安全，基于Hugging Face的数据以及已知攻击的相关文献，开发了四个评分类别。公司部署了大型语言模型(LLM)，以解析、组织和分析这些数据，并且公司的新平台会自动且持续地扫描模型的更新或更改情况。

Apostolopoulos表示，随着Endor Labs收集到更多数据，还会纳入其他因素。公司最终也会扩展到除Hugging Face以外的其他平台，例如包括OpenAI等在内的商业供应商。

“随着更多人开始部署AI，AI治理将变得越来越重要，我们将对此有更多的讨论。”Apostolopoulos说道。

AI的发展路径与开源开发相似——但复杂得多

Apostolopoulos指出，AI的发展与开源软件(OSS)的发展有许多相似之处。两者都提供了大量选择，同时也存在诸多风险。对于OSS，软件包可能引入隐藏漏洞的间接依赖。

类似地，Hugging Face上的绝大多数模型都基于Llama或其他开源选项。“这些AI模型实际上也是依赖项。”Apostolopoulos说道。

AI模型通常是基于其他模型构建的，或者本质上是其他模型的扩展，开发人员会根据具体的使用场景对其进行微调，这就形成了他所称的“复杂依赖关系图”，这种图既难以管理，也难以保障安全性。

“在某个底层的某处，五层深的地方，有一个基础模型，”Apostolopoulos说道。要获得清晰的透明度很难，现有的数据可能非常混乱且“让人读起来十分痛苦”，很难确定模型权重中具体包含了什么，而且目前还没有可以石版印刷般精确的方法来确保一个模型与其声称的一致、如宣传所示那样可信，并且不会生成有害内容。

“基础测试并不是一件轻松或简单的事，”Apostolopoulos指出，“实际上，相关信息非常少且非常分散。”

尽管下载开源代码十分方便，但他指出，这也是“极其危险的”，因为恶意攻击者可以轻易地破坏这些代码。

例如，常见的模型权重存储格式可能允许任意代码执行(即攻击者可以获取访问权限并运行任何他们想要的命令或代码)。对于基于较旧格式(如PyTorch、TensorFlow和Keras)构建的模型，这尤其危险。此外，部署模型时可能需要下载其他恶意或存在漏洞的代码(或者这些代码试图导入带有依赖性的内容)，而且，安装脚本或代码库(以及相关链接)也可能是恶意的。

除了安全问题之外，还有许多许可障碍：与开源类似，模型也受许可条款的约束，但AI引入了新的复杂性，因为模型是基于拥有自己许可条款的数据集进行训练的。Apostolopoulos强调，现代组织必须意识到模型中使用的知识产权(IP)及其版权条款。

“一个重要方面是这些大型语言模型(LLM)与传统的开源依赖项的相似和不同之处，”他说。尽管它们都依赖外部资源，LLM更强大、更庞大，并且由二进制数据组成。

开源依赖项会不断“更新、再更新、再更新”，而AI模型则“相对静态”——一旦更新完毕，“你可能就不会再去碰它们了。”Apostolopoulos说道。

“LLM本质上就是一堆数字，”他说，“它们要复杂得多，难以评估。”

2024全国CIO选型展暨高峰会将于11月29-30日在南京盛大召开，欢迎您扫描下方二维码报名↓↓↓。

（来源：企业网D1Net）

关于企业网D1net(www.d1net.com)

国内主流的to B IT门户，同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)

如果您在企业IT、网络、通信行业的某一领域工作，并希望分享观点，欢迎给企业网D1Net投稿。封面图片来源于摄图网

投稿邮箱：

editor@d1net.com

合作电话：

010-58221588（北京公司）

021-51701588（上海公司）

合作邮箱：

Sales@d1net.com

企业网D1net旗下信众智是CIO（首席信息官）的专家库和智力输出及资源分享平台，有五万多CIO专家，也是目前最大的CIO社交平台。

信众智对接CIO为CIO服务，提供数字化升级转型方面的咨询、培训、需求对接等落地实战的服务。也是国内最早的toB共享经济平台。同时提供猎头，选型点评，IT部门业绩宣传等服务。

扫描 “二维码” 可以查看更多详情

AI人工智能D1net

企业网D1Net-国内精准专业的企业IT媒体。涵盖：云计算；智慧城市；数据中心；大数据；物联网；BYOD；企业移动应用；服务器；存储；虚拟化；安全；企业应用软件；UC协作；视频会议；视频监控；呼叫中心；运营商企业业务；IT咨询；渠道等。

从RPA到智能体：智能自动化迎来革命性飞跃

成本、安全性和灵活性：开源AI的商业案例

2025年企业对AI的期望

你应该知道的具有突破性的AI营销用例

地区冲突助推网络攻击激增，由AI驱动的勒索软件成新威胁

Uber进军AI数据标注领域

基于AI的深度伪造检测的局限性

部署自己的大型语言模型的7种方法

微软悄然组建了最大的智能助手生态系统——无人能及

英伟达推出Omniverse Blueprint，加速工业数字化转型

正确启动AI助手的策略与实践

微软与行业巨头合作，将AI引入农场和工厂

探讨营销技术的6个AI用例

英国推出平台帮助企业管理AI风险、建立信任

好莱坞新片《Here》用AI技术为汤姆·汉克斯减龄引热议

重新定义客户体验：AI如何改变万事达卡

尽管存在不确定性，CIO仍希望加强AI治理

机器人互操作性在仓库中的作用

AI伦理危机曝光：科技操纵与道德底线失守

创新研讨会如何帮助人们更好地了解GenAI用例

企业AI从“实验”走向“必要”，支出增长130%

关于OpenAI疯狂财务状况的4个真相

企业对AI模型的判断：开源为何会胜出

投资AI营销技术？回报最高的3个领域

采购转型中AI人才的战略方针

GE医疗宣布为治疗癌症的医生推出节省时间的AI工具

AI成功的11个关键角色

企业选择开源AI模型的全面分析与指南

AI正在改变供应链行业

基础模型如何帮助企业更好地利用AI

什么时候才是放弃AI项目的最佳时机？

沃尔玛通过新的Wallaby LLM押注于多种AI模型

B2B营销中的GenAI：转变买家和卖家的角色

引人注目的12个AI灾难

引入AI劳动力：数字人将如何重新定义工作本身

AI的使用：每个CISO都必须问的3个基本问题

初创企业利用GenAI获得竞争优势的指南

解读营销中传统AI与GenAI的差异

企业急于采用AI，忽视了安全强化

高管期望与员工体验的巨大差异 77%的受访员工表示AI工具降低了他们的工作效率

GenAI可以照亮数十年的暗数据

如何避免被AI生成的错误信息欺骗

关于AI治理策略的六个考虑

GenAI在高管中的热度逐渐消退

AI的回报何时会超过其风险？

所有企业在开发AI解决方案时都应避免的陷阱

德勤调查揭示了企业GenAI生产部署面临的挑战

随着AI的普及，如何安抚紧张的商业领袖

GenAI的新潮流：如何利用智能体的力量

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉