AI模型:如何选择合适的 Embedding 模型?

文摘   科技   2024-08-04 07:00   广东  
我建了一个AI交流群,由于群已超200人,请在公众号回复“AI学习”,加群主VX,再入群,谢谢!

你知道吗?在AI的世界里,选择一个合适的Embedding模型,有时候比找对象还难!别急,我来给你支招,让你轻松成为模型选择的高手。

1

文本数据:MTEB 排行榜

想象一下,你手里有一堆文本数据,想要找到最匹配的Embedding模型。HuggingFace的MTEB排行榜就像是一个超级市场,里面摆满了各种模型供你挑选。别被那些花哨的排名迷了眼,记住,我们要找的是既高效又省内存的模型。就像选手机一样,不是最贵就是最好,适合自己才最重要。


2

图像数据:ResNet50


说到图像搜索,ResNet50就像是一个老练的侦探,能在茫茫图海中迅速找到你想要的那张苏格兰折耳猫的图片。这个模型可是微软在2015年的杰作,用ImageNet数据训练出来的,就像是一个经过严格训练的警犬,嗅觉灵敏得很。

3

音频数据:PANNs


如果你是个音乐迷,想要找一首和你的播放列表里相似的歌曲,PANNs就能大显身手了。这个模型就像是音乐界的“人肉搜索引擎”,能够帮你找到那些隐藏在角落里的宝藏音乐。

4

多模态图像与文本数据:

SigLIP 或 Unum

现在,让我们聊聊多模态数据。SigLIP和Unum就像是两位全能的艺术家,能够同时处理文本、图像、音频或视频。它们不仅能帮你找到相似的图片,还能为图片配上合适的文字描述,或者反过来,用文字找到图片。这简直就是艺术与科技的完美结合。

5

多模态文本、音频、视频数据

想象一下,你正在做一个项目,需要找到和某个主题相关的所有资料。这时候,Embedding模型就像是一个超级助手,帮你从海量信息中快速筛选出最相关的部分。或者,你是个视频博主,想要找到和你视频风格相似的其他视频,Embedding模型也能帮你轻松搞定。

好了,朋友们,Embedding模型的世界真的很精彩,不是吗?别犹豫了,赶紧动手试试吧。记住,选择模型就像选鞋子,合脚的才是最好的。祝你在AI的世界里,越走越远,越走越顺!

Milvus目前已经集成了主流的Embedding模型,欢迎大家体验:https://milvus.io/docs/embeddings.md


推荐阅读

🔥10W+ 教师必备的九个AI工具,很难相信还是免费!

🔥34个AI术语轻松学:给技术小白的简明指南

🔥AI Agent调研--7种Agent框架对比!盘点国内一站式Agent搭建平台,一文说清差别!大家都在用Agent做什么?

🔥我不忍心您再这么辛苦了!教师必备的4个最全爆火的的AI知识库,看完您也能成为AI提示词大神!

🔥别再只关注Kimi了!橙篇AI硬控风暴席卷,让人欲罢不能!适合创意内容生产者、科研学术领域从业者等的一站式创作需求。

🔥1W+一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!...

🔥AI炒股:3步用kimi获取A股实时行情数据并保存到Excel

🔥强烈推荐!2024年你应该知道的20款免费好用的AI工具!包含语言类、图像类、视频类

🔥Kimi AI 你到底还隐藏了多少好功能

🔥想让你的公众号拥有AI对话能力吗?那你一定不要错过这篇文章,手把手教你将Kimi大模型接入微信公众号,完全免费,只需要三分钟即可

🔥 华山论剑:文心一言、智谱清言、讯飞星火、通义千问、新华妙笔、 ChatGPT,公文写作哪家强?

🔥 华山论剑:腾讯、商汤、华为、百度、阿里巴巴五大平台,大模型在产品技术能力、战略愿景能力、生态开放能力三个维度的综合竞争力

🔥 3W+ 华山论剑:文心一言、通义千问、智谱AI、百川智能、天工AI、讯飞星火和Kimi七大平台,你怎么选?

🔥 重磅发布!揭秘Prompt新纪元:全面解读系统提示词调查报告,谁再打着提示词大师的旗号蒙你,把这篇甩给他

🔥AI提示词:让AI生成“介绍AI”的短视频脚本(附提示词prompt)





    如果你觉得“军哥说AI”公众号或这篇文章对你有帮助,别忘了给我点赞、在看、转发分享给更多的朋友。有任何问题或者想法,欢迎在评论区留言和我一起讨论。




军哥说AI
专注AI应用定制开发15年,欢迎来喝茶洽谈合作! 信息系统项目管理师。 广州市科技入库专家!
 最新文章