本文内容为翻译COSMO模型的会议稿,并带入了自己观看COSMO模型会议稿后的个人理解,仅供学习与讨论,如需获取英文版正文,请公众号后台私发“COSMO会议稿”关键词。 亚马逊COSMO模型是大型电商常识知识生成与服务系统,目前已经应用部署在各种亚马逊搜索应用程序中,包括搜索相关性、基于会话的推荐和搜索导航。 之前的大规模知识图谱(KG)无法发现用户的意图,而COSMO可以从海量行为中挖掘以用户为中心的常识知识,并构建行业规模的知识图谱来赋能多样化的在线服务。 高效语言模型(COSMO-LM)生成可靠的的电子商务常识知识,已经有效地将知识图谱扩展到亚马逊的 18 个主要类别。
COSMO模型是基于大型语言模型( Large Language Model)、知识库(Knowledge Base)训练而成的,目的是为了更能发现用户的意图。 通过对用户大量干扰信息行为产生的背后意图的判断,去应用于产品应用中的例如推荐和产品搜索模块,只有模型更能懂消费者的意图后,才能为消费者展现意图背后的需求产品,精准推送后是不是更能促使下单率的提升呢? 意图是人类致力于行动的心理状态,行为是意图的结果。
例如,“参加婚礼,我们需要购买普通衣服”,其中意图“参加婚礼”用于合理化和解释用户行为,即“购买普通衣服”。消费者先产生需要“参加婚礼”的意图,进而做出“购买普通衣服”的行为。 而COSMO模型会去挖掘隐含常识,例如将“发生参加婚礼的意图后就会产生需要购买普通衣服的行动”列为隐含常识之一。 在看一个COSMO文档中举的例子,一个消费者在发生“想要为孕妇买一双鞋子”的意图后,做出了“购买防滑鞋子”的行为,COSMO模型会将“孕妇更需要防滑鞋”列为隐含常识之一。
如果电子商务平台能够准确捕捉用户的意图,就会带来搜索体验。但是消费者并没有明确表达什么样的意图会带来什么样的行为,那就需要COSMO模型去基于大型语言模型( Large Language Model)、知识库(Knowledge Base)训练出常识,这些常识就好比如“孕妇更需要防滑鞋”、“发生参加婚礼的意图后就会产生需要购买普通衣服的行动”等等(训练方法之一)。
但是上述的提炼方法还是会出现像“客户购买苹果手表是因为它是一种手表”、“客户因为喜欢而一起购买它们”这种无用的、不可靠的通用意图,这就要求大型电商常识知识生成与服务系统(COSMO模型)应生成真实性更强、可靠性更高、透明度更深的意图去解释消费者的电子商务行为。 COSMO模型的目标是全面支持更多的电子商务场景,为不同的意图生成/选择了代表性的用户行为。 COSMO模型还采用了行业规模的查询项交互来生成模糊且不断变化的意图,这种查询项交互生成的意图可以帮助将广泛的查询细化为特定用户的需求,并提高查询理解能力。 COSMO模型对18 个产品类目中的数百万个用户行为数据进行了采样用于候选知识库(用户意图背后的行为)生成,并过滤掉低质量的知识(用户意图背后的行为)。 写到这里总结一下上文:COSMO模型是基于18个产品类目,对co-buy&search-buy的用户行为样本中分析product, query, intention(用户意图背后的行为)。与现有的电子商务相关知识图谱相比,COSMO模型的数据采集样本更大,更全的去分析理解用户意图背后的行为,更好地符合人类偏好。
下图是从海量用户行为和大语言模型生成高质量指令数据的总体框架。其中该COSMO模型团队成员提出的FolkScope框架通过提示(Prompt)大型语言模型(LLMs)从大量用户行为(User Behaviors)中提取意图知识库(Knowledge),然后使用经过标记数据训练的分类器来过滤(Filter)掉低质量的意图知识,最后生成人类的喜好(Human Feedback),为搜索购买行为做出了解释和指令分析拆解记录。
例如查询“冬装”通常暗示用户想要衣服保持温暖,得出这个把这个指令记录在常识性知识库中。
该COSMO模型团队选择两种具有强烈潜在意图的典型用户行为,即搜索购买和共同购买进行研究,提出大规模生成的数据驱动的关系(data-driven relation discovery from large-scale generations)发现来满足电子商务场景。基本思想是基于四种种子关系(即usedFor(使用的场景、功能、受众)、capableOf(能够被使用XXX)、isA(产品的类别)、cause),这些种子关系往往会生成多样化/高质量的知识,并挖掘频繁的谓词模式来手动总结关系。
最常见的模式是“该产品能够被使用 xxx ”,其中[xxx]表示介词。不同xxx的生成了不同的常识性知识。
该COSMO模型团队在对搜索购买和共同购买进行研究时,设置的阈值是购买率和点击率,并且通过提供一个表达用户行为问答 (QA) 环境来生成候选知识库。
最终形成了COSMO模型电商常识提取(E-commerce Commonsense Extraction )的规范,如下图,基于共同购买和搜索购买的用户行为,对18个类目进行了样本分析,基于四种种子关系(usedFor、capableOf、isA、cause)生成知识库,并进一步做了5种过滤(解释是一个完整的句子吗? 解释相关吗?解释内容是否丰富? 这个解释可信吗? 解释是否典型?),最终提炼生成优质的电商知识。
重要的一点是COSMO模型可以彻底改变搜索导航(search navigation),从传统的以产品为中心的分类法转向以客户为中心的分类法方法。这种转变增强了购物体验,它与客户的意图和行为更加紧密地联系在一起。
例如下图的层次结构,扩展了粗粒度的层次结构,从户外活动拓展到露营类目,从露营类目拓展到冬季露营,从冬季路径拓展与冬靴等产品联系起来,这是通过动态提供具有客户查询概念的分类法,缩小产品分类和客户语言之间的差距。
由粗粒度到细粒度的层次结构,并允许用户根据特定属性进行过滤,优化了搜索导航体验,更明晰的客户的意图,使结果与个人偏好保持高度一致,从而推荐更符合意图行为的电商商品。
而实现这一点可看出COSMO 功能的核心就是多轮式导航(Multi-Turn Navigation)。例如通过最粗的“露营”搜索词到“充气床垫”这样的搜索选择,然后细化为“露营气垫”,再细化到“湖边露营”、“山地露营”等搜索结果,这种多轮式的导航路径,可以进行更深入、更精确的纠正为用户真正的意图,反映自然发现过程,并显着增强用户的搜索体验。
以上就是我阅读完COSMO模型会议稿的解读。
COSMO模型基于used_for_func Function / Usage 、used_for_eve Event / Activity、used_for_aud Audience、capable_of Function / Usage 、used_to Function / Usage、used_as Concept / Product Type、is_a Concept / Product Type、used_in_loc Location / Facility、used_in_body Body Part、used_with Complementary、used_by Audience、xIntersted_in Interest、xIs_a Audience、xWant Activity来认知商品是什么、商品的功能、商品的使用场景、商品的使用人群。 而有着精准定位细分标签下的商品对于搜索结果下的多轮轮式导航更加友好。
写给每一位追梦的人
排版丨林子酱
文案丨林子酱
摄像丨林子酱
我明白你会来,所以我等