一篇文章详细了解AI产品经理工作流程

文摘   2024-11-12 08:02   四川  

1.AI产品经理工作全流程概览

AI产品经理工作全流程中与普通产品经理的区别主要是多了算法模型部分,包括模型预研、数据准备、模型构建、模型宣讲、模型验收,协作的对象相对普通产品经理也多了算法工程师。

第二部分:需求概述

在需求概述阶段,我们需要明确以下几个核心问题:

1. 目标任务是什么?

2. 执行此任务的目的及其潜在的益处?

3. 业务目标和预期的完成时间?

为了更具体地说明,我们以开发一个识别并筛选“薅羊毛”用户系统为例。

1. 项目背景

我们的团队在分析项目数据时发现了异常,经过深入调查,我们发现有人在夜间非法获取数据。这些行为通常包括:

- 在淘宝购买手机号并注册新账户。

- 利用自动化手段(如新手礼包、每日签到、周任务等)来获取免费资源。

- 在夜间使用这些资源批量下载数据。

为了解决这个问题,我们计划开发一个系统来识别和筛选出这些“薅羊毛”的用户。

2. 任务内容

我们的目标是开发一个系统,用于识别和筛选“薅羊毛”的用户。具体实施方案包括:

- 在用户领取新手礼包或周任务奖励时,要求绑定手机号。

- 在用户使用券进行下载操作时,评估其是否为“薅羊毛”用户,并根据风险等级将用户分类为正常、疑似和高危。

- 对于“疑似”用户,触发额外验证逻辑;对于高危用户,锁定账户,并在激活时要求绑定微信。

3. 目的和价值

开发此系统的主要目的是减少公司在发放福利时的损失,确保福利能够到达真正的用户。

4. 业务目标和时间表

- 系统模式:我们期望系统能够实时判断用户行为,因此定义为实时模型。

- 覆盖率:我们希望模型能够覆盖所有用户,即100%的覆盖率。

- 倾向:我们追求高召回率,即使这意味着可能会有一定比例的误报。我们宁愿错杀一千,也不愿放过一个“羊毛党”。

- 上线期限:我们的目标是在双十一前上线,距离现在大约还有半年的时间。

第三部分:模型预研

AI产品经理将需求传达给算法工程师,工程师需要评估现有数据和算法是否能满足业务需求。

如果现有数据不足以满足需求,我们可能需要增加数据收集点、获取目标数据或替换为类似数据。

如果算法支持度不足,可能需要调整需求以适应现有条件。例如,如果实时模式对业务响应速度有影响,我们可能会调整为离线模型,每天定时处理前一天的数据。

第四部分:数据准备

对于算法团队来说,他们需要根据现有数据确定哪些特征对模型有用。AI产品经理则需要更深入地理解业务,通过沟通技术团队来获取更完善的数据集。

例如,我们需要识别用户是否主要在夜间活动、操作频率是否异常、同一终端是否在短时间内登录过多个用户、用户是否触发过新手引导等特征。

在获取数据时,我们主要考虑以下三类数据:

1. 内部业务数据:如果之前有相关数据,我们可以从中选择;如果没有,我们可以通过增加数据收集点来留存数据。

2. 跨部门数据:我们需要根据公司的数据管理规范流程提取其他部门或中台的数据,并在提取时筛选有效数据。

3. 外采数据:根据需求向外部公司购买数据。我们需要了解市场上不同公司能提供哪些数据,并注意外采公司的资质审核和数据的合法性,确保数据安全和消费者隐私保护。

第五部分:模型构建

模型构建的具体流程如下:

1. 模型构建

在模型构建阶段,我们需要决定使用哪种算法,如何设定目标变量,确定数据来源,以及如何收集数据样本,是采用随机抽样还是分层抽样。

a. 算法选择

根据项目需求,模型需要计算用户是否为“薅羊毛”用户的概率,并将用户分为正常、疑似和高危三个等级。技术团队最终决定使用逻辑回归算法来满足这一需求。

逻辑回归算法因其计算效率高和解释性强而被选中,非常适合处理多分类问题,并且能够为用户“为何被封号”的疑问提供有力的解释。

b. 目标变量定义和样本抽取

在模型构建阶段,定义目标变量和抽取数据样本是至关重要的。不同的目标变量决定了模型的应用场景和业务预期。

样本是构建模型的基础。在选择样本时,应根据模型目标和业务实际情况来选择合适的样本,并考虑季节性和周期性的影响。建议选择近期数据,并结合跨时间段的样本抽取,以降低样本无法代表总体的风险。

2. 特征工程

模型输入均为量化信息(以向量、矩阵或张量形式表示),因此需要将各类数据转换为量化信息,这一过程称为特征工程。

特征工程是模型构建中的关键环节,选择合适的特征不仅能提升模型性能,还能简化模型复杂度。即使模型参数非最优,优质的特征也能带来良好的性能,从而减少寻找最优参数的工作量,简化模型构建过程。

数据和特征决定了模型的潜在性能,而模型和算法则是逼近这一性能上限的工具。

以“薅羊毛”项目为例,我们可以通过用户夜间活动情况、操作频率、历史订单、活动完成速度、同一终端登录多个账号等特征来评估用户是否为“薅羊毛”用户,这就是特征工程的建立。这些特征有助于判断用户的可疑程度。

特征工程包括以下四个步骤:

1)数据清洗

数据清洗是算法工程师的重要工作,是数据预处理的关键环节,包括重新审查和校验数据,检查数据一致性,处理无效值和缺失值等。

解决数据缺失、异常值或无效值、数据不均衡、单位不一致等问题。

对于数据缺失,可以通过删除或补充缺失值来解决。

对于数据不均衡问题,由于数据偏差可能导致模型过拟合或欠拟合,因此在取数据时需要考虑均衡问题。

2)特征提取

从原始数据中提取有用特征,转化为更具代表性和可解释性的特征。特征提取旨在降低原始数据维度,提高数据表达能力,帮助算法更好地完成任务。

常见的特征类型包括数值型特征、标签或描述类特征、非结构化数据和关系型数据。

数值型特征:如消费金额、好友人数、浏览页面次数等业务操作数据和运营数据。通常先提取主体特征,再提取其他维度特征。

标签或描述类特征:如有房、有车、高付费等标签。

非结构化特征:如内容评论,判断是否存在负面情绪。非结构化数据通常存在于UGC内容中。提取非结构化特征通常涉及文本数据的清洗和挖掘,以反映用户属性的特征。

关系型数据特征:如通讯录、收货地址、商品分享(通常分享给亲朋好友)、LBS位置信息等维度数据。例如,在京东购物时,如果两个人使用同一收货地址,且该地址是家庭地址,那么他们很可能是家人。

3)特征选择

特征选择主要依据覆盖度、IV值(信息价值)、稳定性等指标。

IV值表示特征对目标预测的贡献程度,但IV值有限定条件:一是任务必须是有监督的任务;二是模型必须是二分类模型。

4)生成测试集与训练集

为了模型训练的最后准备,算法工程师需要将数据分为训练集和测试集。他们将使用训练集进行模型训练,并使用测试集来验证模型效果。

3. 测试集与训练集生成

模型训练是一个不断训练、验证和调优的过程,目的是找到一个最优的划分条件(决策边界),在保证准确率(拟合)的同时兼顾稳定性(泛化性能)。这里有几个需要理解的概念:

决策边界

如何达到最优?就是要绘制一条较好的决策边界。

决策边界是在符合某种条件时做出选择的条件,根据这个条件可以将结果进行划分。例如,如果下午6点前没写完这篇博客我就不吃饭,那么写完了就去吃,没写完就不吃。这个条件就是我们所说的决策边界。

决策边界分为线性决策边界和非线性决策边界。下图中,图1为线性决策边界,图2、图3为非线性决策边界。

决策边界曲线的平滑程度与模型训练出的模型能力密切相关。曲线越陡峭,模型的测试精度越高(可以理解为不是一刀切),但越陡峭的曲线模型越不稳定。

b、拟合与泛化

模型的“最优”指的是模型拟合能力和泛化能力的平衡点。

拟合能力:模型在已知数据上(训练集)的表现。

泛化能力:模型在未知数据上(测试集)的表现。

如果想让模型具有足够的拟合能力,就需要构建一个复杂的模型对训练集进行训练。但模型越复杂,就越依赖训练集的数据,就越可能出现训练集表现很好,但在测试集上表现差的情况,泛化能力较差,这种情况称为“过拟合”。

如果想让提高模型的泛化能力,就要降低模型复杂度,减少对训练集的依赖。但如果过度降低复杂度,又可能导致“欠拟合”。

过拟合:模型把数据学得太彻底,甚至把噪声数据的特征也学到了,导致不能很好地识别未知数据,模型泛化能力下降。训练集表现很好,但测试集表现很差。读的是“死书”,并没有真正掌握书里的精髓,自然就无法很好地应用。产生过拟合的原因通常包括:特征过多、模型复杂度过高、样本数据无法代表预定分类、样本噪音干扰过大等。

欠拟合:模型不能很好地捕捉数据特征,不能很好地拟合数据。在训练集的表现就很差,需要继续努力“学习”。产生欠拟合的原因通常包括:模型复杂度过低、特征量过少等。

c、交叉验证

算法工程师通过不断调整模型参数、训练,然后使用交叉验证的方式,逐渐找到拟合能力和泛化能力的平衡点,这个平衡点就是我们训练模型的目标。

交叉验证是一种评估机器学习模型性能的有效方法,可用于选择最佳模型参数、模型选择以及避免过拟合等问题。包括简单交叉验证、留出交叉验证、自助交叉验证等方法。例如,将测试数据进行封箱处理,然后随机对一些分箱测试结果取平均值。

4. 模型验证

经过复杂的模型训练,我们得到了一个所谓的“最优解”,但如何证明这个最优解是真正的最优解呢?我们需要模型验证阶段来确认这个“最优解”的真假。

模型验证通常通过模型的性能指标和稳定性指标来评估。

模型性能:模型预测的准确性。

分类模型性能评估:分类模型的预测结果是具体的分类,通常使用召回率、F1、KS、AUC等评估指标来判断分类模型的性能。

回归模型性能评估:回归模型的预测结果是连续值,通常使用方差和MSE等评估指标来判断回归模型的性能。

模型稳定性:指的是模型性能可以持续多久,通常使用PSI指标来评估模型的稳定性。

PSI指标,即模型稳定性指标(或称为客情稳定性指标),PSI越小越好。如果PSI>0.25,说明稳定性很差。

总之,在模型验收环节,AI产品经理需要了解常用的性能指标与稳定性指标,并知道其合理范围。AI产品经理对模型验证环节格外关注,需要深入理解评估指标、计算逻辑,并能根据指标数据判断模型效果是否达标。

5. 模型融合

为了提升模型的准确率和稳定性,有时会同时构建多个模型,然后将这些模型集成在一起,确保模型有更优的整体表现。

例如,在“薅羊毛”项目这种分类模型中,可以使用最简单的投票方法来融合,票数最多的类别就是最终结果。

回归模型的融合主要使用算术平均或加权平均。

分类模型的融合主要是取数据值最大的,如Blending和stacking、bagging和boosting。

模型融合的一些基本方法如下,感兴趣可以进一步查阅资料了解。

c、交叉验证

算法工程师通过反复调整模型参数和训练过程,利用交叉验证技术逐步寻找模型的拟合能力和泛化能力之间的最佳平衡点,这个平衡点是我们训练模型追求的目标。

交叉验证是一种用于评估机器学习模型性能的高效方法,它能帮助我们选择最合适的模型参数、进行模型选择以及防止过拟合等问题。交叉验证有多种类型,包括简单交叉验证、留出交叉验证和自助交叉验证等。例如,可以将测试数据进行封箱处理,然后随机选择一些分箱进行测试,并计算这些测试结果的平均值。

4.模型验证

经过一系列复杂的模型训练后,我们得到了一个所谓的“最优解”。然而,如何验证这个解是否真的是最优解呢?模型验证阶段就是为了确认这个“最优解”的真实性。

模型验证主要依据模型的性能指标和稳定性指标来进行。

模型性能指的是模型预测的准确度。

对于分类模型,其性能评估通常使用召回率、F1分数、KS统计量、AUC等指标;而对于回归模型,则通常使用方差和均方误差(MSE)等指标来评估模型的性能。

模型稳定性指的是模型性能的持续性,通常用PSI指标来衡量。PSI指标,即模型稳定性指标,数值越小表示模型稳定性越好。如果PSI值大于0.25,则表明模型稳定性较差。

总的来说,在模型验收阶段,AI产品经理需要熟悉常用的性能指标和稳定性指标,并了解它们的合理范围。AI产品经理应特别关注模型验证环节,深入理解评估指标和计算逻辑,并能够根据这些指标的数据来判断模型的效果是否达到预期标准。

5.模型融合

为了提高模型的准确度和稳定性,有时会同时开发多个模型,并将它们集成起来,以实现更优的整体性能。

例如,在处理分类模型如“薅羊毛”项目时,可以采用简单的投票法进行模型融合,得票最多的类别即为最终结果。

对于回归模型,融合通常采用算术平均或加权平均的方法。

分类模型的融合则主要采用取数据值最大的方法,如Blending、stacking、bagging和boosting等。

模型融合的基本方法如下,有兴趣可以进一步查阅相关资料深入了解。

在模型融合的过程中,产品经理需要考虑好成本问题。

五、模型宣讲与验收

模型构建完成后,产品经理需要组织技术宣讲训练好的模型,介绍内容如下:

  1. 使用的什么算法?为什么选这个算法?

  2. 选用了哪些特征。

  3. 训练集、测试集的大致情况。

  4. 模型的测试结果。

  5. 是否达到了预期?哪些指标未达预期?未达预期的原因是什么。

宣讲之后,产品经理需要对模型进行评估和验收,该环节也非常重要,至于如何选择合适的评估指标,后续章节会详细介绍。

六、业务开发并上线

验收通过之后,技术会把模型部署到线上,并按之前和业务开发同事约定的接口提供能力。

业务开发完成相应功能后,和模型接口联调通过,就可以进入常规的走查、测试、上线流程了。

需要注意的是,模型上线后,还需要持续监控模型的效果,若运行一段时间后,发现模型效果有明显衰减,就需要分析原因,并针对性的升级模型。



作者:小王子与月季

来源微信公众号:小王子与月季

题图来自 Unsplash ,基于 CC0 协议,如有侵权,请联系VX:pmtalk123删除


品牌推广| 内容撰写|广告投放|培训合作

请添加微信  PMxiaowanzi 


每日案例拆解库,AI等产品打卡群

 

PMTalk创建的产品设计打卡社群,加入后365天,每天体验一款APP。提升产品设计能力,同时有1300份体验报告帮助你找到竞品。

 

在这里你可以随时查询到你想找的各类竞品行业APP,无须自己亲自下载就可以马上得到APP的一手产品优化、交互设计、功能描述信息。

 

从优化&建议、商业模式、运营、功能描述、交互设计、产品定位至少6个维度,体验一款应用。

 

平均1天1块钱,扫码购买即可加入 

 连续体验48款应用,通过后原路退回

 



报名后,请添加星球助理(否则报名无效)

PMTalk123

 





PMTalk产品经理社区
国内Top的产品经理社区,聚集21W人产品经理、运营、设计师等互联网人成长; 全国800+位产品领域大佬入驻签约作者; 每年举办70+场产品运营增长活动 ;你想知道的产品经理知识全部在这儿~
 最新文章