首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI产品经理需要了解的数据标注工作

文摘 2024-11-13 12:01 四川

一位AI产品经理。在正式内容之前，我想跟大家简单分享一下我的经历：我大学本科不是IT相关，甚至在我工作之前，我没有做过任何与互联网相关的实习工作。

而现在我能负责公司的重点项目，证明了进入AI行业并不是你们想象中的那么困难。直至今天，我仍在这条道路上不断学习，也希望有更多的朋友给予我指点。

现在我就来说说，如何在对AI行业一无所知的情况下，快速了解到它的流程运作，并找准机会转行。

1.简单了解AI应用范围

图 by@智能玩咖

AI的应用领域非常非常广，上图只是大家相对熟悉的几个，而且每一个领域用到的算法都不一样。有很多想转型的产品，第一个考虑的点就是：不懂技术就做不了AI，我是不是学完算法才能入行？

1.不仅算法重要，很多时候数据可能更重要；有保质保量的数据，才可能有好的训练效果。

2.数据可分为两种类型：“被标记过”的数据和“未被标记过”的数据。

什么是标记呢？

意同“贴标签”，当你看到一个西瓜，你知道它是属于水果。那么你就可以为它贴上一个水果的标签。算法同事用“有标签的数据”去训练模型，这里就有了“监督学习”。

重点就是这里：只要是跟“监督学习”沾边的产品/技术，比如图像识别、人脸识别、自然语言理解等等，他们都有一个必走的流程——

不断地用标注后的数据去训练模型，不断调整模型参数，得到指标数值更高的模型。

2.数据处理流程拆解

1.数据标注

数据的质量直接会影响到模型的质量，因此数据标注在整个流程中绝对是非要重要的一点。

一般来说，数据标注部分可以有三个角色

1）标注员：标注员负责标记数据。

2）审核员：审核员负责审核被标记数据的质量。

3）管理员：管理人员、发放任务、统计工资。

只有在数据被审核员审核通过后，这批数据才能够被算法同事利用。

3.数据标记流程

1）任务分配：假设标注员每次标记的数据为一次任务，则每次任务可由管理员分批发放记录，也可将整个流程做成“抢单式”的，由后台直接分发。

2）标记程序设计：需要考虑到如何提升效率，比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率。

3）进度跟踪：程序对标注员、审核员的工作分别进行跟踪，可利用“规定截止日期”的方式淘汰怠惰的人。

4）质量跟踪：通过计算标注人员的标注正确率和被审核通过率，对人员标注质量进行跟踪，可利用“末位淘汰”制提高标注人员质量。

4.模型训练

这部分基本交由算法同事跟进，但产品可依据需求，向算法同事提出需要注意的方面；

举个栗子——

背景：一个识别车辆的产品对大众车某系列的识别效果非常不理想，经过跟踪发现，是因为该车系和另外一个品牌的车型十分相似。那么，为了达到某个目标（比如，将精确率提高5%），可以采用的方式包括：

1）补充数据：针对大众车系的数据做补充。值得注意的是，不仅是补充正例（“XXX”应该被识别为该大众车系），还可以提供负例（“XXX”不应该被识别为该大众车系），这样可以提高差异度的识别。

2）优化数据：修改大批以往的错误标注。

产品将具体的需求给到算法工程师，能避免无目的性、无针对性、无紧急程度的工作。

5.模型测试

测试同事（一般来说算法同事也会直接负责模型测试）将未被训练过的数据在新的模型下做测试。

如果没有后台设计，测试结果只能由人工抽样计算，抽样计算繁琐且效率较低。因此可以考虑由后台计算。

一般来说模型测试至少需要关注两个指标：

1.精确率：识别为正确的样本数/识别出来的样本数

2.召回率：识别为正确的样本数/所有样本中正确的数

举个栗子：全班一共30名男生、20名女生。需要机器识别出男生的数量。本次机器一共识别出20名目标对象，其中18名为男性，2名为女性。则

精确率=18/（18+2）=0.9

召回率=18/30=0.6

再补充一个图来解释：

（来自@mousever）

而且，模型的效果，需要在这两个指标之间达到一个平衡。

测试同事需要关注特定领域内每个类别的指标，比如针对识别人脸的表情，里面有喜怒哀乐等分类，每一个分类对应的指标都是不一样的。测试同事需要将测试的结果完善地反馈给算法同事，算法同事才能找准模型效果欠缺的原因。同时，测试同事将本次模型的指标结果反馈给产品，由产品评估是否满足上线需求。

4.产品评估

“评估模型是否满足上线需求”是产品必须关注的，一旦上线会影响到客户的使用感。

因此，在模型上线之前，产品需反复验证模型效果。为了用数据对比本模型和上一个模型的优劣，需要每次都记录好指标数据。

假设本次模型主要是为了优化领域内其中一类的指标，在关注目的的同时，产品还需同时注意检测其他类别的效果，以免漏洞产生。

5.产品工作补充

产品经理的工作，不止是产品评估——除了流程控制，质量评估，还有针对分类问题，由产品经理制定边界；这是非常重要的，直接影响模型是否满足市场需求。

产品制定分类规则：例如，目的是希望模型能够识别红色，那产品需要详细描述“红色”包含的颜色，暗红色算红色吗？紫红色算红色吗？紫红色算是红色还是紫色？这些非常细节的规则都需要产品设定。

如果分类细，那么针对某一类的数据就会少。如果分类大，那么一些有歧义的数据就会被放进该分类，也会影响模型效果。分类问题和策略问题道理是一样的，都需要产品对需求了解得非常深刻。

以上内容，都只是AI行业一个小领域内可梳理的工作内容。

作者：大模型小柒

来源网络博客

题图来自 Unsplash ，基于 CC0 协议，如有侵权，请联系VX：pmtalk123删除

品牌推广｜内容撰写｜广告投放｜培训合作

请添加微信 PMxiaowanzi

//PMTalk推荐的产品设计专栏//

如果你希望学习产品经理进阶内容，可以订阅PMTalk的《简易设计》专栏，系统学习我个人基于创业与10年产品经理经验的产品设计方法：简易设计，通过用户调研&研究、产品拆解、组合、产品迭代、框架定型5个步骤，助你构建产品知识框架，扫码订阅迈向顶级产品专家。

http://mp.weixin.qq.com/s?__biz=MzUzMTk3NjQ0NA==&mid=2247561631&idx=1&sn=7ea1301a910bb9797e3874b6ac82eed7

PMTalk产品经理社区

国内Top的产品经理社区，聚集21W人产品经理、运营、设计师等互联网人成长；全国800+位产品领域大佬入驻签约作者；每年举办70+场产品运营增长活动；你想知道的产品经理知识全部在这儿～

最新文章

关于我是如何成功"驯服"这逆子AI...（1）

AI产品经理背后的技术参数：神经网络

如何考核产品经理的绩效？

产品经理必学新MVP：AI智能体+AI小程序

B端产品经理的6个级别

11月30日，第25期B端产品经理训练营开始报名！

AI产品拆解：notion

医疗产品经理案例：电子病历系统架构设计

1年48款APP产品拆解

大厂采用的产品经理OKR考核设计方式

大厂里里的不同P产品经理薪资待遇

11月30日，第25期B端产品经理训练营开始报名！

AI 在 C 端应用方向及方式的实践探索

6个产品细节剖析，看看高手是如何做设计的！

AI产品经理到底是技术岗还是管理岗?

6个产品细节剖析，看看高手是如何做设计的！

作为面试官，我在面试产品经理时，重点考察的5个能力

产品经理饱和了？

2024年，产品经理婚恋&工作状态问卷调查！（继续收集）

AI产品经理的工作评判标准

产品经理AI基础：什么是 AI Agent

AI产品经理需要了解的数据标注工作

11月30日，第25期B端产品经理训练营开始报名！

一篇文章详细了解AI产品经理工作流程

B 端产品经理，一定要学做AI产品迭代

产品+AI如何设计？大厂高手总结了这3种方案！

AI产品经理 vs 传统产品经理

一个B端系统，新增AI功能的优化案例

4个步骤：明确AI产品需要的数据分析

AI产品经理 vs 传统产品经理

年薪98w！真心建议产品人冲一冲新兴领域，工资高前景好！

从4个方面详细说明什么是多模态AI

4个步骤：明确AI产品需要的数据分析

2024年，产品经理婚恋&工作状态问卷调查！（继续收集）

产品经理必须要了解的基础知识：多模态AI

一个B端产品的产品拆解

拆解去哪儿网

某腾讯员工：发现leader是大专毕业的，怎么办？

2024年，产品经理婚恋&工作状态问卷调查！（继续收集）

一个RAG的产品设计项目复盘

AI提效实践：产品经理如何用GPT-4O的多模态能力提高工作效率？

简单聊聊业务思维与产品思维

知乎高赞：ChatGPT 的出现，对产品经理的思维有什么影响？

初级、中级、高级产品经理的工作区别

AI+时代，浅谈产品经理对图像识别技术的阈值控制

10张图，全解析SaaS的用户分层工具怎么做？附用户分层方法论

产品经理要了解的数据标注工具

2024年，产品经理婚恋&工作状态问卷调查！（继续收集）

以HIS为例，如何撰写产品手册

产品经理，转型做医疗行业，好吗？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉