AI+时代,浅谈产品经理对图像识别技术的阈值控制

文摘   2024-11-01 08:01   四川  

在AI领域,图像识别技术扮演着至关重要的角色。

对于产品经理来说,理解图像识别技术的原理是基础。图像识别技术的核心在于信息处理,它与人类视觉识别的原理相似,需要依赖对图像的记忆来进行识别。人类大脑通过提取图像特征并与以往的图像认知进行比较,从而快速识别图像。同样,计算机在图像识别过程中,首先对图像进行分类,提取重要信息,排除冗余信息,然后根据存储的记忆进行识别。图像特征的提取对图像识别的准确性和效率至关重要,而计算机提取的图像特征的不稳定性可能会影响识别的效果。

接下来,我们分析当前AI+时代中常见的两种图像识别技术:神经网络图像识别技术和非线性降维图像识别技术。

1. 神经网络图像识别技术

神经网络,全称人工神经网络,是一种模拟生物神经过程的计算结构,它并不完全模仿人脑的神经网络,而是通过抽象和简化来提高计算效率。

神经网络图像识别技术依赖于神经网络学习算法。在应用神经网络进行图像识别之前,需要对图像进行预处理,包括转换为灰度图、旋转、放大和归一化等。为了实现有效的图像识别,还需要根据识别领域和对象设计神经网络,包括输入层、隐含层、输出层的设计,以及初始权值和期望误差的选取。

在设计神经网络时,输入层通常根据识别对象的需求来确定问题和数据表示方式。隐含层的设计涉及到确定层数和单元数,业界已经确认增加隐含层神经元数目可以提高误差精度。输出层通常设计为多输出型。初始权值通常选择在-1到1之间的随机数,以确保网络在学习过程中的良好收敛。期望误差值的选择需要考虑训练时间和预期误差,通常选择一个较小的值。

设计完成后,需要对神经网络进行训练,以满足图像识别的需求。在实验中,使用MATLAB7.0中的newff函数创建了一个两层网络,包括1个输出神经元、16×16个输入和26个隐含层单元。学习函数选择了learngdm,初始学习速率为0.01至0.6,训练性能函数为“mse”,训练指标为0.001,最大训练循环为2500。

通过实验,我们发现不同数量的隐含层节点直接影响神经网络图像识别的识别率。26个隐含层节点能够满足图像识别的需求。神经网络识别技术在识别过程中表现出准确、快速和强大的抗干扰能力,这些特点使其能够应用于更复杂的图像识别任务,为垂直领域的产品提供服务。


第二:非线性降维的图像识别技术

除了神经网络的图像识别技术外,非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说,其本身属于较为高维的识别技术,这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担,这种负担自然会影响图像识别的速度与质量,非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前,业界最常采用的是线性降维的图像识别技术,这种技术本身具备着简单易于理解的优点,但在实际应用中人们发现,线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性,也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说,其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中,以往受图像维度较高的影响,人类识别系统往往需要耗费大量的时间,计算机系统也往往会受到较大的“摧残”,这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致,而在应用非线性降维的图像识别技术后,人脸图形就能够较好地实现自身的紧凑,这就使得人脸识别系统的工作效率大大提升,总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助,上文中LineLian提到的神经网络的图像识别技术,也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

最后图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展,其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战,最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析,同时运用深度学习算法总结规律,最终得出战胜人类高手的棋招。

图像鉴别,10000 个场控都干不来互联网的开放不仅带来了自由,同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”,代表人物自然是“唐马儒”,但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高,同时在线的直播数量大,一不小心违规的东西就上线了。传统的解决方案是通过人力完成,所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选,如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中,人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性;而在医学领域中,心电图与 B 超的识别将大大促进用户医疗事业的便捷;而在农业领域中,种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量,例如我家种了几十亩葡萄 葡萄需要剪枝 修果 摘叶 需要很多的劳动力, 感觉很多环节可以通过图像识别的机器来处理,粒径不同的果粒,大小不一的叶片,高度不同的枝条,我总觉得可以通过图像对比来区分,筛选,这样的AI图像识别机器人才是刚性需求。在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性,这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能,这些将大大提高用户的生活品质。在未来科学技术的不断发展中,AI的图像识别技术还将实现更为长足的发展,而这一发展也将能够更好地接受图像识别技术产品所带来的服务,最终大大提高用户的生活质量。

产品思维是抓住机遇,需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的,只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维,不仅仅是追随需求,更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生意,即产品一般般也即产品经理做了功能经理,产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点!

作者:LineLian

来源微信公众号:连诗路

题图来自 Unsplash ,基于 CC0 协议,如有侵权,请联系VX:pmtalk123删除


品牌推广| 内容撰写|广告投放|培训合作

请添加微信  PMxiaowanzi 




//PMTalk推荐的产品设计专栏//

如果你希望学习产品经理进阶内容,可以订阅PMTalk的《简易设计》专栏,系统学习我个人基于创业与10年产品经理经验的产品设计方法:简易设计,通过用户调研&研究、产品拆解、组合、产品迭代、框架定型5个步骤,助你构建产品知识框架,扫码订阅迈向顶级产品专家。

 






PMTalk产品经理社区
国内Top的产品经理社区,聚集21W人产品经理、运营、设计师等互联网人成长; 全国800+位产品领域大佬入驻签约作者; 每年举办70+场产品运营增长活动 ;你想知道的产品经理知识全部在这儿~
 最新文章