这是一篇“胶我选”创始人Rock在2017年发布的公众号文章,虽然那时的“胶我选”数据库只是一个框架,但是当年AI战胜棋王柯洁时的初露锋芒已然让我们看到了机器学习将会如何深刻改变包括胶黏剂在内的诸多行业!
数年后的今天“胶我选”终于升级到了2.0版本,虽然改进空间依然巨大,但距离愿景又近一步。在此特重发此文,与您再道初心以自勉!
“胶我选”的初心是什么
“胶我选”测试版上线后很多人问我,你们的商业模式是什么?是撮合吗?是联合经销商卖货吗?有门路能拿到3M特价吗?等等问题不一而足。面对这些问题,有的时候我们真的需要跳出这个传统的行业,从更高的视角看看外面的世界究竟在发生什么变化。Alphago打败了围棋世界排名第一的柯洁,据说已经开始对我曾经非常喜欢的《星际争霸》进行AI训练了。相信在不远的未来,机器学习和人工智能必然也能成为我们材料行业不可或缺的生产力工具!而我们也正是基于这个初心才有了开发“胶我选”平台的念头!我们的目的绝不仅仅充当一个下载站,而是将智能这个词真正体现在这个传统行业中,做一个机器学习的先行者。
“专家”是怎样炼成的?
首先,大家是否有考虑过行业内的专家们都是如何进行胶黏剂选型的?这个问题在我开始接触机器学习的原理之后就一直萦绕在脑中,现在想来无非遵循着这样的步骤:3)针对成熟应用,掌握场景中核心参数,建立参数的推理逻辑;5)成功或失败的验证都成为经验,这些经验的输出可能是文献、是研究报告、是专利,也可能只是记忆;一个初级的工程师所做的无非就是这些步骤的不断重复逐渐积累经验,再将经验转化为套路进而能更快的进行复杂场景的判断,直至成为专家。如此看来,所谓专家其本质就是在细分领域中懂得套路最多,并积累最多关联知识的人。而这个套路就是算法,这个关联知识就是结构化数据。但是人的精力和时间总是有限的,我们还要生活、还要娱乐。而机器的精力和时间则是无限的,总是无时无刻不在工作。因此人工智能的快速发展让我坚信,终究有一天人类的工作将主要集中在探索未知领域。当然前提是,机器学习能帮我们大幅的提高完成1-5步骤的执行效率,从而将人从例行工作中解脱出来。所以一切的开始来自于让机器对现有的产品档案进行自动分类。人们记不住那么多纷繁复杂的细节,于是通过分类,将模式提取出来,以便进行快速的计算。从数学意义上讲,分类就是在一个封闭的数据空间内,按照某种维度和逻辑寻找产品数据层面上的分布结构。那么人类又如何进行分类?当然是根据特征,不同的类具有不同的特征。比如,看到一个汉高公司的datasheet,产品是液态、丙烯酸体系、双组份、混合比例10:1,我们当然可以预判出来,这是一款MMA结构胶。再结合粘度、pot life、气味、粘接强度这些特征,我们可以再进行细分至这是一款LSE粘接胶、还是普通的丙烯酸酯结构胶、亦或具有导热导电特性的功能胶水。这些可以决定产品分类的,我们称之为特征属性。与可量化的特征属性值相关联的还有属性值的度量衡系统,用于属性值之间的相互匹配关联。这个分类的过程即是一个典型的决策树。只要将特征与分类标签建立起关联,便可以进行初级的自动分类,所以属性设计是学习系统的重中之重!而这也恰恰是”胶我选“数据库的底层逻辑。就以双面胶带这个品类为例,为了能将其进行一个恰如其分的分类,我们就建立了40个典型属性:每个属性又建立了有松散耦合的维度机制,比如”胶带的180度剥离力“。如此一来,每个产品的数据粒度基本都在100以上!同时后台又支持添加非典型属性以保证系统的可扩展性。所以如果由人工建立起模型再进行分类,这种自动化实现起来不算复杂,可以通过规则引擎也可以通过决策树以及贝叶斯分类来实现。不过自动分类的原理是想起来简单,实施起来会遇到各种各样的问题,单单一个无纺布,在系统中就有这么多的表达方式:可想而知,想要把所有的属性和维度关联起来有多少的数据量需要处理,而且目前自动翻译的API也不能处理这么多专业术语的垂直应用。不过只要属性设计的维度合理,只要数据的颗粒度足够细和完整,我也相信终究有一天非监督式学习下的自动分类也将在“胶我选”的后台中得以应用!欢迎添加作者微信,期待与您多多交流!
【版权与免责声明】本内容为作者个人独立观点,不代表「胶我选」立场。我们致力于保护作者版权,部分图片及信息来自互联网,如果发现本站有涉嫌侵权的内容,欢迎后台留言,本站将立刻删除涉嫌侵权内容。合作事宜请后台留言或联系 pingtaiwangkai@hotmail.com精彩往期
▽