58
社会计算化与规划数据挖掘
01.万物都是数
柏拉图早就指出:数学是通向理念世界的准备工具。数当作万物的始基和原型。毕达哥拉斯认为:万物都包含数,万物都是数。在当今时代,数据则继劳动、土地、资本之后构成第四种生产要素,数据成为文明的基石,在数据成为财富的宏观环境下,温习上列两位科学家的论述,会让人感到親切而不陌生。
万物的根本关系是数量关系。找到这些数量关系,就找到了现实世界的存在与发展的动因。对事物进行定量分析己成为重要的现代科学研究方法,既使那些以往只能进行定性描述的人文科学、社会科学也处于向定量化发展的进程中。
数学不仅是一种知识或技能,而且是一种思维方式。当今世界已进入“科学数学化”的时代。联合国专家小组研究报告中指出:未来将”一切都从计算开始,又都回到计算上来”。“如果人们找到使用这些数字的钥匙,那么除了感情之外,这些数字可以说明一切、表达一切、显示一切、输送一切、归还一切、传抪一切”。
02.变化世界中的不变性
科学技术史业已表明,学科的分化和综合存在着互补效应,综合的水平取于分化的水平,在综合的基础上又会生出更深层次的分化。柏拉图指出:数学是研究变化世界的不变关系,以数学为基础去观察客观世界。在发展千变万化的世界里,存在着某些不变的东西,如形成每1克干物质需要固定4.25千卡太阳能,而1克植物碳水化合物完全燃烧时所释放的能量也正好是4.25千卡。在不确定性之中寻找确定性是任何类型规划的核心任务。
03.为什么要用概率来描述隨机现象?
规划编制中经常应用数理统计来处理以概率来描述的随机变量。数理统计是以随机变量研究对象的。随机事件在一定条件下可能出现也可能不出现,这只是其偶然性的一面,随机事件还有规律性的一面,它可以通过多次重复试验观察到。A为隨机事件,n为试验次数,m为事件出现次数,则比值m/n即为实验中事件A出现的概率。
这里产生一个问题:随机事件到底是事件本质上的随机,还是由于对系统缺少足夠的信息而造成的表象?具体来讲,向空中抛一枚硬币,观察其正面还是反面。一般认为,这是一个随机现象,正面或反面出现的概率为1/2。但是,如果我们对每一次抛硬币出手的位置、速度、加速度、空气密度以及风速等影响因素都能精确了解的话,那么,我们就能根据物理定律对硬币出手后每一时刻的运行状态进行精确地计算,这样硬币落地时是正面还反面就成为确定性事件,而不是随机事件了。因此,可以认为,抛硬币带来的隨机性,只不过是由于我们对硬币的信息了解不够而造成的表面上的随机性。
04.深度学习与深度挖掘
在以上叙述中,会出现不完全观测和不完全建模两种现象,为此,需要通过深度学习来加以克服。
所谓不完全观测,就如硬币在左手还是在右手,对我来说,这是确定的;对你来说,却是不确定的,因为你没有我了解的信息多。
所谓不完全建模,是指所建模型可能忽略了真实世界的一些信息所造成的不确定性。
在深度学习领域,解决问题的思路不再是直接针对问题本身进行编程,而是先设计一个能自我学习的神经网络,然后把大量的数据输入到这个网络中去,这个过程称作纠错。在这个网络中能夠从数据集中学习到数据的内部结构和规律,从而最终有能力对原问题中新出现的数据给出预测的数学解。
从统计学的观点而言,神经网络用来训练的数据集相当于样本,而学习的过程相当于对总体信息进行统计推断中的最大似然估计。
人工神经网络(ANN)是一个函数,它接受一个输入张量x,并将其映射一个输出y-hat,试图估计一个真实的值y,最佳的P是那些能使y和y-hat之间的误差最小的参数。
05.社会计算是一门新兴技术
社会计算是一门新兴技术,社会的计算化,计算的社会化,己成为当今计算数学重要的发展趋势。基于互联网的数据足迹,大量原本不可追踪、检索、汇编、计量和运算的社会活动,变得成为可能的活动。
社会计算的具体内容:
1)计算什么?设置社会计算的目标和任务,即“议程设置”问题,包括议程的优化次序和安排、不同人群和阶层的利益偏好。
2)怎么计算?。确定一个数学问题,构建数学模型及求解与成果分析。
3)谁耒计算?专业人员与公众参与相结合,反复印证结果。对模型运算进行全面和坦诚的披露,有助于数学模型工具保持其价值。
确定模型为社会服务的原则:1)了解假设的不确定性。评估模型的不确定性和敏感性,避免误用不适合目标系统的模型。2)关注参数的复杂性。复杂性是相关性的敌人,关注参数选用与目标函数之间的误差。没有任何一种模型能夠满足所有目标。3)结果的充分解释。虚假的精确会增加虚假的确定性。不确定性的不透明会损失信任。4)敢于承认未知。承认未知是美德,模型可隐藏未知,要敢于承认未知,便于人为施策,以防莫测后果。
06.规划面对客观世界的不确定性
客观世界的不确定性主要来源于客观世界中无数个主体的运动,它们之间的相互作用和影响,以及它们和不断变化的环境之间的相互作用。由于这三个方面都带有一定的随机性,再加上人们认识客观世界能力的局限,难以实时把握每个主体的状态及变化趋势,因此,人们只能从总体上大致把握客观世界发展的长远趋势,并据以策划应当采取的行动。
根据钱学森关于总体设计部的构想,有专家建议设立负责全面策划和统筹协调的总体设计部门。
所谓全面策划,就是协助领导者确定国家长远发展的目标体系及其优先顺序,并将领导者的定性价值观及对未耒的设想转化为定量的指标体系。
所谓统筹协调,就是协助领导者进行资源配置及政策制定,并将经过领导者批准的目标体系及其优先顺序转化为可执行的计划草案。
在规划实施期内,不确定性因素和未曾预计的因素均可发生变化,在资源配置和用地组织结构赋予一定的“弹性”,以保证用地组织结构形式上不要封死,而在布局形态上留有出路,在用地面积上留有余地,能屈能伸。
07.定性变量及其相互关系的量化技术
规划中经常会遇到一些定性变量,其特点是它们的状态不能直接用数值耒表示,如社会制度、运输方式、灾害的严重程度、群众的满意程度等,这些变量的相互关系,如因果关系、相关关系、主从关系、消长关系等,也相当复杂,都需要经过量化处理才能建立数学模型并进行计算机运算。传统方法是通过分级、对比、排序等项处理将各个定性变量的状态化为一维向量(通常是等间距),再进行回归分析、判别分析或对应因子分析等处理,以得出其数量关系。上列方法仅适用于有序的定性变量。
对于无序的定性变量可采用多维标度法(MultidimensionalSca丨ing,MDS)进行量化处理。具体将各个定性变量相互关系加以相互比较,从而得到各种相似的或非相似的度量,然后将各变量的状态定量表示为欧氏空间中的点,以便于进一步分析各变量间的种种关系,如应用关联系数表示其间的相似性及非线性关系的强弱等。(2024年10月10日)
作者:王万茂
单位:南京农业大学土地管理学院
购买方式
【天猫·中国农业出版社旗舰店】
保存下方图片,打开淘宝APP,扫码即可
王万茂学术交流网
王万茂教授的学术交流平台
长按左侧二维码关注我们
点击 “阅读原文” 购买或在线阅读!