01|背景意义
01
研究背景
伴随着数字时代的到来,科学技术发展迅速,手机等智能电子设备走进千家万户,那些在过去看起来遥不可及的视频通话、网课等等已经是大部分人们的日常,数字技术已经遍布在我们生活的方方面面。但在我们迎接着数字时代的到来的同时,却仍有那么一批人在时代的洪流中举步维艰。在生活中,我们不乏看到新闻报道老年人求助年轻人如何使用输入法打字,如何使用微信支付,如何用智能手机刷新闻等等,更甚的是,有关于针对老年人的数字诈骗案件屡见不鲜……老年人群体在时代面前面对着一条巨大的“数字鸿沟”,这不仅让本就需要更多关爱的老年人群体变得落寞,也存在着极大的安全隐患。当我们走在前面的同时,却也不该忘了回头看看他们的身影。
基于此,本文以CGSS 2021中国综合社会调查数据作为研究基础,采用对数据进行logistic回归分析和线性回归分析的方法,对影响国内“数字鸿沟”现象的因素进行探索。同时,本研究也采取了数据可视化的方法,将各影响因素对“数字鸿沟”现象的影响程度更直观地展示出来。
本研究希望能够通过该数据引起更多人对国内老年人“数字鸿沟”现象的重视,帮助老年人更好地拥抱数字生活。
02
文献综述
在本研究之前,“数字鸿沟”现象已经引起了不少学者的注意。通过对2023年我国数字鸿沟CNKI中文期刊文献的计量分析,可以看出数字鸿沟研究在我国已经取得了显著的成果。随着数字化进程的加快,数字鸿沟问题逐渐凸显.学者们对数字鸿沟的研究也日益深入,涉及其内涵、测量方法和形成因素等诸多方面【1】。目前,有研究发现老年人常遇到的“数字鸿沟”问题主要由三方面涵盖,一是移动支付背景下老年生活受阻;二是老年人就医难;三是对于网络信息难辨真伪【2】。同时,也有不少学者已经尝试提出关于解决老年人“数字鸿沟”困境的方法:一是关注老年人在数字使用中的主体性,辅以多样化的政策工具;二是尊重老年人的数字需求与使用习惯,确保数字技术应用的便捷性和可访问性;三是推动数字资源的公平分配,减少老年人在数字融入过程中的不平等现象【3】。从关注现象到发现问题再到解决措施,国内学者对该现象的关注度较高。
通过以上文献可以看出,当前老年人确实面临着“数字鸿沟”这一难题,且该问题并未有很大程度的改善,国内学者多从政策、技术、社会等角度来进行影响分析,但目前可以看到,利用家庭及老年人个人层面的相关数据对老年人“数字鸿沟”现象影响的研究较少。基于此,本文将通过CGSS 2021中国综合社会调查数据对分析及可视化,从家庭及个人层面探究影响国内“数字鸿沟”现象的因素,希望能为国内“数字鸿沟”现象治理提供新的思路和方向。
02|模型构建及方法
本文通过使用python对CGSS2021中国综合社会调查数据分析,利用数据可视化生成饼状图,以此直观地反应老年人“数字鸿沟”现象的程度,并利用logistic回归分析以及线性回归研究老年人个人原因及家庭原因对该现象的影响,最后通过绘制系数图及countplot来更直观地展示自变量与因变量间的影响关系。
03|数据分析
1
数据获取
通过对文件的读取,获取文件中每一列的数据类型,以便于后续的数据分析及可视化。
图 1 数据类型获取
2
基于数据可视化的现象分析
通过对A29(在以上媒体中,哪个是您最主要的信息来源?)的数据进行可视化,其中,1代表报纸,2代表杂志,3代表广播,4代表电视,5代表互联网(包括手机上网),6代表手机定制消息,其他代表不知道,拒绝回答以及空白数据。
首先对所有年龄段的主要信息来源进行分析,生成饼状图,如图2所示。可以发现,对于所有年龄段来说,最主要的信息来源获取方式是通过互联网(包括手机上网)。
图 2 所有年龄段的主要信息来源
再通过筛选年龄在60岁以上(世界卫生组织定义:老年人是指60~74岁之间的年龄,高寿老年人是指74~90岁之间的年龄,长寿老年人的年龄在90岁以上。)的数据,生成饼状图,如图3所示。根据世界卫生组织标准,60岁以上年龄段属于老年人,这类人群获取信息的最主要方式仍是电视,而非互联网等新数字平台。
图 3 60岁以上年龄段的主要信息来源
同样,本文还选择了A30a(您有没有归自己单独使用的手机?)以及A30b(在最近半年,您上过网吗,包括使用电脑、手机、智能穿戴等各种设备上网?)中,年龄在60岁以上的数据生成饼状图,得到图5及图6,其中,1代表有/上过,2代表没有/没上过。我们发现,老年人群绝大多数都有自己单独的手机,但在最近半年内没上过网的人数却是上过网人数的二倍,这表明:尽管老年人拥有数字手机,却无法完全理解应如何使用,存在“数字鸿沟”现象。
图 4 60岁以上人群手机使用情况
图 5 60岁以上人群在最近半年上网情况
3
自变量、因变量及衡量指标的确定
自变量:A2(性别);A8a(收入);受教育程度,以问卷中A7a(您目前的最高教育程度是:)作为衡量指标;家庭成员接触网络情况,以问卷中A30c(在最近半年,您家里其他的人上过网吗,包括使用电脑、手机、智能穿戴等各种设备上网?)作为衡量指标。
因变量:“数字鸿沟”现象,以问卷中A29(在以上媒体中,哪个是您最主要的信息来源?)、A30a(您有没有归自己单独使用的手机?)以及A30b(在最近半年,您上过网吗,包括使用电脑、手机、智能穿戴等各种设备上网?)作为衡量指标。
4
基于数据可视化的回归模型分析
1. 分类变量
因为A7a与A29为文本型变量,因此需要先将文本型变量转换为数值型,以便于后续回归模型的建立与分析。
图 6 数据类型转换
之后,通过建立logostic回归模型,对A2及A29进行分类预测,建立并评估模型的预测准确性。如图7所示,可以得出A2与A29建立逻辑回归模型的准确率为0.58,说明建立的模型并不算显著,性别对老年人获取信息来源有影响但影响不大。
同样,如图7、图8,本文探究了受教育程度与家庭成员接触网络情况另外两个自变量与老年人信息获取来源的逻辑回归模型准确率,分别为0.68与0.59。这表明受教育程度与老年人信息获取来源的逻辑回归模型的准确率处于中等水平,具有一定的预测能力;而家庭成员接触网络情况建立的模型并不显著,家庭成员接触网络情况对老年人获取信息来源有影响但影响不大。
图 7 性别与老年人信息获取来源的逻辑回归模型准确率
图 8 受教育程与老年人信息获取来源的逻辑回归模型准确率
图 9 家庭成员接触网络情况与老年人信息获取来源的逻辑回归模型准确率
随后,本研究也对性别、受教育程度、家庭成员接触网络情况对老年人有没有归自己单独使用的手机、老年人在最近半年,是否上过网,包括使用电脑、手机、智能穿戴等各种设备上网进行了逻辑回归检验,检验结果如图10所示。可以看出,自变量与老年人有没有归自己单独使用的手机的逻辑回归模型准确率较高,说明模型预测性好。而自变量与老年人在最近半年上网情况的逻辑回归模型准确率处于中等水平,说明模型预测性一般。
图 10 自变量与其余因变量的逻辑回归模型准确率
为了能够更直观地发现自变量与因变量之间的关系,本研究选取了模型准确率较高的A30a以及A30b与自变量绘制系数图。
通过图11可以看出,图中从上到下排列了三个条形,分别对应了A2、A7a和A30c这三个特征的系数值。每个条形的高度直接反映了其系数的大小和符号。
通过这个条形图,我们可以直观地比较三个自变量对A30a的影响。其中,'A2'和'A7a'对因变量有正向影响,而'A30c'有负向影响。'A30c'的影响强度最大,其次是'A2','A7a'的影响相对较小。图12同理。
图 11 自变量与A30a的逻辑回归系数图
图 12 自变量与A30b的逻辑回归系数图
2. 连续变量
在自变量中,A8a是连续变量,因此我们选择线性回归模型进行分析。通过对三个线性回归模型的系数分析,发现三个模型的解释能力都非常有限,系数都非常小,几乎可以忽略不计,这表明收入与三个因变量之间的关系非常弱。因此,可以认为老年人收入对“数字鸿沟”现象几乎没有影响。
图 13 收入与A29的线性回归系数
图 14 收入与A30a的线性回归系数
图 15 收入与A30b的线性回归系数
3.countplot可视化
由于前面通过逻辑回归检验对分类变量对“数字鸿沟”现象的影响不够直观,因此本研究选择使用countplot,筛选出年龄超过60岁的数据子集,创建了一个条形图来展示在年龄超过60岁的群体中,不同自变量类别与不同因变量类别之间的关系。
通过对三组图的分析,可以发现老年人性别对老年人“数字鸿沟”现象没有影响,其不是影响因素。
在第一组图中,可以看出,受教育程度为未接受过教育、中专或技校的老年人,获取信息主要来源为电视,且获取信息主要来源为电视的人群主要分布在这两类学历水平的老年人中。而获取信息主要来源为互联网的老年人主要分布在技校、大学专科(正规高等教育)中,受教育程度略高于一些;在第二组图中,同样分析可以看出没有自己手机的老年人主要分布在教育程度较低的老年人群众;在第三组图中可以看出,近半年没有上网的老人主要分布在没有接受过教育等较低教育水平的老年人中。因此,可以认为老年人“数字鸿沟”现象与受教育程度有关。
在第一组图中,可以看出获取信息主要来源为互联网的老年人主要分布家庭成员上网的老年人群中;在第二组图中,可以看出家庭成员上的老人有自己手机的比例更高;在第三组图中可以看出家庭成员不上网的老年群体中不上网的老人的比例远高于上网的老人比例。因此,可以认为老年人“数字鸿沟”现象与家庭成员上网情况有关。
图 16 自变量对A29的影响条形图
图 17 自变量对A30a的影响条形图
图 18 自变量对A30b的影响条形图
04|总结与反思
通过对CGSS2021中国综合社会调查数据的分析,可以初步得到以下结论:
1. 老年人的“数字鸿沟”现象现在仍然存在着,并且伴随着数字诈骗技术不断升级,安全隐患与风险越来越大,但老年人的并未能够有效地跟上数字化时代的发展。
2. 老年人的性别、收入对与老年人“数字鸿沟”现象影响较小。
3. 老年人的受教育程度对老年人“数字鸿沟”现象有影响。这启示我们可以通过推广“老年大学”,以及在老年大学里推出相应数字教育和培训来推动跨越“数字鸿沟”现象。
4. 老年人的家庭成员上网情况对老年人“数字鸿沟”现象有影响。家庭成员的上网情况影响了老年人的上网情况,家庭成员首先要积极的去面对数字变化,多给予老年人一些指导与耐心,帮助他们拥抱数字生活。
本文中仍然存在不足,例如对数据的分析与处理不够仔细,在某些变量的逻辑回归模型中准确率较低,模型拟合优度低,建模最终的结果的并未达到预期。同时,本文也没有探索更多的自变量,如地区等因素,未来还可以进行更深入的分析。
05|参考文献
【1】董江苹,徐华.我国数字鸿沟研究热点与发展趋势——基于CiteSpace知识图谱可视化分析[J].西安文理学院学报(自然科学版),2024,27(03):45-55.
【2】章婷.协同治理理论视角下老年人数字鸿沟治理研究[J].经济研究导刊,2024,(10):107-110.
【3】宋月萍,彭可余.面向老龄化的数字社会治理:现实、演变与未来进路[J].江西社会科学,2024,44(05):118-128.