R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验

科技   科技   2024-12-30 16:37   上海  

全文链接:http://tecdat.cn/?p=32747

随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题点击文末“阅读原文”获取完整代码数据

相关视频


本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。

分析脉络如下:

  • 数据预处理(包括缺失值,异常值,标准化这些)

  • 数据图示

  • 相关性检验正态性检验

  • 做因子分析和聚类分析

查看数据

读取到r软件中:

数据预处理(包括缺失值,异常值,标准化

首先,在进行数据分析前,需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外,为了减少数据误差,需要对数据进行标准化处理。

data=na.omit(data)

标准化和可视化

其次,在数据处理完成后,需要对数据进行图示。通过绘制散点图等图示,可以直观地了解各项指标的数值分布和趋势变化。同时,图示也有助于发现数据中的异常点和趋势漂移等问题。


点击标题查阅往期内容


PYTHON链家租房数据分析:岭回归、LASSO、随机森林、XGBOOST、KERAS神经网络、KMEANS聚类、地理可视化


左右滑动查看更多


01

02

03

04



数据的标准化及适用性检验

然后,进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法,来判断数据是否符合正态分布。通过这些检验方法,可以更准确地分析数据,并确定适当的分析方法。

相关性检验

正态性检验

shapiro.test(data[,2])

信度检验结果

信度检验结果是指对某种测量工具(例如问卷、测试等)进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法,通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验,可以确定测量工具的可靠性和准确性,从而确定测量结果的可信度。信度检验结果可以帮助研究者评估测量工具的质量,以确保研究结果的可靠性和有效性。 

KMO检验:

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO(Kaiser-Meyer-Olkin)检验的主要目的是测量数据集中各个变量之间的相关性,以确定是否存在足够的共性方差,从而确定是否适合进行因子分析。KMO值介于0和1之间,通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6,则表明数据不适合进行因子分析,需要重新考虑数据收集和分析方法。

kmores=kmo(data\[,2:17])\
kmores\$overall
## [1] 0.5985173

因子分析和聚类分析

接下来,进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素,并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类,以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法,用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量,称为因子,这些因子可以解释原始变量的方差。因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。 

旋转成份矩阵

因子得分排名


点击标题查阅往期内容


【视频】因子分析简介及R语言应用实例:对地区经济研究分析重庆市经济指标


左右滑动查看更多


01

02

03

04



K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法,用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中,并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和,从而使得每个类别内部的数据点尽可能的相似,不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂,计算速度快,适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中,可以将公司的各项经营指标作为输入数据,通过K-means聚类算法将公司分成若干类别,同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况,从而做出更明智的投资或经营决策。

memb <- hmod\$cluster

群集成员

cludata

plot(data[,2:17],mem

 综上所述,我国上市公司经营绩效实证研究涉及到数据预处理、图示、检验和分析等多个方面。其中,数据预处理和图示为分析提供了基础和依据,检验和分析则为研究提供了科学性和可靠性保障。通过本文的研究,可以更深入地了解上市公司经营绩效的相关因素,为政府部门和企业提供决策参考。




本文中分析的数据、代码分享到会员群,扫描下面二维码即可加群!



点击文末“阅读原文”

获取全文完整代码数据资料


本文选自《R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验》。




点击标题查阅往期内容

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标
数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况
R语言是否对二分连续变量执行逻辑回归
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
R语言Bootstrap的岭回归和自适应LASSO回归可视化
R语言中回归和分类模型选择的性能指标
R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用
R语言 线性混合效应模型实战案例
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言建立和可视化混合效应模型mixed effect model
R语言LME4混合效应模型研究教师的受欢迎程度
R语言 线性混合效应模型实战案例
R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题
基于R语言的lmer混合线性回归模型
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
R语言分层线性模型案例
R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据
用SPSS估计HLM多层(层次)线性模型模型
R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言有RStan的多维验证性因子分析(CFA)
主成分分析(PCA)原理及R语言实现及分析实例
R语言无监督学习:PCA主成分分析可视化
R语言使用Metropolis- Hasting抽样算法进行逻辑回归
R语言多元Logistic逻辑回归 应用案例
R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
R语言基于树的方法:决策树,随机森林,Bagging,增强树
spss modeler用决策树神经网络预测ST的股票
R语言中自编基尼系数的CART回归决策树的实现
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
matlab使用分位数随机森林(QRF)回归树检测异常值
基于随机森林、svm、CNN机器学习的风控欺诈识别模型
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分



拓端数据部落
拓端(tecdat.cn)创立于2016年,提供专业的数据分析与挖掘服务,致力于充分挖掘数据价值。
 最新文章