96SEO 2026-02-19 09:53 0
语言#xff0c;以因子分析法和主成分分析法对东北三省居民消费价格指…

在经济发展的大背景下居民消费结构至关重要。
本文围绕居民消费结构展开深入研究运用
语言以因子分析法和主成分分析法对东北三省居民消费价格指数及全国城镇居民消费性支出指标进行分析。
通过数据标准化、效度检验等步骤找到公共因子揭示居民消费结构特点。
在东北三省分析中明确了消费结构的因子及变化趋势全国范围的研究附代码数据则指出娱乐教育文化服务等是影响消费的主要因素且发现消费大小与经济发达程度相关点击文末“阅读原文”获取完整代码数据。
本文还提出提高居民收入水平、改善消费结构、促进线上消费等建议。
这些分析和建议为优化居民消费结构、促进地区经济发展提供了科学依据对政府、企业和居民都具有重要参考价值有助于推动经济可持续发展。
由于直接对居民消费结构的各相关因素变量进行分析会受到多重共线性的影响使得所得模型并不稳定甚至与我们所认知的实际经济现象有所出入。
因此本文将运用SPSS25.0软件以多元统计学中的因子分析法为基础通过对居民消费的各指标进行分析从而找到具有一定一致性的公共因子之后以此为变量进行后续的数据分析。
软件对东北三省居民消费价格指数数据进行消费实例分析并得到公共因子以此为变量研究居民消费结构质量及其变化趋势。
在各种关于居民消费的指标中居民消费价格指数最能体现消费水平的波动即能够反映居民在商品劳务等的消费过程中的满足程度。
按照上一章描述的统计分析方法步骤对东北三省的居民消费价格指数近三年数据取平均数后进行后续的分析本文数据来源于国家统计局网站的分省月度数据。
对原始数据做标准化处理使得原始数据化为均值为0方差为1的数据。
之后步骤皆以标准化后的数据作为样本进行分析。
首先以标准化后的数据为变量进行运算得到它们的样本相关性系数矩阵
x1x2x3x4x5x6x7x8相关性x11.000-0.623-0.739-0.472-0.469-0.090-0.4190.935x2-0.6231.0000.9140.8470.6190.6410.179-0.548x3-0.7390.9141.0000.9340.7900.6920.487-0.632x4-0.4720.8470.9341.0000.8470.8560.527-0.366x5-0.4690.6190.7900.8471.0000.5800.765-0.490x6-0.0900.6410.6920.8560.5801.0000.3080.107x7-0.4190.1790.4870.5270.7650.3081.000-0.408x80.935-0.548-0.632-0.366-0.4900.107-0.4081.000显著性单尾x10.0000.0000.0020.0020.2990.0050.000x20.0000.0000.0000.0000.0000.1440.000x30.0000.0000.0000.0000.0000.0010.000x40.0020.0000.0000.0000.0000.0000.013x50.0020.0000.0000.0000.0000.0000.001x60.2990.0000.0000.0000.0000.0320.264x70.0050.1440.0010.0000.0000.0320.006x80.0000.0000.0000.0130.0010.2640.006
从上述矩阵可以观察到所选八个消费支出指标间相关系数绝大部分比0.3要大且显著性概率小于0.05通过显著性检验说明要研究的数据适合做因子分析。
再利用KMO与Bartlett球形度检验且根据KMO的一般度量标准度量值越接近1表明效果越好。
最初数据总方差绝对值为1提取后的因子总方差越接近于1说明公共因子对原始变量的信息丢失度越少解释越充分。
所选数据的7个原始变量提取后的共同度即解释有效性都在0.7以上且大多数在0.9以上说明提取后的公共因子对于原始数据解释度大于70%信息提取充分。
本次实验共提取出样本相关系数前2个公共因子采用了特征值大于1为选取标准最后得到的两个公共因子累计方差贡献率达84.31
最初得到的因子载荷矩阵各因子没有典型代表性因此为了得到各个公因子的经济意义继续进行因子旋转所采用的方法是最大方差法目的是使得因子载荷在取得平方项后的值向0、1方向靠近更好更直观地找到每个因子所表达的经济含义原理是降低因子综合性增加解释度。
所得到因子载荷矩阵见表。
成分12Zscore(生活用品及服务类)0.958-0.268Zscore(教育文化和娱乐类)0.9550.201Zscore(居住类)0.814-0.550Zscore(交通和通信类)0.778-0.417Zscore(衣着类)0.746-0.443Zscore(医疗保健类)0.462-0.421Zscore(其他用品和服务类)-0.1020.987Zscore(食品烟酒类)-0.2340.935
结合各指标的具体经济含义对每个因子给出合适的经济意义概括应该选取相关系数绝对值较大的这说明了此因子对该变量的代表性越强以上所得到的新的两个因子从更低维度但全面地展现了居民消费支出的情况同时也反映出居民支出由基本生存逐步发展的趋势。
第一因子对原始数据方差贡献率达到几乎50%这可以说明东北地区的居民消费支出已经在向食品之外的类型。
R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标
之后根据表4利用主因子与方差贡献率可以知道他们的方差贡献率为第一个因子是49.18%第二个因子是35.13%由此得出综合评分函数如下
对于借助软件得到的因子得分结果中的数据进行选择性提取找到具有代表性的数据结果见表3-7。
时间FAC1FAC2F2018年6月0.5906-0.92813-0.042018年12月0.70039-0.849050.052019年2月0.75891-0.484420.22019年4月0.82016-0.311390.292019年12月0.366360.432420.332020年1月0.184861.664910.682020年6月-0.435451.345620.262020年12月-1.079940.57819-0.332021年1月-2.7612-1.5676-1.91
其中FAC1FAC2分别代表两个因子相应的的消费支出类别方面的得分F代表总消费结构得分。
从中可以看出虽然东北地区以消费为主的第二因子在20182019两年几乎始终位于平均水平之下但整体结构上两个因子在这两年间整体均呈现上升趋势但是自1999年末之后F1发展因子开始出现明显下滑而以食物为主体的F2生存因子出现瞬间暴涨后飞速下跌这主要受到了新冠疫情的影响截止到目前两因子得分甚至不如2018年初说明该地区当前经济仍未回转。
以上分析所发现的东北地区城镇居民消费结构产生的状况我们需要从多方面着手研究从而得到问题的解决措施结合实例分析所得到的结果也要考虑当地经济社会发展情况。
居民消费结构的优化在收入水平的高低的影响因素中占有相对重要的地位这是由于居民收入水平的高低决定了它对于所需求商品的支付能力所以为了优化地区的居民消费结构可以针对居民收入水平的提高做出一定的对策。
对此我们可以通过增加就业岗位鼓励就业创造良好的就业环境以此来增加该地区的居民收入或者通过政府为企业就业岗位提供一些友好的政策提升劳动者的入职积极性。
想要对居民消费结构进行优化就要在满足居民生存性消费的基础之上对于发展以及享受型消费加大投入使得居民消费的结构化更加合理以推动地区的发展的更好适应。
对于不同的消费领域还要给予相关经济投入以及政策支持在住房方面控制房屋价格上涨保障一般居民的住房问题在医疗方面加强基础医疗体质的便利同时也要关注居民在娱乐、旅行等服务业的需求。
同时也要让各个产业自身积极创新并提升服务质量。
由于新冠疫情的出现打破了人们原先的生活节奏居民的各方面消费支出受阻校园学习、日常办公等都被迫转移到了线上因此在日常线下的消费开始迅速减少线上经济例如学生网课、外卖餐饮领域开始茁壮发展。
所以我们应该顺应当前趋势积极促进线上消费的发展逐步恢复居民对于消费的活力并在稳定经济运行的前提下快速回转。
R语言、SPSS基于主成分分析PCA的中国城镇居民消费结构研究可视化分析|附数据代码
以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等
娱乐教育文化服务、交通通讯、家庭设备用品、居住、食品是影响消费大小变动的主要因素
首先在源变量框中选中需要进行分析的变量点击右边的箭头符号将需要的变量调入变量Variables栏中。
在本例中全部8个变量都要用上故全部调入图4。
因无特殊需要故不必理会“Value”栏。
下面逐项设置
单击Descriptives按钮图4弹出Descriptives对话框。
descriptives复选项则输出结果中将会给出原始数据的抽样均值、方差和样本数目这一栏结果可供检验参考选中Initial
solution复选项则会给出主成分载荷的公因子方差这一栏数据分析时有用。
Matrix栏中选中Coefficients复选项则会给出原始变量的相关系数矩阵分析时可参考选中Determinant复选项则会给出相关系数矩阵的行列式如果希望在Excel中对某些计算过程进行了解可选此项否则用途不大。
其它复选项一般不用但在特殊情况下可以用到本例不选。
打开Extraction对话框。
因子提取方法主要有7种在Method栏中可以看到系统默认的提取方法是主成分因此对此栏不作变动就是认可了主成分分析方法。
matirx复选项则因子分析基于数据的相关系数矩阵进行分析如果选中Covariance
matrix复选项则因子分析基于数据的协方差矩阵进行分析。
对于主成分分析而言由于数据标准化了这两个结果没有分别因此任选其一即可。
solution非旋转因子解复选项则在分析结果中给出未经旋转的因子提取结果。
对于主成分分析而言这一项选择与否都一样对于旋转因子分析选择此项可将旋转前后的结果同时给出以便对比。
Plot“山麓”图则在分析结果中给出特征根按大小分布的折线图形如山麓截面故得名以便我们直观地判定因子的提取数量是否准确。
主成分计算是利用迭代Iterations方法系统默认的迭代次数是25次。
但是当数据量较大时25次迭代是不够的需要改为50次、100次乃至更多。
对于本例而言变量较少25次迭代足够故无需改动。
variables栏则分析结果中给出标准化的主成分得分在数据表的后面。
至于方法复选项对主成分分析而言
对于主成分分析而言旋转项Rotation可以不必设置对于数据没有缺失的情况下Option项可以不必理会。
Matrixa消费支出食品烟酒衣著居住生活用品及服务交通通信教育文化娱乐医疗保健其他用品及服务Correlation消费支出1.000.873.499.960.838.872.860.715.906食品烟酒.8731.000.262.811.663.755.620.396.751衣著.499.2621.000.377.646.424.355.606.649居住.960.811.3771.000.774.761.825.657.861生活用品及服务.838.663.646.7741.000.685.730.608.804交通通信.872.755.424.761.6851.000.774.624.727教育文化娱乐.860.620.355.825.730.7741.000.735.743医疗保健.715.396.606.657.608.624.7351.000.694其他用品及服务.906.751.649.861.804.727.743.6941.000a.
Matrix(相关系数矩阵)一般而言相关系数高的变量大多会进入同一个主成分但不尽然除了相关系数外决定变量在主成分中分布地位的因素还有数据的结构。
相关系数矩阵对主成分分析具有参考价值毕竟主成分分析是从计算相关系数矩阵的特征根开始的。
在Communalities(公因子方差)中给出了因子载荷阵的初始公因子方差Initial和提取公因子方差Extraction
CommunalitiesInitialExtraction消费支出1.000.975食品烟酒1.000.659衣著1.000.362居住1.000.860生活用品及服务1.000.770交通通信1.000.754教育文化娱乐1.000.764医疗保健1.000.605其他用品及服务1.000.864Extraction
征根中给出了按顺序排列的主成分得分的方差(Total)在数值上等于相关系数矩阵的各个特征根λ因此可以直接根据特征根计算每一个主成分的方差百分比%
%16.61373.47973.4796.61373.47973.4792.99211.02784.5063.5556.16290.6684.2983.31393.9805.2592.87996.8596.1311.45498.3147.088.98099.2948.064.706100.00098.213E-119.125E-10100.000Extraction
主成分的数目可以根据相关系数矩阵的特征根来判定如前所说相关系数矩阵的特征根刚好等于主成分的方差而方差是变量数据蕴涵信息的重要判据之一。
根据λ值决定主成分数目的准则有三
Explained表中可见第一、第二和第三个主成分对应的λ值都大于1这意味着这三个主成分得分的方差都大于1。
本例正是根据这条准则提取主成分的。
Explained表可以看出前三个主成分对应的λ值累计百分比达到89.584%这暗示只要选取三个主成分信息量就够了。
Plot上可以看到第4个λ值是一个明显的折点这暗示选取的主成分数目应有p≤4。
那么究竟是3个还是4个呢根据前面两条准则选3个大致合适但小有问题。
Matrix成分矩阵中给出了主成分载荷矩阵每一列载荷值都显示了各个变量与有关主成分的相关系数。
以第一列为例0.885实际上是消费支出与第一个主成分的相关系数。
MatrixaComponent1消费支出.987食品烟酒.812衣著.601居住.928生活用品及服务.877交通通信.868教育文化娱乐.874医疗保健.778其他用品及服务.930Extraction
Mei对本文所作的贡献表示诚挚感谢。
她本科毕业于山西财经大学金融数学专业硕士就读于华北电力大学应用统计专业。
会用
Python、MATLAB在数理统计和数理金融方面有扎实的知识基础。
在公众号后台回复“领资料”可免费获取数据分析、机器学习、深度学习等学习资料。
语言因子分析FA、主成分分析PCA对居民消费结构数据可视化分析》。
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况
R语言用lme4多层次混合效应广义线性模型GLM逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析
R语言用线性模型进行臭氧预测加权泊松回归普通最小二乘加权负二项式模型多重插补缺失值
R语言多元时间序列滚动预测ARIMA、回归、ARIMAX模型分析
R语言用lme4多层次混合效应广义线性模型GLM逻辑回归分析教育留级调查数据
R语言用Rshiny探索lme4广义线性混合模型GLMM和线性混合模型LMM
使用SASStataHLMRSPSS和Mplus的分层线性模型HLM
R语言惩罚logistic逻辑回归LASSO,岭回归高维变量选择的分类模型案例
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
R语言惩罚logistic逻辑回归LASSO,岭回归高维变量选择的分类模型案例
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback