如何理解统计分析中的相关关系

在数据分析过程中,经常想知道两个变量之间的关系,我们将不能用数学函数准确度量,但又存在一定规律的关系称为相关关系。

相关关系是一种非确定性的关系,它能够分析变量间的关联程度和关联形式,并且可以在相关分析的基础上,再通过回归分析来确定变量之间的数量关系,进而用于生产控制和预测。

1. 相关关系的特征

相关关系和函数关系的区别在于:相关关系是变量间不确定的数量关系;函数关系是变量间一一对应的确定关系,比如长方体的高与体积之间的关系是线性函数关系。

相关分析是对两个变量之间线性关系的描述和度量,探讨的主要问题是:变量之间是否存在关系?存在什么关系?关系强度如何?以及样本所反映的变量间的关系能否代表总体变量间的关系?

因此,在进行相关分析时,我们假定两个随机变量间是线性关系,如果是非线性关系,需要进行一定的数学变换将数据转换为线性关系。

如果我们需要探讨两个变量间的关系,可以使用简单散点图进行可视化探索,它是描述变量间相关关系的一种直观方法。相关关系包括线性相关、完全线性相关、曲线相关和不相关。

attachments-2019-11-Yq118cYV5dd25d0a6f957.png

2. 分析案例

我将选用 SPSS 中的自带数据集 car_sales.sav 为例,向大家演示相关分析过程。这个数据文件包含假设销售估计值、订价以及各种品牌和型号的车辆的物理规格。我从中选择 sales(销售额)和 mpg(燃料效率)这两个随机数值变量,探索它们之间是否存在相关关系。

两变量的部分数据截图如下:

attachments-2019-11-1AUMwqFz5dd25d3a75fe5.png

首先,我将通过绘制散点图的方式确定变量间的关系。选择菜单中的图形 -> 图形构建器,在图库中选择散点图,双击简单散点图将它选入图表预览窗口,将 sales 变量拖至 X 轴,将 mpg 变量拖入 Y 轴,点击确定。

图表对话框如下图所示:

attachments-2019-11-sHdISCXV5dd25d4824a7a.png

  • 分享于 · 2019.11.18 16:51 · 阅读 · 3424

[版权声明] :本文系网友分享,仅以非商业性的交流和科研为目的,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网( friends@stuch.cn )联系!我们将协调给予处理。转载授权码:确权中,请原作者尽快与我们取得联系,阅读原文(请登录)..

0 条评论

请先 登录 后评论
猜猜我是谁
寒冰

5
提问
5
回答
3
文章