回归方程显著性的检验(t检验)

时间:2022-12-26 10:28:13 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
线性回归

数据选用Rtable.b3

1.回归方程显著性的检验(t检验)

首先探索yx之间是否具备线性关系,最直接的方法,画出yx之间的散点图,如图所示,yx之间是负相关的关系。



yx进行拟合模型lm()



用准确的统计学语言来描述回归结果y=33.72-0.047x 回归方程的预测

在对方程进行预测时,(需要拟合好的模型,新预测的数据集,定义预测的区间,定义95%的可信区间) 回归诊断

回归模型的前提假设:

线性:因变量Y的总体平均值与X呈线性关系


独立性:需要保证观测值之间是相互独立的

正态性:线性模型的残差服从正态分布(残差毫无规律的分布在x=0的周围) 等方差:不论X取什么值,Y都具有相同的方差 出现情况:

1.对于方差不齐的情况可以采用加权最小二乘法,对于距离较远的点赋予较小的权重,减少其不良影响。

2.共线性(拟合模型显著但自变量不显著)诊断方法方差膨胀因子,VIF>10较强的共线性,VIF>100有严重的共线性,发现共线性的变量可剔除彼此共线性的变量

2.高杠杆值(与离群点不同,其x值不在正常范围内)诊断方法(学生化残差,杠杆值,Cook距离)car包中的influencePlot函数找出该点

外文文献总结

一种基于模糊信息的乳腺癌危险因素方法评估

目的:本篇文章是研究导致乳腺癌疾病的因素,研究发现有可控因素和不可控因素。通过构建一个决策系统来观察导致乳腺癌的因素。

方法:通过BRFCM(基于规则的模糊认知图)方法来表示几种因素之间的属性和因果关系。第一部分,利用基于模糊推理规则的方法,利用MATLAB(矩阵实验室)构造RBFCM的权重矩阵,得到了互连线的权重。连接强度是根据这些因素的因果关系按权重值推断的。 第二部分通过模糊识别图评价影响BC发生的因素,并计算BC危险因素的影响程度。第三部分,使用FCMapper软件分析结果。在构建因果关系时,结合研究人员经验,来确定BRFCM的权重矩阵。FIS中的功能操作遵循以下四个步骤:评估每个规则的输入,获得每个规则的结论, 汇总结论和去模糊化。 因果关系的标志:

1.确定是符号,某种因素对BC的影响是积极或非积极的 2.通过语言描述来评估影响的程度 3.将影响程度转化为数值

优点:基于知识的模糊推理过程:研究中不必为每一个影响因素分配数值,而是描述某种因素对乳腺癌的影响程度,利用IF-THEN规则确定了影响因素对BC间关系,进而确定每一个影响因素导致乳腺癌之间的权重。

发现:研究中发现导致乳腺癌疾病的因素有可控因素和不可控因素,晚孕产妇年龄是重要的可改变因素,良性乳腺疾病、家族史和乳腺密度是不可改变的危险因素。


本文来源:https://www.wddqw.com/doc/8baf077680c4bb4cf7ec4afe04a1b0717fd5b316.html