如果想做两肠胃疾病的检查方法间的相关因素分析要用哪种统计方法,能否清楚的介绍下这样的方法

方差分析_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&方差分析
方差分析(Analysis of Variance,简称ANOVA),又称“”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上均数差别的。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。[1]是从观测变量的方差入手,研究诸多中哪些变量是对观测变量有显著影响的变量。外文名Analysis of Variance别&&&&称
方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1) ,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内dfw。
(2) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。
总偏差平方和 SSt = SSb + SSw。
组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一,MSb/MSw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb&&MSw(远远大于)。
MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。[1]方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。[1]
举例分析:
下面我们用一个简单的例子来说明方差分析的基本思想:
如某区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下:
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11方差分析健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均值的变异情况,则总变异有以下两个来源:
组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
组间变异,即由于克山病的影响使得患者与健康人组的血磷值均值大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内
如果用均方(除以自由度)代替离差平方和以消除各组样本数不同的影响,则方差分析就是用组间均方去除组内均方的商(即F值)与1相比较,若F值接近1,则说明各组均值间的差异没有统计学意义,若F值远大于1,则说明各组均值间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
利用分析结果如下:
input type num @@;
1 0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.53 1 1.67 1 1.80 1 1.87 1 2.07 1 2.11
2 0.54 2 0.64 2 0.64 2 0.75 2 0.76 2 0.81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.56 2 1.87
model num=
  自由度
离差平方和
SS组间(处理因素)
0.0193(有统计学意义)
SS组内(抽样误差)
    总和
      方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。[1]
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。[1]
协方差分析一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的,以及显著影响因素的最佳水平等。方差分析是在可比较的中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。
经过方差分析若拒绝了检验假设,只能说明多个样本总体均值不相等或不全相等。若要得到各组均值间更详细的信息,应在方差分析的基础上进行多个的两两比较。
多个样本均值间两两比较
多个样本均值间两两比较常用q检验的方法,即Newman-keuls法,其基本步骤为:建立检验假设--&样本均值排序--&计算q值--&查q界值表判断结果。
多个实验组与一个对照组均值间两两比较
多个与一个均值间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q'界值表。根据资料设计类型的不同,有以下两种方差分析的方法:
1、对成组设计的多个样本均值比较,应采用的方差分析,即。
2、对的多个样本均值比较,应采用配伍组设计的方差分析,即两因素方差分析。两类方差分析的异同:
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。整个方差分析的基本步骤如下:
1、建立检验假设;
H0:多个样本总体均值相等;
H1:多个样本总体均值不相等或不全等。
检验水准为0.05。
2、计算检验统计量F值;
3、确定P值并作出推断结果。1. 方差分析的假定条件为:
(1)各处理条件下的样本是随机的。
(2)各处理条件下的样本是的,否则可能出现无法解析的输出结果。
(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。
(4)各处理条件下的相同,即具有齐效性。
2. 方差分析的
假设有K个样本,如果原假设H0样本均数都相同,K个样本有共同的方差σ ,则K个样本来自具有共同方差σ和相同均值的总体。
如果经过计算,组间均方远远大于组内均方,则推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。否则承认原假设,样本来自相同总体,处理间无差异。
应用条件:
各样本是相互独立的随机样本
各样本均来自正态分布总体
3. 各样本的总体方差相等,即具有方差齐性
4.在不满足正态性时可以用非参数检验[2]单因素方差分析:
(一)单因素方差分析概念理解步骤
是用来研究一个的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。
例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。
单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。
单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。
单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。
(二)单因素方差分析原理总结
容易理解:在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。
(三)单因素方差分析基本步骤
1、提出原假设:H0——无差异;H1——有显著差异
2、选择:方差分析采用的检验统计量是,即F值检验。
3、计算检验统计量的和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。
4、给定,并作出决策
(四)单因素方差分析的进一步分析
在完成上述单因素方差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他几个重要分析,主要包括方差齐性检验、多重比较检验。
1、方差齐性检验
是对控制变量不同水平下各观测变量是否相等进行检验。
前面提到,控制变量不同水平下观测变量总体方差无显著差异是方差分析的前提要求。如果没有满足这个前提要求,就不能认为各相同。因此,有必要对方差是否齐性进行检验。
SPSS单因素方差分析中,方差齐性检验采用了方差同质性(homogeneity of variance)检验方法,其原假设是:各水平下观测变量总体的方差无显著差异。
2、多重比较检验
单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显区别于其他水平,哪个水平的作用是不显著的,等等。
例如,如果确定了不同施肥量对农作物的产量有显著影响,那么还需要了解10公斤、20公斤、30公斤肥料对农作物产量的影响是否有差异,其中哪种施肥量水平对提高农作物产量的作用不明显,哪种施肥量水平最有利于提高产量等。掌握了这些重要的信息就能够帮助人们制定合理的施肥方案,实现低投入高产出。
多重比较检验利用了全部观测变量值,实现对各个水平下观测变量总体的逐对比较。由于多重比较检验问题也是假设检验问题,因此也遵循假设检验的基本步骤。(1)LSD方法
LSD方法称为最小(Least Significant Difference)法。最小显著性差异法的字面就体现了其检验敏感性高的特点,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。
正是如此,它利用全部观测变量值,而非仅使用某两组的。LSD方法适用于各总体方差相等的情况,但它并没有对犯一类错误的概率问题加以有效控制。
(2)S-N-K方法
S-N-K方法是一种有效划分相似性子集的方法。该方法适合于各水平观测值个数相等的情况,
3、其他检验
(1)先验对比检验
在多重比较检验中,如果发现某些水平与另外一些水平的均值差距显著,如有五个水平,其中x1、x2、x3与x4、x5的均值有显著差异,就可以进一步分析比较这两组总的均值是否存在显著差异,即1/3(x1+x2+x3)与1/2(x4+x5)是否有显著差异。这种事先指定各均值的系数,再对其进行检验的分析方法称为先验对比检验。通过先验对比检验能够更精确地掌握各水平间或各相似性子集间均值的差异程度。
(2)趋势检验
当控制变量为时,趋势检验能够分析随着控制变量的变化,观测变量值变化的总体趋势是怎样的,是呈现线性变化趋势,还是呈二次、三次等多项式变化。通过趋势检验,能够帮助人们从另一个角度把握控制变量不同水平对观测变量总体作用的程度。多因素方差分析:
(一)多因素方差分析基本思想
多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。这里,由于研究多个因素对观测变量的影响,因此称为多因素方差分析。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。
分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。
(二)多因素方差分析的其他功能
1、均值检验
在SPSS中,利用多因素方差分析功能还能够对各控制变量不同水平下观测变量的均值是否存在显著差异进行比较,实现方式有两种,即多重比较检验和对比检验。多重比较检验的方法与单因素方差分析类似。对比检验采用的是单样本的方法,它将控制变量不同水平下的观测变量值看做来自不同总体的样本,并依次检验这些总体的均值是否与某个指定的检验值存在显著差异。其中,检验值可以指定为以下几种:
观测变量的均值(Deviation);
第一水平或最后一个水平上观测变量的均值(Simple);
前一水平上观测变量的均值(Difference);
后一水平上观测变量的均值(Helmert)。
2、控制变量交互作用的图形分析
控制变量的交互作用可以通过图形直观分析。
(三)多因素方差分析的进一步分析
在上述中,已经对广告形式、地区对销售额的影响进行了多因素方差分析,建立了饱和。由分析可知:广告形式与地区的交互作用不显著,先进一步尝试非饱和模型,并进行均值比较分析、交互作用图形分析。
1、建立非饱和模型
2、均值比较分析
3、控制变量交互作用的图形分析协方差分析:
(一)分析基本思想
通过上述的分析可以看到,不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响。协方差分析例如,在研究农作物产量问题时,如果仅考察不同施肥量、品种对农作物产量的影响,不考虑不同地块等因素而进行方差分析,显然是不全面的。因为事实上有些地块可能有利于农作物的生长,而另一些却不利于农作物的生长。不考虑这些因素进行分析可能会导致:即使不同的施肥量、不同品种农作物产量没有产生显著影响,但分析的结论却可能相反。
再例如,分析不同的饲料对生猪增重是否产生显著差异。如果单纯分析饲料的作用,而不考虑生猪各自不同的身体条件(如初始体重不同),那么得出的结论很可能是不准确的。因为体重增重的幅度在一定程度上是包含诸如初始体重等其他因素的影响的。
(二)协方差分析的原理
协方差分析将那些人为很难控制的控制因素作为,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价。
协方差分析仍然沿承方差分析的基本思想,并在分析观测变量变差时,考虑了协变量的影响,人为观测变量的变动受四个方面的影响:即控制变量的独立作用、控制变量的交互作用、协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量的影响。
方差分析中的原假设是:协变量对观测变量的线性影响是不显著的;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。检验统计量仍采用F统计量,它们是各均方与随机因素引起的均方比。
(三)协方差分析的应用举例
为研究三种不同饲料对生猪体重增加的影响,将生猪随机分成三组各喂养不同的饲料,得到体重增加的数据。由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重的数据,作为自身身体条件的测量指标。
新手上路我有疑问投诉建议参考资料 查看丁香客App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香客App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:1 | 主题:141074 | & 收藏本版
每发1个新帖可以获得0.5个丁当奖励
【求助】我该用哪种统计方法?
【求助】我该用哪种统计方法?
分享到哪里?
这个帖子发布于2年零98天前,其中的信息可能已发生改变或有所发展。
一个骨折,根据AO分型可以分为四型;其手术方法有三种手术入路;使用的内固定材料有三种。 我想评价一下不同的内固定方法对每一型骨折的预后判断;然后再评价一下不同的手术入路对每一型骨折预后的判断 问题: 我该用哪种统计学方法?
我是放在一起评价还是分开评价?谢谢
回复:【求助】我该用哪种统计方法?
分享到哪里?
3个因素,可以考虑裂区设计由楼主的贴子推测:最重要的因素可能是内固定方法(B因素),就把该因素放在小区。手术入路因素是次重要因素(A因素),可以安排于大区。然后从大区下裂出分型区组因素(K因素)。OK鸟
山水约定 edited on
回复:【求助】我该用哪种统计方法?
分享到哪里?
帮楼主复习下两因素裂区设计和分析基础知识:原理介绍
双因素嵌套裂区设计试验具有2个处理因素:在大区实施的因素A和在小区实施的因素B。
通常,因素B因配置在小区水平上其变异性较小,故相对重要的因素(主因素)配置于B反之为A。
大区A因素下通常设置有二级因素如区组因素。其变异包括A水平间的变异及A与区组之间的变异即交互作用A×区组。
因此该设计的方差分析要复杂于析因方差分析:尚需要解析出交互作用A×区组。
形象地看:嵌套裂区设计即是把析因设计中的重复变化数据位置让位给二级因素区组,但这却有本质的不同。
回复:【求助】我该用哪种统计方法?
分享到哪里?
举个实例:一项关于上呼吸道感染程度的的流行病学调查数据见下表大区因素A是居住情况:太拥挤,拥挤,不拥挤(水平数a=3)设二级因素家庭(区组因素),各调查6个家庭(区组水平数k=6)小区因素B(相对重要的因素/主因素)是家庭成员因素B设置父、母及3个子女等共5个水平(水平数b=5)欲分析家庭居住情况和不同家庭成员的感染程度的差异:⑴ 家庭居住的拥挤程度与感染程度的关系,即A的显著性;⑵ 家庭间的拥挤程度与感染程度的关系,即A×区组的显著性;⑶ 家庭成员间感染程度的差异,即B的显著性;⑷ 居住的拥挤程度与家庭成员这两大因素对感染程度的交互作用即A×B的显著性。
回复:【求助】我该用哪种统计方法?
分享到哪里?
实例数据的设计和分析:
回复:【求助】我该用哪种统计方法?
分享到哪里?
楼主照着套一下,然后再找方差分析的书看下---先看单因素分析,再看双因素分析,最后看下裂区分析。如果时间不够,直接下我的软件模板,比对着,急用先学,立杆见影(哇,俺用上当年林彪副统帅的话了,俺不是WEN革派,不能跨省啊)下方差分析那个
山水约定 edited on
回复:【求助】我该用哪种统计方法?
分享到哪里?
楼主若统计生疏了,请把我上面几个贴子多看几遍,概念强记下,然后看书会比较容易
关于丁香园丁香客App是丁香园社区的官方应用,聚合了丁香园论坛和丁香客的精彩内容。医生可通过丁香客App浏览论坛,也可以在这个医生群集的关系网络中分享和互动,建立更广泛的学术圈子。
扫描二维码下载
今日:1 | 主题:141074 | & 收藏本版
每发1个新帖可以获得0.5个丁当奖励
【求助】用哪种统计方法
【求助】用哪种统计方法
分享到哪里?
这个帖子发布于2年零50天前,其中的信息可能已发生改变或有所发展。
同一个病人,同时佩戴两种动态血压计A和B,一、记录每个病人佩戴后10分钟、20分钟、30分钟,1小时,2小时,.....到24小时的血压,将这些数据分成A、B两组,请问用什么统计方法比较这两组数据?是Pearson相关吗?二、记录每个病人两种血压计出现最高血压的时间,最低血压的时间(如:13点45分5秒),请问比较这个时间有用什么统计方法作比较?谢谢!
回复:【求助】用哪种统计方法
分享到哪里?
paired t test
回复:【求助】用哪种统计方法
分享到哪里?
谢谢,但是两组的时间怎么比较呢,也就是说怎么将现在记录的时间几点几分几秒进行比较?还是要转换资料?
回复:【求助】用哪种统计方法
分享到哪里?
第一个可以用配对t检验,第二个要看你的目的是什么啊?
回复:【求助】用哪种统计方法
分享到哪里?
第二个是要看两种血压计记录最高血压或者最低血压的时间点是否一致,也就是说试验组不要与对照组相差时间太多,谢谢
回复:【求助】用哪种统计方法
分享到哪里?
假设你有N个病人,每个病人有两个血压计,分别测了M次血压。第一个问题,两个血压计读数是否有差别,这是一个被试内效应的2×M设计的方差分析。两个因素:血压计(XYJ,两个水平A,B)和测量时间(CLSJ, 1,2, 3, ...M)。方差分析结果先看CLSJ和XYJ的交互是否显著。如果不显著,说明测量时间因素不对血压计产生作用,接着看XYJ的主效应否显著,得出结论;如果交互显著,那么看后分析的简单效应,看CLSJ每个水平(时间点),XYJ是否显著。第二个问题,先是对数据进行处理,取得每个病人每个血压计最高血压读数对应时间,然后就是一个简单的配对T检验(一个因素,血压计)。
回复:【求助】用哪种统计方法
分享到哪里?
第二个问题,先是对数据进行处理,取得每个病人每个血压计最高血压读数对应时间,然后就是一个简单的配对T检验(一个因素,血压计)。 --------------------------------------谢谢,还请问怎么对数据进行处理呢?现在的数据是几点几分几秒,是不是要转换为距第一次测量血压的时间有多少呢?也就是说加入首次测量时间为10点0分0秒,而两个血压计出现最高血压的时间分别是11点02分54秒,11点02分57秒,则要转换成“60*60+60*2+54=3774秒”和“60*60+60*2+57=3777秒”,再进行比较?谢谢!
关于丁香园心理学专业基础综合模拟试题题库
本试题来自:(2013年心理学专业基础综合模拟试题,)四、综合题举例阐述在一个2[组间]×3[组内]的混合实验中采用哪些统计方法对两个因素的数据变化趋势、因素的主效应、交互作用进行详细和深入地分析如果交互作用显著,应如何进行进一步的分析,并对统计结果进行解释。正确答案:(1)举例:2[组间]×3[组内]的混合实验,研究大学生对红、黄、绿三种灯光的反…… 或者
您可能感兴趣的试题
简答题:()举例说明多于一个自变量的实验的优越性。答案:有,简答题:()何谓暂时阈移(TTS)说明影响暂时阈移大小的主要因素。答案:有,
心理学专业基础综合模拟试题最新试卷
心理学专业基础综合模拟试题热门试卷}

我要回帖

更多关于 肠胃疾病的检查方法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信