爱上统计学
最新书摘:
-
飞林沙2012-10-15方差分析有许多不同的形式,最简单的形式是简单方差分析,是只分析一个因素或者一个处理变量,而有两个以上的群体受到这个因素的影响。也叫做一元方差分析。更复杂的方差分析叫做析因分析,是分析一个以上的处理变量。简单方差分析检验两个以上的群体在一个因素或者一个维度上是否存在均值差异。F统计量是检验“群体之间有差异”假设的检验统计量。F = MSbetween / MSwithin,也就是组间的变化量 处以 组内的变化量。
-
飞林沙2012-10-13零假设是变量间无关的假设,而研究假设是变量间有关系的假设。例如:一年级和二年级学生的智商没有差异。 这是一个零假设。一年级和二年级的学生智商有差异,这是一个无方向假设。二年级比一年级的学生智商要高。这是一个有方向假设。
-
飞林沙2012-10-13决定系数是一个变量的方差可以被另一个变量的方差解释的百分比。两个变量共享的特征越多,他们就越相关。决定系数的计算是为了确定一个变量的方差可以被另一个变量的方差解释的程度,决定系数就是相关系数的平方。例如平均成绩和学习时间之间的皮尔逊相关度是0.7,那么他们的决定系数就是0.49。我们称之为平均成绩方差的49%可以被学习时间的方差所解释。
-
飞林沙2012-10-13偏度是对数据分布对称性缺失或者分布不平衡的测量。换句话说就是分布的一个尾巴比另外一个长。如果均值大于中位数,那么就是正偏度分布,否则就是负偏度分布。峰度与数据分布看起来是扁平或者陡峭有关,而且用于描述这个特征的概念是相对的。一般来说,陡峭峰度数据分布相比与其他分布来说离散型或者变异性更小。累计频度分布建立的基础是相同数据的频数分布,但是多增加了一列,累计频数。
-
飞林沙2012-10-13极差是通过数据分布的最大值减去最小值来计算。实际上,极差有两种类型,一种是不包含极差,就是用最大值减去最小值。另外一种是包含极差,就是用最大值减去最小值 再加1。标准差是总体标准差的估计值,只有我们在分母中除以n-1的时候得到的才是无偏估计。好的科学家一般都是保守的。这里保守的含义是如果我们不得不出错,那么我们出错也是过估计了总体的标准差。样本规模越大标准差的有偏估计和无偏估计的差异就越小。
-
郑大清新2012-02-26统计显著性是指零假设为真的情况下拒绝零假设所要承担的风险水平。
-
郑大清新2012-02-26不存在某种关系作为研究的起点是整个假设的重点。零假设有助于定义观察到的群体之间的差异是由偶然性引起还是偶然之外的因素引起。
-
郑大清新2012-02-25如果你对两个变量之间的关系感兴趣,就尽力手机充分的离散数据——这样你才可以得到最具代表性的结果
-
大炎2011-12-03如果你的数据集中有一个或多个极值,中位数相对其他集中趋势量数来说能更好地代表数据集的中心值。…………就是由于这个原因,特定的社会和经济指标(大多数与收入相关)的分析使用中位数作为集中趋势量数……而不是使用均值来概括收入。总是存在太多的极值改变或者明显地扭曲一个数据组或者数据分布的中心点。
-
飞林沙2012-10-13效度简单来说就是表示工具能够测量要测量的内容的性质。1. 内容效度就是测试项目能否代表设计测试要测量的总体项目的性质。2. 准则效度是评价测试是否反映现在和未来的一组能力。如果准则是发生在现在,我们就讨论同步效度。如果准则是发生在未来,我们就讨论预测效度。3. 建构效度是基于测试或测量工具背后的基本的结构和概念。(现在还不是特别懂。。。。)
-
飞林沙2012-10-13信度有几种不同的类型:1. 再测信度用于检验一个测试在不同时期是否可信。2. 复本信度用于检验相同测试的不同复本的等价性和相似性。3. 内在一致性信度用于确定测试中的项目是否彼此一致。克隆巴赫系数是对内在一致性信度的测量。克隆巴赫系数实际上就是计算每个测试者在每个项目中的得分和总的得分之间的相关系数,并于所有单个项目的得分的变异性的比较。计算的逻辑是每个总分很高的测试者在每个项目上的得分也应该很高。4. 评分者信度是两个评分者对观察结果判断的一致程度的度量。