简单统计学

最新书摘:
  • 附哦类具
    2020-08-17
    真的有人认为采石场会提高附近住宅的价值吗?这种说法甚至无法通过表情测试。你可以将这种荒谬的说法讲给你的朋友听,看看你能否忍住笑声。
  • 失翼之鹰
    2020-08-06
    当数据涉及人们的选择时(比如当人们选择上大学、结婚或者要孩子时),就会出现“自选择偏差”。在这种情况下,对于做出不同选择的人进行比较的做法是靠不住的。例如,我们常常听人说,大学毕业生的工资高于高中毕业生,似乎人们观察到的工资差异可以衡量上大学的财务回报。不过,大学毕业生之所以工资比较高,部分原因在于他们比不上大学的人更聪明,更有抱负。实际上,做出不同选择的人本身可能就是不同的。
  • 关山南
    2018-03-22
    在统计学中,相关性并不是因果关系的代名词。
  • 关山南
    2018-03-22
    相关、趋势和其他模式本身无法证明任何事情。如果没有合理的解释,任何模式都仅仅是一种模式而已。
  • 关山南
    2018-03-22
    这种选择性报告也叫“出版效应”,因为具有统计显著性的结果会被写进期刊和图书,而不显著的结果则不会得到报告。
  • 关山南
    2018-03-22
    而且,我们都想强调与我们理论相符的数据,忽略与之相矛盾的数据。或者将那些与我们的理论相冲突的数据错误地解读成与之相符的数据。
  • 关山南
    2018-03-22
    回归并没有描述“能力”随时间的变化,比如公司被竞争削弱或者棒球选手的状态随年龄的增长而下滑。回归是由“表现相对于“能力”的波动导致的,因此远离均值的表现反映了更加接近均值的能力。
  • 关山南
    2018-03-22
    我们应当对缺乏思考的计算保持警惕。计算是一项相对容易的工作,更有难度的问题是这种计算是否有道理。
  • young
    2017-12-18
    我们解释眼前事物的内在愿望导致了两种认知错误。首先,我们很容易被模式以及解释模式的理论所诱导。其次,我们紧盯着支持这种理论的数据,忽视与之相矛盾的证据。......我们内心深处希望理解这个世界,因此我们形成了这种声名狼藉、很难摆脱的弱点。
  • maxy218
    2019-11-29
    实验用一般线性模型(GLM)的普通最小二乘估计对三文鱼立体像素数据进行了处理
  • young
    2017-12-18
    我们既需要理论,也需要数据。不要仅仅被器重的一种事物说服。
  • maxy218
    2019-11-28
    另一种获得统计显著性的方法是利用数据发现理论。统计检验的假设是,研究人员首先提出一种理论,然后收集数据,以检验这种理论,然后汇报结果——这种结果可能具有统计显著性,也可能不具有显著性。许多人颠倒了这种程序,他们仔细研究数据,以发现某种模式,然后编造出符合这种模式的理论。在数据中搜寻模式的过程令人愉快,而且激动人心,就像玩数独或者解决神秘谋杀案一样。这些人从各个角度考察数据,将数据分解成基于性别、年龄和种族的类别,丢掉妨碍模式的数据,寻找任何有趣的现象。当他们发现某种模式时,他们开始思考其中的原因。当研究人员钻研数据、寻找模式时,他们会进行数百次显性或隐性检验。你可以站在他们的立场上进行考虑。首先,你将数据作为一个整体进行考察。然后,你分别查看男性和女性的数据。接着,你将儿童和成年人的数据区分开;然后将儿童、青少年和成年人的数据区分开;然后将儿童、青少年、成年人和老年人的数据区分开。接着,你尝试不同的年龄界限。你将老年人的范围设置为 65 岁以上。当这种做法失败时,你将这个数字调整为 55 岁、60 岁、70 岁或者 75 岁。最终,你总会发现某种模式。即使研究人员不对数据的每一种排列进行正式的统计检验,他们也可以进行非正式检验,即寻找看上去具有统计显著性的数据排列。如果我们知道研究人员在公布结果之前以一百种不同的方式对数据进行了考察,我们一定会抱着怀疑的态度看待这些结果。这些做法——选择性报告和数据搜刮——被称为数据挖掘。通过数据挖掘发现的统计显著性只能体现出研究人员的耐心。在独立检验证实或拒绝结论之前,我们无法判断某种数据挖掘马拉松到底证明了某种实用理论的有效性还是研究人员坚定的毅力。不过,通常情况下,这类检验并不会被人验证。毕竟,你无法通过证实他人的研究而成为明星;所以,为什么不把时间用于发现新理论呢?因此,通过数据挖掘得出的理论看上去很安全,既不会受到检验,也...
  • maxy218
    2019-11-28
    寻找统计显著性的一种方法是对多种理论进行检验,然后只宣布具有统计显著性的结果。即使只考虑毫无价值的理论,也会有 1/20 的检验表现出统计显著性。在海量数据和高速计算机的帮助下,在生成“可发表结果”的巨大压力下,无数毫无价值的理论得到了检验。成千上万的研究人员对无数理论进行检验,将那些具有统计显著性的结果记录下来,并将其他结果扔到一边。对于社会公众来说,我们只能看到这些统计工作的冰山一角。我们只能看到具有统计显著性的结果,看不到不具有统计显著性的结果。如果我们知道这些得到公布的检验背后隐藏着数百项没有得到公布的检验,而且知道对毫无价值的理论进行的检验中平均有 1/20 的检验能够得到统计显著性,我们一定会抱着更加怀疑的态度看待这些得到公布的结果。