为什么

最新书摘:
  • [已注销]
    2019-08-03
    为客观性而奋斗,完全根据数据和实验进行推理的思想,自伽利略以来一直是科学定义自身存在方式的一部分。……研究者必须绘制出一个因果图,其反映的是他对于某个研究课题所涉及的因果过程拓扑结构的定性判断,或者更理想的是,t他所属专业领域的研究者对于该研究课题的共识。为了确保客观性,他反而必须放弃传统的客观性教条。在因果关系方面,睿智的主观性比任何客观性都更能阐明我们所处的这个实在世界。
  • Marlais
    2020-02-24
    (奈曼)认定费舍尔是错误的,”多年后,奥斯卡·肯普索恩曾谈起这事,“这是一个不可原谅的冒犯一一费含尔从来没有错过,事实上,连示他可能出了错也会被他祝为严重的攻击。任何不将费舍尔的著作视作真理或圣旨人,都会被认为要么愚蠢要么邪恶”。那次演讲的几天后、奈曼和皮尔逊就见识到了费舍尔有多愤怒,当晚他们去系里时,奈曼发现他在演讲中展示的木制模型被彻底毁了,零件散落得满地都是。他们两人一致推测,只有费舍尔才可能做出这样的事。
  • Moon Sea
    2021-04-10
    伯克利大学的哲学家约翰·塞尔将自由意志问题称为“哲学上的丑闻”,一是因为自古以来对这个问题的论述毫无进展,二是因为即便如此我们仍然不能把它当作一种视觉幻象避而不谈。
  • Moon Sea
    2021-04-10
    这个例子是一个关于相互作用的典型案例。最后,范德维尔的分析证明了有关吸烟基因的3个重要假设:第一,它并不会导致吸烟量的显著增加。第二,不吸烟,吸烟基因就不会导致肺癌。第三,对于那些有吸烟习惯的人来说,吸烟基因会大大增加其患肺癌的风险。基因和主体行为之间的相互作用在这个例子中显得尤其重要。
  • Moon Sea
    2021-04-10
    例如,在类似图9.4的情形中,变量之间没有混杂,M是处理X和结果Y之间的中介物,则自然间接效应为:NIE=∑m[P(M=m|X=1)–P(M=m|X=0)]×P(Y=1|X=0,M=m) (9.5)对这一方程的解释颇具启发性。中括号内的表达式代表X对M的影响,乘号后的表达式代表M对Y的影响(当X=0时)。由此,我们就揭示了系数乘积规则的起源,并展示了两个非线性效应的乘积具体应当如何计算。
  • Moon Sea
    2021-04-10
    事实上,毕克尔和汉默尔发现了一个令他们自己非常满意的因果叙述。他们在1975年的《科学》杂志上发表了一篇文章,其中提出了一个对这一悖论的简单解释:女生申请者被拒绝的人数更多,是因为她们倾向于申请更难被录取的系。具体而言,一方面,在人文科学和社会科学系的申请中,女性申请者所占比例要高于男性,而在这些院系中,她们面临着双重困境:申请者数量更多,而录取名额更少。另一方面,女生不怎么申请像机械工程学这样的系,但这些系本身录取的学生更多,且系里为研究生提供了更多的资金和空间,简而言之,这些系的录取率更高。那么,为什么女性会倾向于申请更难录取的系?她们没有选择申请技术性领域的院系,也许是因为那些领域对数学水平的要求较高,或被认为更“男性化”。也许是因为她们在教育的早期阶段遭到了歧视,就像巴巴拉·伯克斯的故事所显示的那样,社会往往倾向于将女性从技术性领域排挤出去。但这些因素并不在伯克利大学的控制之中,因此不能视作大学存在性别歧视的证据。毕克尔和汉默尔的结论是:“伯克利大学并没有歧视女性申请者。”
  • Moon Sea
    2021-04-10
    无论何时,只要图表中X和Y之间的所有路径都被一组节点Z阻断,那么在以Z为条件的前提下,数据中的X和Y就应该是条件独立的。这就是我们在第七章提到的d分离性,这个属性允许我们在数据未能显示出相应的独立性时否定并放弃模型。
  • Moon Sea
    2021-04-10
    以一组匹配变量Z为条件,要确定对于结果Y来说X是否可忽略,我们只需要测试Z是否阻断了X和Y之间的所有后门路径,同时,Z的成员都不是X的后代即可。就这么简单!在我们的示例中,拟匹配变量(工作经验)阻断了所有的后门路径(因为本来就没有任何后门路径),但由于它是“学历”的后代,所以它未通过测试,因此ED就不是可忽略的,EX也就不能用于匹配。无须进行复杂的分析,只需要看一眼因果图,我们就能得出这个结论。并且,研究者也不必再费神去评估在某种处理下潜在结果的存在可能性有多大。
  • Moon Sea
    2021-04-10
    在宣布全面胜利之前,我们应该尝试使用do演算来讨论一个问题。就像其他运算一样,它可以让某种有效的理论建构得到证明,但它并不能帮助我们找到理论建构本身。它是一个优秀的解决方案验证工具,但并不是一个很好的解决方案搜索工具。
  • Moon Sea
    2021-04-10
    这一对于完备性的证明告诉我们,如果我们在规则1到3中找不到根据数据估计P(Y|do(X))的方法,那么对于这个问题,解决方案就是不存在的。在此情况下,我们就能意识到除了进行随机对照试验,我们别无选择。
  • Moon Sea
    2021-04-10
    规则3很简单,它实质上是说,如果从X到Y没有因果路径,我们就可以将do(X)从P(Y|do(X))中移除。即,如果不存在只包含前向箭头的从X到Y的路径,则:P(Y|do(X))=P(Y)这个规则可以这样解释:如果我们实施的干预行动(do)不会影响Y,那么Y的概率分布就不会改变。除了像欧几里得公理一样不言自明,规则1到3还可以利用do算子的“删除所有指向……的箭头”定义和概率的基本法则对其进行数学上的证明。
  • Moon Sea
    2021-04-10
    我们知道,如果变量集Z阻断了从X到Y的所有后门路径,那么以Z为条件(对Z进行变量控制),则do(X)等同于see(X)。因此,如果Z满足后门标准,这种变换就可以写作:P(Y|do(X),Z)=P(Y|X,Z)我们将此作为我们公理系统的规则2。
  • Moon Sea
    2021-04-10
    规则1为:如果我们观察到变量W与Y无关(其前提可能是以其他变量Z为条件),那么Y的概率分布就不会随W而改变。例如,在第三章,我们看到,一旦我们知道了中介物“烟雾”的状态,变量“火灾”就与变量“警报”不相关了。这种不相关的认定转化为符号处理,就是:P(Y|do(X),Z,W)=P(Y|do(X),Z)
  • Moon Sea
    2021-04-10
    对撞的扭曲棱镜在日常生活中同样普遍存在。正如乔丹·埃伦伯格在《魔鬼数学》(How Not to Be Wrong)中提出的问题:你有没有注意到,在你约会的人当中,那些有魅力的人往往是混蛋?与其为解释这一现象而费力构建复杂的社会心理理论,不如考虑一种更简单的解释。你对约会对象的选择取决于两个因素:魅力和个性。你会冒险约会一个刻薄而有魅力的人,或者一个和蔼但缺乏魅力的人,你当然也会与既和蔼又有魅力的人约会,但你肯定不会与既刻薄又没有魅力的人约会。换句话说,你删掉了所有“负—负”的结果,这与你在抛掷两枚硬币的例子中所做的筛选是相同的,而正是这种筛选造成了魅力和个性之间的伪负相关。可悲的事实是,没有魅力的人可能会和有魅力的人一样刻薄,但你永远意识不到这一点了,因为你永远不会约会既刻薄又没有魅力的人。
  • Moon Sea
    2021-04-10
    我们在实际生活中似乎就是遵循着共因原则行事的,无论何时,只要观察到某种模式,我们就会去寻找一个因果解释。事实上,我们本能地渴望根据数据之外的某个稳定机制对观察结果做出解释。其中最令人满意的解释是直接因果关系:X导致Y。当实际情况不能满足直接因果关系时,如果能找出X和Y的共因,那么我们也会感到满意。相比之下,对撞结构太难以捉摸,无法满足我们的因果解释欲。
  • Moon Sea
    2021-04-10
    这个看似简单的方程就是贝叶斯法则。如果仔细观察它所表达的内容,我们就能发现它提供了逆概率问题的一种通用解决方案。它告诉我们,如果我们知道给定T后S的概率,即P(S|T),那么我们就应该能够计算出给定S后T的概率,即P(T|S),当然前提是我们已知P(T)和P(S)。
  • Moon Sea
    2021-04-10
    首先,赖特想说的是,路径分析的应用应该以研究者对因果过程的个人理解为基础,这种理解就反映在其所绘制的因果图或路径图中。它不能被简化为一个机械性的程序,就像统计手册里列出的那些操作方法一样。对于赖特来说,绘制路径图不是一种统计学实践,而是一种遗传学、经济学、心理学实践或其他诸领域的研究者在自己的专业领域所进行的一种实践。其次,赖特将“无模型方法”的诱人之处归因于其客观性。自1834年3月15日伦敦统计学会成立伊始,客观性就是统计学家的圣杯。学会的创始章程规定,在所有的情况下,数据都优先于观点和解释。数据是客观的,而观点是主观的。这个规则的提出远远早于皮尔逊时代。为客观性而奋斗,完全根据数据和实验进行推理的思想,自伽利略以来一直是科学定义自身存在方式的一部分。与相关性分析和大多数主流统计学不同,因果分析要求研究者做出主观判断。研究者必须绘制出一个因果图,其反映的是他对于某个研究课题所涉及的因果过程拓扑结构的定性判断,或者更理想的是,他所属的专业领域的研究者对于该研究课题的共识。为了确保客观性,他反而必须放弃传统的客观性教条。在因果关系方面,睿智的主观性比任何客观性都更能阐明我们所处的这个真实世界。
  • Moon Sea
    2021-04-10
    干预比关联更高级,因为它不仅涉及被动观察,还涉及主动改变现状。例如,观察到烟雾和主动制造烟雾,二者所表明的“某处着火”这件事的可能性是完全不同的。无论数据集有多大或者神经网络有多深,只要使用的是被动收集的数据,我们就无法回答有关干预的问题。从统计学中学到的任何方法都不足以让我们明确表述类似“如果价格翻倍将会发生什么”这样简单的问题,更别说回答它们了。认识到这一点让许多科学家挫败不已。我之所以对此心知肚明,是因为我曾多次帮助这些科学家踏上因果关系之梯的更高层级。
  • Moon Sea
    2021-04-10
    事实上,我在机器学习方面的研究经历告诉我,因果关系的学习者必须熟练掌握至少三种不同层级的认知能力:观察能力(seeing)、行动能力(doing)和想象能力(imagining)。
  • Moon Sea
    2021-04-10
    在数学上,我们把自愿服药的病人的生存期L的观测频率记作P(L|D),这就是统计学教科书中常用的条件概率。这个公式表示生存期L的概率(P)是以观察到病人服用药物D为条件的。注意P(L|D)与P(L|do(D))完全不同。观察到(seeing)和进行干预(doing)有本质的区别,它解释了我们不认为气压计读数下降是风暴来临的原因。观察到气压计读数下降意味着风暴来临的概率增加了,但人为迫使气压计读数下降对风暴来临的概率并不会产生影响。