谢宇,社会学家,美国国家科学院院士、美国艺术与科学院院士和台湾“中央研究院”院士,美国普林斯顿大学社会学和国际研究Bert G. Kerstetter '66大学教授、当代中国中心主任,北京大学讲座教授、社会研究中心主任,微信公众号《知识分子》主编之一。谢宇教授的主要研究领域包括社会分层、统计方法、人口学、科学社会学和中国研究,代表性学术专著有《回归分析》《社会学方法与定量研究》《分类数据分析的统计方法》《科学界的女性》《婚姻与同居》《美国的科学在衰退吗?》等。近些年,他致力于在中国推广实证的社会学研究。[图源:csr.pku.edu.cn]
内容提要
本文将在科学史的背景下追溯邓肯作为一位量化社会学家所产生的影响。将O.D.邓肯的社会科学哲学置于“总体逻辑思维”的传统中进行分析,这一传统起源于查尔斯·达尔文,其后由弗朗西斯·加尔顿引入社会科学。作为分析的一部分,作者将对统计分析的两种方法加以区分:高斯或类型逻辑思维和加尔顿或总体逻辑思维,并进一步对邓肯在社会科学中的量化推理视角进行细致讨论,特别是他对于社会测量、路径分析、结构模型、计量经济学和Rasch模型的看法。本文的一个重要主题就在于O.D.邓肯很快意识到社会科学中量化方法所遇到的困难及其局限性,他尤其被内生的总体异质性所困扰。正是这种异质性使得在社会科学中通过统计分析得到具有定律性质的推论变得徒劳。因此O.D.邓肯十分鄙视那些试图效仿物理科学来探寻假想的社会普适法则的做法,因为他坚信这种法则并不存在且毫无意义。对于O.D.邓肯来说,统计工具的主要作用在于对总体差异的系统性模式进行归纳总结。
正文
社会学不像物理学。唯独物理学才像物理学,因为一切近似于物理学家对世界的理解都将最终成为物理学的一部分。(Duncan, 1984: 169)
类型逻辑思维和总体逻辑思维
对于邓肯用于定量推理的人口学方法,我将从粗略、宽泛的科学史概况谈起。自然科学史一直在科学史中占据主导地位。古希腊最负盛名的哲学家柏拉图对于自然科学的启蒙和发展有着极其深远的影响(Burtt, 1952, 1978; Butterfield, 1957; Hall, 1981; 62-63; Kuhn, 1957; Lindberg, 1992: 38-39)。进一步讲,柏拉图对于包括社会科学在内的整个西方哲学都有着深远的影响。现代数学家、哲学家怀特海(Alfred North Whitehead)(1861-1947)这样评价道:“对于欧洲哲学传统最稳妥的概括应当是:它只是对柏拉图思想的一系列注解。”(引自Mayr, 1982: 38)
是什么让柏拉图在科学史上占据如此重要的地位?他对科学——在当时的古希腊被喻为“自然哲学”——的主要贡献是他对“真知”或“真理”的定义方式。他认识论中的一个精华之处就是对“本质的世界”(world of being)和“形成的世界”(world of becoming)的区分。真知依附于“本质的世界”,而“形成的世界”则是我们在现实生活中所观察到的一切。柏拉图对真知——如今被称为科学——的定义是普适的和具有永恒意义的。它绝不是形成的世界中的具体实物或现象,因为这类知识是不可靠的;真理处在一个更高的层次——它是对本质世界的认知。因此,科学家(哲学家)的职责就在于超越可以观察、感受和经历的事物而获取本质世界中的真理。规律本身先于我们而存在,并且是永恒存在的,它来自造物主的创造。这种对真知的定义强调的是“发现”——几乎与科学上的进取同义,它意味着伟大的真理总是隐藏在自然界中,并等待着科学家们去发现。这就是科学的目的论属性。
在著名的洞穴喻中,柏拉图区分洞穴之中的可见世界与洞穴外面的可知世界,囚徒走出洞穴的过程则被比喻成通过教育获得真理的过程。[图注:k.sina.cn]
我想举一个具体的例子来阐述柏拉图的观点。在柏拉图看来,要理解圆的真正属性,仅靠研究我们在日常生活中可以观察到的或借助绘图仪器画出的圆是不准确的,原因在于这些在现实生活中可以观察到或者用最佳工具画出的圆都不能达到理想的完美的圆的标准。完美的圆仅存在于哲学家的头脑中。只需理解这一假想中的完美的圆,我们就能理解所有圆的真正属性。研究科学史的历史学家林德伯格这样描述柏拉图在科学史上的影响。
为了获得真知,我们必须抛开所有针对个人的个体特征,同时寻求那些能够将个体分门别类的共性特征。在这种谨慎的说法中,柏拉图的观点带有明显的现代人的口吻:理想化是大多数现代科学的一个显著特征;我们在建构模型和定律时,为了把握本质就需要忽略偶然因素的作用(例如,伽利略的惯性原理就是诚图在排除所有阻力和干抚的理想状况下播述物体的运动)。(Lindberg, 1992: 38-39)
因此,自然科学将“本质的世界”看作是真正的现实,即我们从未实际观察到但却仍假设它独立于“形成的世界”而存在着。柏拉图的“本质的世界”是由不连续的、抽象的思想或形式构成的。对柏拉图而言,对现实世界中观测到的变异有一种简单的解释:形成世界中的物体只是本质世界的拙劣复制品。迈尔(Mayr, 1982: 2001)将这种思维称为“类型逻辑思维”。类型逻辑思维认为自然科学应该重点关注典型现象,比如典型的人体、典型的自由落体以及典型的圆。进一步说,科学家们在研究这些典型现象时应该努力排除外生和干扰因素,如温度、尺寸和位置。自然科学中一个屡试不爽的强假设认为:只要我们理解了典型现象,我们就可以将其概括并推广到个体和具体问题。
物理科学因遵循柏拉图的类型逻辑思维而取得了巨大的成功。这种思维也解决了长期以来在科学与宗教之间存在的潜在矛盾。因为从这个角度而言,自然定律在自然事物之间构建起了充分的、现实的而又直接的因果关联,而不是向上帝索要“终极原因”。哥白尼、伽利略和牛顿均是采用这种分析方法取得成功的典范。类型逻辑思维认为,现实生活与完美的本质世界之间的偏差都源自复制过程的瑕疵和缺陷,由于微不足道故可忽略不计,不值得真正的科学家们去劳神。这一哲学理论的精髓在于科学家只有懂得如何超越由形成的世界产生的偏差干扰,才能探求到伟大的科学发现。
柏拉图对真理的定义过去一直在科学界占据着主导地位,现在很大程度上也是如此。然而在19世纪中叶,英国生物学家达尔文却引发了一场革命。今天的人们关注达尔文更多的是他基于自然选择的进化论,但这里我们关心的是他对总体的思考。对达尔文而言,偏差不再像柏拉图认为的那样是非现实的、无法预测的和不重要的;相反,它们是进化的前提,而且是科学探索中最有趣的一个方面。
对达尔文而言,变异才是现实,并不是由观测者引入的误差。他的《物种起源论》(1859年)的第一章和第二章的题目分别为“自然状况下的变异”和“家养状况下的变异”。这里强调的是个体而不仅仅是典型。同一父母的子女之间存在差异,正是这种变异的代代相传形成了自然选择的基础:用今天的话讲,每一代都会生成大量的基因变异,但只有相对少数的个体可以存活并继续繁衍。
达尔文是个生物学家。将他的总体逻辑思维引入社会科学主要归功于他的表弟弗朗西斯·加尔顿(Francis Galtom)。由于不喜欢大学生活,加尔顿游历了许多地方,并在此过程中发现人与人之间——从身高到智商再到外貌的各个方面——千差万别。他认为,平均结果的意义并不大;“个体差异……基本上是唯一值得他感兴趣的东西。”(Hilts, 1973: 221)此后,他开始运用达尔文生物学中的总体逻辑思维并借助统计工具来研究人类群体。加尔顿并非第一个应用统计方法研究人类群体的科学家。比利时数学家阿道夫·凯特勒(Adolphe Quételet)早在他之前就已经将涉及正态分布的概率测度论推广到对社会现象的研究中,并称之为“社会物理学”(Quételet, 1842)。在研究重点为“平均人”的社会物理学中,凯特勒发现,尽管个体之同的行为千差万别、不可预测,但是总体人群或子人群的平均值却相对稳定且可测。换句话说,平均值似乎正好满足柏拉图对于真理永恒性和绝对性酌苛刻要求。
与凯特勒很不同的是,加尔顿关注的是“属性是如何分布的”(Galton, 1889: 35-36)。因此,加尔顿相对凯特勒的重大超越就在于他将变异当作一个严肃的课题,并且将传统术语中的“概率误差”改成“概率偏差”。因为“误差”一词暗指在测量过程中产生的令人不快的、非真实的、微不足道的量(Galton, 1889)。而对加尔顿而盲,偏差是分布的一种属性,它在反映客观现实方面与平均值同样重要。加尔顿对个体差异和变异而非平均值的重视最终使他发现了具有划时代意义的“回归”和“相关”概念(Hilts, 1973)。
值得—提的是,在研究人类的过程中,加尔顿改变了变异一词的含义。对他而言,变异是客观现实的一部分。由于加尔顿的贡献,社会科学从此将柏拉图的“形成的世界”作为客观现实来研究。换言之,社会科学关注的正是独立各异的个案的完整分布。在进行研究之前,科学家都要首先定义所要研究的人群,否则将无法解释最终的结果。这是因为包含在人群中的个体千差万别,结果会因纳入研究的个体的不同而相去甚远。这个前提乃是科学抽样的基础。
不同个体间的行为和观点可以差异很大。社会科学家的工作正是在这些变异中寻求规律性。对物理学家而言,变异是希望能避免的测量误差,即希望被消除的外界干扰。但对社会学家而言,变异却是社会现实的本质。
类型逻辑思维和总体逻辑思维的关键区别对现代统计学具有重大影响。类型逻辑思维将偏离平均值的偏差视为“误差”,认为只有平均值才接近真实原因。换言之,真实原因是恒定不变的,我们实际观测到的东西都包含测量误差。假设我们预先知道声速在理想状态下是一个定值,我们每次通过仪器进行测量所得到的结果都会略有不同。如果我们反复进行测量就会得到一系列数值,那么我们该如何看待这组看似不同的数值呢?从满足类型逻辑思维的角度出发,概率统计学家找到了一种解决方法——大教定律,即随着观测次数的增加,通过计算得到的平均值将变得愈发可靠和稳定,最终趋近于真实值。中心极限定理将这一思想进一步发展并指出这些平均值符合正态分布。当然,这两个统计定律的假定条件是,测量偏差来自微小的、独立的随机量。在专业术语中这类偏差被称为测量误差。
在总体逻辑思维中,偏差是具有重要意义的现实存在。平均值只是总体的一种属性而已;变异则是另外一个同等重要的属性。邓肯在1984年出版的《关于社会测量的注释:从历史和批判的角度》一书中,评价了杰文斯(William Stanley Jevons)关于“均值”(mean)和“平均数”(average)的区别的观点:在对恒定的真实值进行观测时,把得到的各个有偏离的观测值进行平均所得到的结果是均值;而平均数则是通过对一系列相互间存在内在差异的测景数值进行平均而获得。类似地,埃奇渥斯(Francis Ysidro Edgeworth)也将“观测值的平均”和“统计量的平均”区别对待(Duncan, 1984: 108)。在其书的随后章节中,邓肯比较了两种关于统计学的观点,并阐明了自己的主张:“尽管统计学一度被视为‘关于平均数的科学’,但更好的做法是将其描述为‘关于差异的科学’。”(Duncan, 1984: 224)
总体逻辑思想家——邓肯
邓肯曾多次在私人交谈中告诉我,他是一个总体逻辑思想家,而且一直以来都积极提倡社会学中的总体逻辑思维(2002年12月7日、2004年2月16日、2004年5月10日和2004年5月23日)。然而,对读者而言,重要的是从他出版的著作中找到更宜接的证据。为此,我打算引用以下三个例子。
例一
邓肯一生著作等身。在所有这些著作中,他认为1984年出版的《关于社会测量的注释:从历史和批判的角度》是他“最好的一本书……不仅具有历史价值,而且经久不衰”(2004年9月27日,私人通信)。这本包含了他关于社会科学的哲学思想的书,反映出他在社会研究实践问题上广博且具批判性的观点。在这本书中,邓肯明确引用和评述了达尔文的总体逻辑思想:
达尔文对任何自然人群中的变异及其遗传性的强调,实际上为计量心理学提供了总体概念框架,也指明了这一学科与总体科学的密切关系。(相比之下,心理物理学常常受类型逻辑思维的影响,集中于对物种规范的研究……仅仅勉强承认个体间存在变异,将其视为研究的干状而非首要研究对象。)(Duncan, 1984: 210)
邓肯在事业起步阶段,就涉足计量心理学领城并对其产生浓厚兴趣。在其自传(Duncan, 1974)中,他自豪地提到曾将计量心理学的文献介绍给著名的计量经济学家戈德伯格(Arthur Goldberger)。当时路径分析和结构方程模型正处于起步阶段(Duncan, 1974: 19-20)。
例二
豪瑟(Philip Hauser)和邓肯对人口学的经典定义是,人口学“是对人口规模、地城分布、人口构成和人口变迁以及这些变迁要素的研究”(Hauser and Duncan, 1959: 2)。这个精确且深刻的定义被沿用至今(Xie, 2000)。这个定义的精湛之处就在于它明确包括了“人口构成”和“人口变迁”。这表明豪瑟和邓肯坚信总体逻辑思维——任何一个人群中都存在个体差异。
豪瑟和邓肯的定义促使人口学得以作为一门基础的交叉社会学科而蓬勃发展,同时还为其他社会科学学科提供了实证根基。邓肯方法论的中心原则是将实证的现实放在先导性的位置。我们所熟知的很多有关美国社会的“统计事实”就是从事量化分析的社会学家应用人口学方法提供的。例如,种族与性别的社会经济不平等、种族居住隔离、代际社会流动、离婚和同居的趋势、单亲家庭对子女的影响、收入差别的扩大和大学教育经济回报率的增长(Xie, 2000)。
例三
邓肯在给我的邮件(2002年12月7日)中写道:
这里要重申的是:我渐渐忆起我曾经谈过的东西的出处了。参见《关于社会测量的注释:从历史和批判的角度》第96-98页,我引用了哥白尼研讨会上奈曼(Neyman)文章中的论点。看来,不必等到年长才有智慧,我过去就已经有一些睿智的评论了。
收到信后,我去翻他的书(1984),找到了下面这段曾被邓肯引用的奈曼的话:
19世纪兴起、20世纪崛起的科学引入了“多元化”的研究对象。它们作为实体,在分类上确实满足某种定义,然而在个体层面上却有着千差万别的属性。从技术角度而言,这样的分类即“总体”。(Duncun, 1984: 96)
显然。邓肯受到奈曼的影响。相信社会科学就是一种真正意义上的总体科学。邓肯十分警视那些试图效仿物理科学来探寻假想的社会普适法则的做法,因为他坚信这种法则并不存在且毫无意义。
回归分析和路径分析的两种途径
类型逻辑思维和总体逻辑思维是两种科学哲学观点,它们为统计分析——尤其是回归分析——提供了两种途径。回归分析至今仍是量化社会学方法中应用最广泛的工具。我将这两种方法分别命名为“高斯方法”和“加尔顿方法”。我们可以采用以下方法来形象地对其加以区别。
高斯方法(类型逻辑思维):
观测数据=固定模型+测量误差
加尔顿方法(总体逻辑思维):
观测数据=系统差异(组间差异)+残余差异(组内差异)
这两种方法的区别很微妙。因为它只会影响解释,而不会影响到回归参数的估计。研究者们无论对回归持怎样的哲学观点,无论是否认识到这种微妙的区别,均使用相同的数学公式和统计软件,根据相同的统计表格得到统计推论。
一种理解、区分这两种方法的途径是对模型进行简化从而使观测值散布于固定量的周围:
yi = μ + εi (1)
这就是著名的测量模型。在物理学中,科学家们可能知道存在一个固定的量,但碍于测量误差而无法获得。为解决此难题,统计学的测量理论应运而生:在一般情况下(例如,测量仪器没有系统偏误),通过反复调量所得观测值的平均值能精确地接近真实值(Duncan, 1984; Stigler, 1986)。在这种情况下,均值就是回归方程的最小二乘解。
在总体科学(比如社会科学)中,观测到的y 值各不相同,其原因不仅在于测量误差,而且在于它们是同一总体中本质上不同的个体。如果我们关注于对单一量的估计,我们可以运用相同的估计技巧来估计总体均值。这里μ=E(y) ,这一总体中的每个个体yi 都各不相同。即使没有测量误差,我们仍然可以得到不同的观测值yi 。其中,εi 表示第i 个观测值与总体均值的偏差。由于同一总体中不同的个体对应不同的y 值,采用随机(科学)抽样的方法抽取样本并用样本均值去估算总体均值是十分必要的。总体均值是研究中常常求得的众多数值之一。对于第一种情况,观测数据都是通过一个固定且普适的机制生成的,这种回归分析方法被称为“高斯方法”。对干第二种情况,其重点在于用最简洁的描述概括总体差异,这种回归分析方法被称为“加尔顿方法”。邓肯教锐地觉察到两者之间的区别。在《关于社会测量的注释:从历史和批判的角度》(1984)一书中,邓肯借用埃奇渥斯关于观测值和统计量之间区别的定义,即:观测值是一系列围绕真实值的量,而统计量则是同一总体内的不同量。邓肯进而赞同杰文斯的提法,即:我们要对“平均数”与“均值”加以区分,后者与观测量密切相关,而前者则与统计量密切相关(Duncan, 1984: 108)。尽管这两种方法都采用相同的估算过程(比如最小二乘法),但他们的研究目标、研究隐含的假设和对结果的解释有着本质区别。
如果追溯到早期关于路径分析和结构方程的研究,我们可以清楚地看到邓肯一直在用总体逻辑思维进行思考。但这一点并不总是被后继的学者们所领悟与赞赏。我将通过对邓肯和布拉洛克(Hubert M. Blalock)的比较来进一步阐述这一观点。布拉洛克是另一位社会学方法论的鼻祖,他受到赫伯特·西蒙(Herbert Simon)的影响,早于邓肯开始研究因果推理模型。其实,这一比较是邓肯最先做出的。他在早期给我的一封信(1988年4月26日)中附带了他写给统计学家大卫·弗里德曼的回复。谈到我关于弗朗茨·博厄斯(Franz Boa)的文章(Xie, 1988),邓肯写道:“着重强调总体而非类型逻辑思维的观点意义重大。然而我没有能力说服布拉洛克。”
邓肯和布拉洛克均为路径分析和结构方程模型研究的奠基人,但他们对于因果模型的应用却意见相左,邓肯本人也承认这一分歧。布拉洛克认为,这类模型至少可以使人理想性地在“本质的世界”这一框架中去理解普适真理。例如,布拉洛克在其著名的《非实验性研究中的因果推理》(1961)一书中提出这样的间题,即:“为什么不先根据这些理想的模型和完全封闭的系统来建构我们的因果定律和其他理论,之后再去关注现实世界偏离这个模型多少呢?”(Blalock, 1961: 17)在本书之后的章节中布拉洛克还提到,“是回归系数告诉了我们科学的定律”(Blalock, 1961: 51)。我将这种观点称为“高斯模型”回归。此方法认为回归代表了一种唯一、真实且具有定律性质的关系。所有个体观测值的偏差均由无法预测的干扰因素造成。列伯逊和林恩(Lieberon and Lymn, 2002)将这种模仿物理学方法建立社会科学的想法形象地描述为“误入歧途”。
邓肯和布拉洛克对路径分析和回归模型的理解是截然不同的。邓肯不希望将因果关系强加在对结果的解释上。例如,在他与彼得·布劳(Peter Blau)合作的关于代际流动这一最为著名的研究中,两人阐述道:“我们现在还远未达到可以信心十足地进行因果推理的地步,这里提出的方案最多仅能作为对于准确的因果模型的粗略、近似的估计”(Blau and Duncan, 1967: 172)。在他开创性的论文《路径分析》一文的摘要中,邓肯强调,“路径分析旨在强调如何解释结果,而非提供寻找原因的方法”(Duncan, 1966: 1)。此处,邓肯所指的正是加尔顿的回归模型。
彼得·布劳(1918-2002),他受 G.C.霍曼斯的影响,从社会结构出发研究人与人的交往过程,是结构主义交换论的代表人物。[图源:en.wikipedia.org]
高斯和加尔顿的这两种泾渭分明的观点,也体现了邓肯和大卫。弗里德曼两人长期以来在一系列书信往来中的分歧。他们互通信件始于弗里德曼对邓肯在社会科学中运用路径分析的批判。弗里德曼最初批判的对象是布劳和邓肯(1967)的合著,但后来他改变了批判的对象(Freedman, 1987)。
弗里德曼第一次与邓肯通信是在1983年5月31日,这也是他第一次对路径分析进行批判。他批驳的焦点是,结构方程模型在社会科学中被滥用,因为他们假设了一个不能被证实的因果模型的存在(遵循柏拉图的型相论)。邓肯的回信(1983年6月2日)很委婉,信中说道:
在过去的日子里,我渐渐意识到它的种种不足。对于您所引用的我于1975年出版的教材,我也增长了些许见解。由此,我去掉了所有的实证例子,现在,我手边也没有任何例子可以证明这一方法是有效的。
邓肯还将他1984年即将出版的《关手社会测量的注释:从历史和批判的角度》一书的最后一章发给弗里德曼,同时指出其中的一部分是“参考了您(弗里德曼)的意见写”。
邓肯毫无反驳的回信给弗里德曼留下了深刻的印象,他在随后给邓肯的信(1983年6月13日)中写道:
如果我处在你的角度,我绝对无法表现得如此大度。我不愿意别人将我对你的批评视为乘人之危。
我们的工作被奈曼称为“总体科学”,统计方法在此科学中与在“严格意义上的”科学中有着不同的含义和功能。我带望您可以举出一个典型的成功例子,来说明气象学家、地质学家和生态学家在这种情况下是如何有效地处理所收集到的杂乱无章的观测数据的:当无法在严格意义上查复同一研究,而同时叉富要对多个统计量进行估计,并且人为干预几乎不可能或是其效果微不足道的时候。
您对于高斯和加尔顿回归传统的区分似乎是正确的。
在给你面信之后,我反复地思忖你的批判,我想我会进行一些进一步的观察。首先,你将我们书(Blau and Duncan, 1967)中第172页的警示引用到你文章中的第20页令我印象颜深。我们是真诚地提出这些警示的。然而你辛辣的讥讽实在让人难以接受,特别是当你在第8页指责我们没有考虑到教育质量、被访者何时获得教育、何时进入劳动力市场,以及历史、经济、世界大战和经济萧条这一系列因素时。请问,一个模型在将所有这些因素都包括进去的同时,还有可能保证简洁性吗?
从模型的角度来讲,社会学家最感兴趣的似乎是归纳法,希望有可能通过极据分析“发现”正确的模型,尽管这个希望很渺茫……我个人认为,经济学家更坚信自己的理论,他们认为理论和摸型相比,理论是优先考虑的信息。因此,他们更注童“估计”的有效性。
在查阅路径分析的有关文献时,我已觉察到经济学家果用了另外一种方法。具体地说,采用路径分析的学者致力于将简约形式的系数解构成结构方程的系数,将后者看成前者的组成元素。大多数经济学研究的思路恰恰相反——这里我仅指理论经济学和计量经济学。我们致力于从结构煤型中获得它的简约形式。
我们经常发现被我称为统计至上主义的症状:统计至上主义认为做研究等同于计算,同时天真地相信统计是科学方法论完整或充分的条件基础。他们迷信于统计公式能够评估具有不同实质意义理论的相对价值,或者评估影响因变量的原因的重要性。他们误以为解构任意或随意组合的一组变量就可以检验“因果模型”和“测量模型”。(Duncan, 1984: 226)
我们最想强调的主题是,所有统计模型和方法的应用都要严格服从以科学为中心的任务。这个任务需要用公式表达让人信服的理论,使得这些理论可以解释我们所研究的社会过程;同时这个任务还需要制定出能够对这些理论进行检验的研究设计方案。我们应鼓励读者对统计模型提出质疑,让他们知道我们基于可用数据所提供的最佳统计模型,与描述人们拥有并实现他们选举倾向的整个过程的科学模型还相去甚远。我们希望可以找到其他更好的方法来解决这一问题。(Duncan and Stenbeck, 1988: 2)
我们认为是时候纠正如下的不平衡了:一方面,数据分析中统计方法的应用和简化教据的统计模型发掘太多;而另一方面,所发展的纯正的有解释力的“结构”模型太少。方法论的核心任务在于对研究设计进行批判——而非履示统计推断的技巧——正如研究型科学家们的核心目标在于提出适当的研究设计,迫使“自然”展示出其运作的真实过程。(Duncan and Stenbeck, 1988: 31-32)
log [ pij / (1-pij) ] = θi + βj (2)
对数线性模型和线性模型实际上都是无法使用的,因为它们估计的条件概率对于预先假定拥有一系列相同变量值的个人而言其实并不相同。也就是说,这些模型不能应对异质性问题。
这些日子,我回顾了一下自己曾有过的一些争论,发现社会科学中还没有解决的两三个主要问题之一就是异质性问题……弄质性问题的普遍性意味着。在大多数情况下,我们用精算概率代替真正的个人概率,因此,我们得到的是描述上准确但毫无理论意义且无预测能力的、无用的统计数据。
经济学家从错误的假设中正确地推理;而社会学家却从正确的假设中错误地推理。因此,他们成了两个无知的互补体。(邓肯致谢宇,2003年6月28日)