社会研究的统计应用.pdf

社会研究的统计应用.pdf
 

书籍描述

编辑推荐
《社会研究的统计应用》作者李沛良先生为香港中文大学崇基学院院长,本书详细地介绍了社会研究中各种相关的数学统计方法。从较简单的统计叙述开始,逐次进入统计推理、多变项分析和社会变迁分析,循序渐进,层次分明。本书内容丰富,深入浅出,力求文字简明,避免繁复的数学报算。

媒体推荐
作者序
当我完成本书的增改工作,准备送交中国社会科学文献出版社谢寿光先生的时候,不禁想起与本书相关的20年前旧事,更怀念刚于今年1月辞世的杨庆堃老师。我决定执笔,把这些涌上心头的往事与怀想写成本书的序言。
社会学起源于19世纪中叶欧洲的法、英、德等国家,20世纪中叶则在北美遍地开花,蓬勃发展。社会学在西方有170多年历史,在中国的年龄也有100年左右了。自从严复把英国社会学
大师斯宾塞(Herbert Spencr)的《社会学原理》(Principles of Sociology)翻译为《群学肄言》,于1903年发表以后,社会学即备受中国知识分子重视。10~40年代间,各地国立和私立大学(如厦门、燕京、清华、复旦、中央、沪江、金陵、岭南等)相继设立社会学课程,并展开多项农村地区和贫困地区的调查,引发民众对社会问题的关注和对社会改革的要求。
但是,中国社会学自1952年院系调整期间被取消以后,到1979年才乘着改革开放的新形势,获得重建的机会。当时,邓小平同志指出:对社会学的研究,我们过去多年忽视了,现在需
要赶快补课。
重建社会学的工作甚艰难,人才与教材皆缺乏。一个关键性的机缘,就是国内的费孝通教授与其国外的老朋友、老同学杨庆堃教授恢复联系,并且携手共建中国社会学。杨教授于50年代初移居美国,多年来在匹兹堡(Pittsburgh)大学社会学系任教,其对中国宗教以及农村家庭的研究,甚受欧美社会学界重视。更可贵的是他对祖国的热爱和远见。记得,杨教授于1965年夏,以校外考试委员身份访问香港中文大学社会学系。他亲自接见我,并解释为什么要把我这个即将毕业的学生送往美国深造。他说,中国社会学目前虽然黯淡无光,但总会重见天日,为国家的现代化尽一分力量。他计划以香港为基地,为日后中国社会学的重建播下种子。
首先,他与当时香港中文大学崇基学院社会学系主任黄寿林教授合作,送毕业生到匹兹堡大学进修社会学博士课程,而我就是于1965年首名被挑选出来的学生。随后数年,也有几名毕业生到匹大进修。杨教授的另一项计划,是安排匹兹堡大学的名教授(如Burkart Holzner,Jiri Nehnevajsa等)和波士顿大学的陈郁立教授与其夫人沈爱丽教授到香港中文大学任客座教授,协助课程改革、提高学生素质和推动实地研究。
1979年中国改革开放,费、杨二老得到良好机会,合作重建中国社会学。在费教授安排下,杨教授带领多名美国社会学者到北京讲解社会学与现代化的关系,取得中央领导人的信任和支持,并开始拟定培养人才的计划。一项重要的工作,就是由中国社会科学院社会学研究所和中国社会学研究会于1980年夏和1981年夏在北京先后举办两届《社会学讲习班》。除了获得我国著名学者如费孝通、雷洁琼、吴文藻、陈道等作专题演讲外,更在杨庆堃教授的协助下取得岭南基金会的资助,并且请到多名美国社会学者与香港中文大学教授来讲课。而我就是其中一位讲员,于1980年第一届讲习班负责《社会调查与统计分析》的课程,上课4周,每周5天,每天3小时,合共60小时。本书就是根据当时用的教材编写和增改而成。
讲习班的学员有41名,来自北京、上海、天津、辽宁、黑龙江、吉林、新疆、广东、四川、湖北、贵州、陕西等12个省、市、自治区的社会科学教学或研究单位。他们在课程完结后,把我的教材编写成一套讲义,使更多人有机会学习。由于该讲义是课堂的记录,未经审核,错漏难免。后来,得到讲习班的主办人正康教授的建议和安排,让我修正讲义,并于1987年由湖北人民出版社出版,书名《社会研究的统计分析》。可惜的是,发行量很少,许多地方的人都买不到。后蒙台湾巨流图书公司的熊岭先生赏识,请我把书的部分内容修改以适合台湾社会情况,然后让其公司出版。台湾版本于1988年发行后,颇受高等教育界欢迎,到1997年已有七印了。但是,中国大陆的老师和学生不易买到。
……

作者简介
李沛良,香港中文大学社会学讲座教授兼崇基学院院长。著有《现代社会学国际评论》、《卫生转移评论》等。

目录
作者序
第一篇 导论
第一章 科学方法与社会研究历程
第二篇 统计叙述:单变项与双变项
第二章 简化一个变项之分布
第三章 简化两个变项之分布
第四章 相关测量法与测量层次
第三篇 统计推论:单变项与双变项
第五章 抽样与统计推论
第六章 参数值的估计
第七章 假设检定:均值与百分率
第八章 假设的检定:两个变项之相关
第四篇 多变项分析
第九章 详析模式与统计控制
第十章 多因分析
第十一章 因径分析
第十二章 定类或定序依变项回归分析(彭玉生)
第十三章 多项互关分析
第五篇 社会变迁分析
第十四章 趋势资料分析法
第十五章 同组分析
参考书目
附录

文摘
书摘
第一步是统计分析,将众多的资料作综合运算。首先是运用适当的叙述统计方法,把所得到的资料简化,使我们容易理解。我们要简化每一个变项的资料,也要简化变项与变项之间的关系。如果所研究的是一个样本,那么我们也要运用适当的推论统计方法,用样本的研究结果来推论总体的情况。
一个严谨的研究,在未分析变项与变项之间的关系之前,应该先检验每个变项的测量信度(reliability)和测量效度(validity)。如果用相同的方法重复测量变项时所得的资料是很吻合的,就表示该变项的测量信度很高。例如,重复询问各老师的专业资格时所得的答案如果相近,就显示这个变项的资料的信度甚高。所谓测量效度,是指所得的资料是否与测量的目标相吻合。例如,我们的测量目标是老师的专业资格,如果所得的资料大部分只包括老师的教学年期(即答非所问),就表示测量的效度颇低了。当然,信度高不等于是效度高,因为重复地测量所得的资料,即使是互相吻合(信度高),却可能是重复地错误(效度低)。我们进行研究时,最好是先确定每个变项的测量信度和效度,才开始运用统计方法分析资料以求验证假设。检查信度和效度的方法颇多,可以参看社会研究法的专门书籍;由于篇幅所限,不在这里介绍了。有一点要提出的是,信度和效度的分析,可以在前述的试点研究中进行,减少日后错误的机会。当然,即使在试点研究中已确定信度和效度,也应该在大规模研究中收集资料以后,再次鉴定,才算妥当。
第二步是解释研究结果。我们要问:为什么变项与变项之间会发生这种关系呢?在筹划研究的阶段中,我们已对假设提出若干解释(见第一节第四项),但现今在搜集和分析资料以后,可能发现以前的解释不对或不够成熟,故要在这里提出更精确和更周详的解释。要注意的是,研究结果与原来的假设可能一致,但也可能不一样。如果研究结果是否定原来的假设,我们就须要解释为什么如此。在科学研究中,推翻假设是一件重要的事,不可轻易放过,但要尽可能说明为什么原来的假设不对。假如,在上面的研究中发现父母教育水平愈高但办学成绩愈低的情况,我们就要尝试加以解释,比如说:可能是父母的教育水平虽然高,但他们担任的社会职务也多,开会的时间也多,顾不得教育子女,因此对其子女的学习成绩并无帮助。这样,当有人再说,父母的教育水平高,其子女的学习成绩就会好时,我们就会说:那不一定,这要看他的父母有没有时间对他进行学习上的指导和帮助而定。当然,这种说法,还有待于将来的研究予以证明。
第三步,说明你的研究结果有什么贡献。讲理论的贡献,还要讲实际的贡献。一个好的社会学研究员,要尽量说明这两方面的贡献。把具体的研究资料推广于更大范围,务求置诸四海而皆准,这就是理论贡献。例如,从刚才的例子中,我们可以指出学校的办学成绩除要视乎学生的素质以外,也要视乎学校与社会是否提供一个优良的学习环境。决定学习环境的因素中有两个是重要的,一个是教师的素质;一个是家庭教育。假如教师素质好和家庭教育好,就会造成优良的学习环境,学生的成绩就会好。推而广之,这就成为教育社会学的一项理论。这就表示了我们的理论贡献。再者,我们不要做书呆子,只讲理论问题,应该对国家作出实际的贡献。譬如,我们的研究发现教师素质和父母教育水平会影响学生成绩,那就可以提议提高教师的水平,同时给父母提供一些学习时间,如办些成人进修班等。
最后,要提供若干新的研究题目,即使自己未能解答,也要提议别人去寻求答案。我们在整个研究过程中一定会发现很多新问题,是以前没有想及的,但值得将来作进一步的研究。例如,可能发现有些父母虽然自己的文化水平低,但他们很重视教育,拼命鼓励子女多读书,子女的学习成绩就好。又如,在研究时发现乡镇学校距离城市的远近,可能会对教学成绩有影响,这是因为接近城市的学生见闻多,边远地区学生的见闻比较少。又比如说,我们发现乡镇学校除了教师的素质问题,还有统一教材与乡土教材的问题。再如,师生比率的高低或男女学生比率的差异,也可能影响学校的办学成绩。上述各点,皆可作为日后的研究题目。从这里我们可以看出,科学研究是有累积性的,既是解决问题,但也提出新问题。任何科学研究一定要积累起来。这样每积累一次,我们对人们的社会行为就越来越了解。每次的积累,皆要经过上述的研究历程:筹划、执行和总结。

在分析一个定序变项与一个定距变项的相关时,除了可以应用相关比率系数以外,也有些社会学研究会将定序变项看做是定距变项,因此采用积矩相关系数,甚至进行线性回归分析。如教育水平分高、中、低三项,本是定序变项,但我们可以给分数如下:高=2、中=1和低=0,然后将这些分数当做是定距资料来分析。又如在分析家庭收入时,可使高收入家庭得1分,而低收入家庭得0分,然后以r系数来测量其与英文水平的相关。实际上,这些分数(0,1,2等)只具有等级的含义,没有定距层次的数学特质(即不能作加减运算)。如果我们要坚持严谨的科学态度,就不应运用积矩相关法或回归分析法。然而,有不少社会学研究都抱着“虽不中亦不远矣”的态度,还是将定序资料看做是定距资料,为求方便统计分析。同理,如果两个变项都是定序变项,理应用Gamma或dv,但也有不少研究是采用r系数或回归分析。在当前的社会学研究者中,大部分还是接受这种做法。其中的一个重要原因,是在积矩相关与回归分析法的基础上比较容易进行多变项(即两个以上变项)的统计分析。关于此问题,本书将于第三编详细介绍。

教育水平是定序变项,如将之看做是定距变项,那就可以应用积矩相关与简单线性回归法来分析其与精神病征的关系,而不用进行虚构变项回归分析这样麻烦。然而,虚构变项的回归分析有一个好处,就是不用假定是直线关系,因而可以显露非直线的效果。如在上例中,中等教育水平的效果大于高教育和低教育,显示教育水平对精神健康的影响是非直线性的。倘若我们是采用简单线性回归分析和计算以直线关系为基础的积矩相关系数,就可能错误地理解这两个变项的实际关系(参第四章第四节)。因此,无论是定序或定距变项,如果我们认为效果可能是非线性的,则可采用虚构变项回归分析。如是定类变项(如婚烟状况),那就更要用虚构变项回归法来比较各类的相对效果,然后计算复相关系数值来表示其与另一变项的相关程度。

所谓直角旋转法,就是要求各个因子在旋转时都要维持直角的关系(即互不相关)。在直角旋转时,每个变项的共量是不变的。这类旋转的方式,基本上有两种做法:变值尽简法
(varimax solution)和因值尽简法(quartimax solution)。变值尽简法,是在旋转时要尽量弄清楚在每一个因子上的各个变项的因子负荷情况,也即使到因子矩阵中每一列的a值尽可能变为1或0。这种做法的效用是突出每一个因子的性质,使我们清楚知道哪些变项是属于它的。如果研究的目的是要找出多个因子(multiple factor structure),以澄清概念的内容(如前面表13-2所示的例子,是要澄清社会经济地位这个概念的各种性质),就最好是采用变值尽简的直角旋转法。至于因值尽简法,则是在旋转时要尽量弄清楚每一个变项(X;)在各个因子上的负荷情况,即令每一个变项在某一个因子上的负荷尽可能等于1,而在其他因子上则尽可能等于。。这种做法的效用是增强第一因子的解释力,而使其他因子的效力减弱。如果研究的目的是找出一个最强大的因子(single factor structure),就最好是采用因值尽简的直角旋转法。例如,我们要将多个项目组合成为一个尺度,就应采用因值尽简法。除了因值尽简与变值尽简这两种基本做法以外,尚有均等尽简法(equimax solution),它是一种中庸之道的做法,要求同时简化因子与变项的负荷情况,其毛病是可能使得两者都未能尽量清楚。

前面曾多次指出,同组研究的作用大于趋势研究。但是,同组研究并不是没有问题的。首先是遗失个案的问题。同组研究要求调查相同的样本个案,但在第一次调查的样本可能在第二次调查时有一部分已失去,如某些个案不愿再次合作或不能再取得联系等。假如这些遗失的个案可能具有其特殊性,就会严重影响资料分析的正确性。例如,在前述的老人健康调查中,在1997年有1000人,假定在2000年只能找到其中的920人,则在分析转动情况时就只有比较920人,不是原来的1000人。若遗失的80名老人可能都是由于死亡或病重而不能接受调查的话,那么我们就会因此而在转动分析(n = 920人)时高估了老人的健康状况。所以,在研究时,我们要特别注意所遗失的个案是否有其特殊性,要加以认真的分析,以决定所得的同组资料是否有代表性。一般来说,相隔的年期越长和重复调查的次数越多,遗失问题就越严重。
另一个问题是前期测量的效应,即在前一时期测量个案的情况时所用的测量方法可能改变了个案的思想和行为,因而影响了后期的测量的准确性。例如,以一组问题来测验青年人的政治水平,而这次测验却可能使这些青年在日后特别留意被问及的政治问题,因而在第二次再接受测验时便显得政治水平提高了。另一种的可能性是,有些青年人在第二次测验时仍然记得他们在第一次测验所填写的答案,由于不愿意表示自己是一个三反四复的人,故此虽然是政治水平已有改变,但仍然填写相同的答案。种种的可能性,都会歪曲了真实的转变情况。一般来说,前、后两期相隔越短,前期测量的效应就越大。如要解决这项问题,除了要酌情将相隔年期加长以外(但会引起更多遗失的个案),最好是成立一个控制组,将之与原来的样本相互比较(参第一章第一节讲的实验设计),但这种做法却会使研究代价加大,而且要先确定这两组人的背景是相同的。
当前的社会学研究大多数是采用社会调查方式,即在自然环境中搜集资料,然后用本书所介绍的种种统计方法来分析各个变项之间的关系。由于人力和物力所限,大部分调查是属于横剖研究,即在某一时期收集资料。如果在不同时期向同一样本收集资料,就成为同组研究。其实,同组研究的基本逻辑,是相当于实验法中只选用一个实验组,其前、后两期的资料搜集就是相当于实验法中“实验前”和“实验后”的测量。因此,同组研究比横剖调查研究更能精密地证明因果关系。倘若能够加上另一个样本作为“控制”样本,模仿典型实验设计的逻辑,那就更美满了。近年来,在社会学界兴起了评估研究(evaluation research),以鉴定某项措施(X)是否引起某些思想或行为(Y)的改变,就是大多采用以实验设计为基础的社会调查研究。有兴趣的读者,可参阅Suchman 1967,Saxe and Fine 1981。
……

内容简介
《社会研究的统计应用》详细介绍了社会研究中各种相关的数学统计方法。从较简单的统计叙述开始,逐次进入统计推论、多变项分析和社会变迁分析,循序渐进,层次分明。本书内容丰富、深入浅出,并有两个鲜明的特点。第一,本书主要是介绍社会学常用的各种统计方法,并且尽量将统计分析与社会学知识相结合。第二,本书偏重统计方法的应用,而非数理基础。力求文字简明,避免繁复的数学推算。因此,对于社会科学各门学科的研究者来说,它都是一本不可多得的教科书和参考书。

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多