北京大学社会学考研资料社会调查原理与方法名词解释.docx_考研文库kaoyanwenku.com-

资源描述

新祥旭咨询电话：17521023199（同微信）概论一、社会研究中的一些辨证关系1、个案式和通则式解释模式个案式解释一种解释方式，在这种解释方式中，我们试图穷尽某个特定情形或是事件的所有原因。通则式解释一种解释方式，在这种解释方式中，我们试图寻找一般性地影响某些情形或者事件到原因。二、社会研究的伦理（导引 P102）1、自愿参与2、对参与者无害自愿参与和不伤害参与者已经越来越正式化，形成了“知情同意”这种规范要求，基于自愿参与的原则而进入研究的对象，必须完全了解他们可能受到的危害。3、保护研究者权益（匿名与保密）匿名当研究者和读者都不可能将回答和回答者对应起来时，这个研究就可以说达到了匿名的要求。保密当研究者能够指认特定研究对象的回答，但是承诺不会将其公开时，该研究就达到了保密的要求。任务报告和对象交流，让他们了解其在研究中的经历。当存在伤害参与人的可能性时，这种报告是尤为重要的。三、两种逻辑体系1、科学的传统模式（三大要素：理论、操作化与观察）首先，对真实世界的某些方面产生兴趣，提出理论假设关于经验事实的可检验的特定期望，它遵从更为一般性的命题；更为一般地说，它是关于来自理论的事物的本质的期望。是关于在现实世界中应该能够观察到什么的期望假定理论是正确的话。其次，检验假设是否成立：1.对假设中的变量进行定义2.说明如何测量变量，即操作化走出概念化的一步，是发展操作定义的过程，或是对在测量变量时所用到的精确操作的说明。3.说明变量的意义，即操作定义根据对观察进行分类的操作而做出的具体的、特定的定义。新祥旭咨询电话：17521023199（同微信）零假设与假设检验和统计度显著检验相关的假设，该假设认为政治被研究的变量之间不存在相关关系。在统计上否定了零假设之后，就可以得出结论，认为变量之间是相关的。最后，观察现实世界并测量所看到的现象。接受或拒绝假设。2、归纳推理观察寻找模式获得结论研究设计一、通则式研究的解释逻辑通则式因果关系的准则：（1）变量之间必须相关两个变量之间的经验关系，如一个变量的改变影响到另一个变量的改变，或者一变量的特定属性跟另一变量的特定属性相关。相关本身并不意味着两变量之间的因果关系，但确实因果关系的一个标准。（2）原因必须先于结果发生。（3）非虚假关系两变量之间巧合性的统计相关，其实是由第三个变量引起的。通则式因果关系的错误标准（1）完全原因：通则解释是概率性的，通常是不完全的；（2）例外案例：通则式解释并不否定例外案例；（3）多数案例：即使因果关系可能不适用于多数案例，关系还可以是真实的。专题群体研究一种历时研究，其中的数据是从不同的时间点的同一批对象收集起来的。能提供随时间变化的综合性资料，但样本量减损会导致差异。兴趣群体访谈法（引导式小组讨论）新祥旭咨询电话：17521023199（同微信）研究的建构一、概念化1、指标与维度维度概念的一个可指明的方面，概念的具体层面或具体方面。区分概念的不同维度可以加深我们对研究事物的了解。指标互换性如果多个不同的指标或多或少代表了同一概念，而这个概念既真实又可被观察，代表这些指标的行为就会与代表这个概念的行为一致。2、真实定义、名义定义与操作定义真实定义反映了术语的具体化，试图制定概念“真实”的努力只会导致困境：将概念结构错当成了真实的实体。详述使得概念更为明确的过程。依赖于名义定义和操作定义。名义定义指某个术语被赋予的意义，无需指标真实，是任意的。操作定义明确、精确地规定了如何测量一个概念，即如何操作。更接近于名义而非真实定义。3、概念次序的建立二、评估测量质量的标准1、精确性和准确性2、信度指的是测量方法的质量，即对同一现象进行重复观察是否可以得到相同的资料。（1）前测后测法（2）对分法（5:5）（3）利用已有的测量法（4）工作人员的信度：测量缺乏信度也可能是工作人员所致，由多种方法来检查这种信度，如复证。此外明确、具体、训练和练习都是避免出现信度问题的有效方法。3、效度指的是测量准确地反映了需要测量到概念。表面效度衡量一个指标到品质，即该指标看起来是否能对某变量进行合理测量。新祥旭咨询电话：17521023199（同微信）标准关联效度某测量与外在标准相关的程度。建构效度在某理论体系内，某测量与其他变量相关的程度。三、指标、量表和分类法1、指标和量表指标一种复合测量，它包含了多个具体的观察，并代表着一些更一般的维度。量表一种复合测量，由多个具有逻辑结构或是经验结构的项目组成。量表的例子包括鲍嘎得社会距离量表、瑟斯东量表、李克特量表、哥特曼量表。相同：指标和量表都是典型的对变量的定序测量，既根据具体变量（如信仰虔诚度、疏离性、社会经济地位、偏见或是智商等）的分析单位进行排序。区别（通过分值分配方式）：指标往往通过单个属性到分值积累来建立，如通过加总受访者赞成的偏见陈述的数量来测量偏见；量表的建立则是通过对问题的不同反应模式赋予相应的分值，使不同选项反映变量变异程度的强弱。量表利用了任何存在于各种属性之间的差别。一般而言，量表优于指标，因为量表能测量变量的强弱程度，量表分值所表达的信息比指标多。2、指标的建构（1）项目选择A.表面效度选择指标项目的首要标准使表面效度（或称为逻辑效度）；B.单一维度指标还应具有单一的维度，如反映宗教虔诚度的项目绝对不能包括在测量政治保守程度的项目中，即使两者有经验上的相关度；C.变异值选择某个指标项目时，应该注意项目之间的变异值，如就有关政治保守度的项目而言，应该更多注意被归类为政治保守的受访者所占的整体的比例，如果结果显示无人被归类为保守者或每一个都时保守者，则上述项目对于指标的建立而言就没有用处。为了确保项目之间存在变异，可以考虑两种方式：第一，可以根据受访者对某变量多个项目的回答将其分为多个大小相同的群体：如一半是保守派一半是自由派。第二，选择彼此有差异的项目。这点对于指标和量表的制定都是不可或缺的。（2）经验关系的检验（社会研究方法 P153）指标建立的第二个步骤是必须考察项目之间的经验关系。如果两个项目之间是经验相关的，我们就可能合新祥旭咨询电话：17521023199（同微信）理地人为两者都反映了同一变量，也就可以将它们放在同一指标里。项目之间，存在两种类型地可能关系：1.二元关系就是两变量之间地关系。如果项目之间没有关系，则这两个项目就不是在测量同一个变量。因此，如果某个项目与其他所有项目都不相关，则该项目就应该被排除在考虑之外。如果两个项目之间有很强地关系或完全相关，在建立指标时就只需要保留其中一个项目，因为被保留的项目能够完全涵盖另一个项目所表达的意义2.多元关系（3）指标赋值在选定了指标的最适当的项目之后，就可以对不同的回答选项赋予分值，以建立单一的复合指标。在这个步骤中包括两个基本决策：1.必须确定指标分值的范围。指标相对于项目的最主要优势，就是它可以测量变量的变异程度。（1）指标应该有一个范围；（2）指标范围内每一点应该有组都的样本数2.给每一个回答选项赋值。首先要确定的时给每一个回答选项相同的还是不同的权重（使用不同的权重时必须有确切的理由，一般做法时使用相同的权重），如果指标代表的是某个变量不同方面的复合情形，那么每个方面就应该有相同的权重。此外也要考虑到样本的分布状态。3.赋值方法的选择一定是协调各种要求的结果。（4）处理缺损资料首先，如果缺损资料的样本量很少，在建立指标和分析资料时就可以剔除这些样本。（会造成研究结果代表性的误差）其次，可以根据既有的回答来处理缺损资料。如通常选择“是” ， “否”的回答空着。第三，如果仔细地分析缺损资料，也能了解其含义。其他，如某一项目可能有多种分值，缺损资料分值就应该是分值范围的中间值。或用随机方式给缺损资料赋值。如果用多个项目创造指标，则可以用观察值的比例值来取代缺损资料。最好最安全的方法，就是用其他方法建构指标，看看是否有同样的发现。不管怎么说，理解资料才是最终的目的。（5）指标的鉴定鉴定的基本逻辑是该复合指标可以用于测量变量，即可以根据不同样本所得到的指标分值进行等级排序。新祥旭咨询电话：17521023199（同微信）1.项目分析指标鉴定的第一步，即内在鉴定，被称为项目分析评估复合测量中所包含的每个项目是具有独立的贡献还是只是复制了其他项目的贡献。2.外在鉴定通过检验某测量（如指标或者量表）和测量同一变量的其他指标之间的关系来判断该测量的效度。指标无法通过外在鉴定有两种可能：（1）指标无法充分测量变量（2）检验项目无法充分测量变量，进而无法检验指标。首先应该重新考察指标本身，谈后再看是否因为外在鉴定项目与指标中个别项目有关系，与另一些指标没有关系，那么就会增强对建立指标的理解。3、量表的建构（1）鲍嘎德社会距离量表用于判断人们进入其他类型对社会关系的意愿的一种测量技术，长项在于能够在不丢失原始信息的同时汇总多个不连续的回答。（2）瑟斯东量表一种复合测量，根据“裁判”对变量的指标给出的权重来建构。其试图在变量的指标项目之间建立一种经验性结构，其中最常出现的是“等距”结构。使用频率不高，只要原因在于项目的确定必须有 10-15 个裁判对项目打分，需要花费大量的时间精力，裁判的质量取决于它们对变量的认识和经验，只有专家才做得到。再者，组成变量的项目的含义也会随时间的演进而有所改变，某个项目可能在不同的时候有不同的分值，为增进量表效果就需要每隔一段时间进行更新。（3）李克特量表李克特发展出来的复合测量类型，它试图通过在问卷调查中使用标准化的回答分类来提高社会研究的测量层次，并一次来决定不同项目的相对强度。李克特项目就是利用诸如非常同意、同意、不同意、非常不同意这样的回答来分类。这些项目在李克特量表的建构中会用到，同时也可以用在其他类型的复合测量中。（2）语意差异受访者被要求根据两个相反意义的形容词来评价某事的一种问卷格式。其中会用到一些限定词来连接这两个形容词，比如“十分” 、 “有些” 、 “都不” 、 “有些”和“十分” 。（3）哥特曼量表用于总结多个不连续的观察的一种复合测量，它代表了一些更加概括的变量。其逻辑基础是，受访者主要支持某个较强的变量指标，就一定会支持较弱的指标。该量表的基础是真实观察资料的结构，能够构成哥特曼量表的只是那些被用于分析的一组资料。4、分类法根据两个或多个变量的属性来对观察进行分类（典型地体现在定性研究中）。比如，将新闻分为自由主义城市，自由主义农村，保守主义城市，保守主义农村。（当作自变量来分析不会有什么问题，但当作因变量来分析，问题就会非常大）五、抽样逻辑（研究设计与社会测量导引 P54）新祥旭咨询电话：17521023199（同微信）1、两种抽样方法概率抽样根据概率理论来选择样本的方法的总称。一些随机选择机制就是典型。具体的概率抽样类型包括 EPSEM、PPS 简单随机抽样和系统抽样。非概率抽样抽取样本的方式并不依据概率理论。比如就近抽样、目标式（判断式）抽样、配额抽样和滚雪球抽样。2、非概率抽样（1）就近抽样指研究者将在一定时间、一定环境里所能遇见到或接触到的人均入选样本的方法。优点：方便省力缺点：样本的代表性差，有很大的偶然性（2）目标式或判断式抽样一种非概率抽样，其选择观察对象的方式是以个人的判断（对象是否最有效或者最有代表性）为基础的。在无法确定总体边界，或因研究者的时间和设备有限而无法进行概率抽样时，可选用。其目的作用是发现问题，提出假设，而不是在于对总体做出概括。（3）配额抽样一种根据预先了解的总体特征来选择样本的方法，这样就能保证样本的特征分布和所要研究的总体一样。(4)滚雪球抽样一种经常用于实地研究的非概率抽样方法：每个被访问者都可能被要求介绍其他的人来参与访谈。（5）选择线人对你所渴望研究的社会现象相当熟悉的人，而且他还愿意告诉你他所知道的，注意不要和受访者混为一谈。线人应该时研究对象的群体中具有代表性的人物。3、概率抽样的逻辑背后的观念：要对总体进行有用的描述，从该总体中抽样出来的样本必须包含总体的各种差异特征。（1）有意识与无意识的抽样误差（2）代表性与选择概率代表性就是样本具有跟其所从中挑选出来的总体相同的特征。通过对样本的分析所得出来的描述和解释也同样适用于总体。代表性给概化和推论统计提供了可能性。在概率抽样下，代表性会更好。EPSEM（等概率抽样方法）在这种样本设计中，总体中的每个成员都具有相等的被选进样本的机会。即如果总体中的每一个体被抽取为样本的概率相同，那么从这个总体中抽取的样本就具有对该总体的代表性，具有这一性质的样本通常被称为 EPSEM。概率抽样的优点：新祥旭咨询电话：17521023199（同微信）1.概率抽样虽然无法完美地代表总体，但较其他抽样方法更具代表性，因为它能避免我们讨论过的各种偏见。2.概率理论使我们能够估计样本的精确度及代表性（3）随机选择要素构成总体的单位，也是样本所包含的内容。要注意区别资料分析中的分析单位。总体理论上研究要素的特定集合体。研究单位从中选抽出样本的全体要素总和。抽样单位在一些抽样阶段所要考虑到的要素或者某组要素。采用随机抽样的原因：1.这一过程可以避免研究者自觉或不自觉的偏见。2.随机抽样为我们进入概率理论提供了契机，而这一理论提供了估计总体参数和抽样误差的基础。（4）概率理论、抽样分布和抽样误差评估概率理论是数学的一个分支，为研究者提供了设置抽样技术和分析样本结果的工具。更一般地说，概率理论为估测总体参数提供了基础。关键就在于抽样分布。概率又称或然率、机会率或机率、可能性，是数学概率论的基本概念，是一个在 0 到 1 之间的实数，是对随机事件发生的可能性的度量。参数对总体中的某变量的概括性描述。(5)样本分布和抽样误差的评估统计量对样本中的变量的概括性描述，并被用来估测总体参数。抽样分布的问题：1.如果我们由总体内随机抽取许多独立的样本，这些随机抽样所得到的统计结果将以一种可知的方式分布在总体参数附近。2.概率理论也提供给我们计算公式，以估计这些样本统计值与真实值的差距。也就是说，根据概率理论，我们能够估算抽样误差（sampling error）概率抽样中的误差程度。决定抽样误差的公式包括三个因素：参数、样本规模和标准误。(社会研究方法 P190)（6）置信区间和置信水平置信水平总体参数值落在一既定置信区间的估测概率。比如我们有 95的信心说 35-45的投票者会新祥旭咨询电话：17521023199（同微信）支持候选人 A置信区间估测总体参数值的范围。4、总体与抽样框抽样框是总体要素的列表或准列表。要保证样本对总体的代表性，抽样框就要包含所有的（或者接近所有的）总体成员。1.抽样框必须和我们所要研究的总体是一致的；2.经过正确抽样所得的样本信息，只适合于描述构成样本框的要素组成的总体，不能再扩展；3.即使总体与抽样框是一致的，为了说明组成抽样框的总体，所有要素必须具有同等的代表性：基本上，所有的要素应该只在名单中出现一次。在名单中出现多次的要素会有比较大的机会被抽到，因此，这样的调查结果将会有偏差。5、抽样设计的类型（1）简单随机抽样（SRS）在这种概率抽样中，代表着总体的单元用一个数字来代替，这样就有了一个随机数字表。在挑选样本时直接选取这些数字即可。这种方法很少用，原因：1.除了简单随机抽样方法以外，还有其他方法可以选择；2.这种方法可能并不是最精确的。缺点：工作复杂、费用高、费时，在总体异质性较高时误差较大。（2）系统抽样选择完整名单中的第 K 个要素组成样本的概率抽样方法。用总体数量除以 K 就是样本规模。K 就是抽样间距。在某些情况下系统抽样与简单随机抽样方法几乎是一致的，还比较简单易行。第一个要素通常都被随机选中。抽样间距从总体中选取样本的标准距离。抽样比率被选择的要素与所有总体要素数量的比率。优点：1.比简单随机工作量少，简单易行。2.样本在总体中的分布更均匀，抽样误差小于或之多等于简单随机抽样，较其更精确缺点：如果总体的排列出现有规律的分布是，就会使系统抽样产生很大误差，即周期性误差，降低样本的代表性。（3）分层抽样在抽样之前将总体分为同质性的不同群或层。这一程序能够提高样本的代表性（起码就分层变量而言是这样的），它还可以和简单随机抽样、系统抽样或整群抽样结合起来使用。适用于总体新祥旭咨询电话：17521023199（同微信）内个体数目较多，结果较复杂，内部差异较大。分层的最终功能，在于将总体分成几个同质的次集合（之间有异质性），然后从每个次集合中抽出适当数量的样本。分层变量的选择方法通常依赖于现有的变量，如从名单中分辨出性别等。除选择适当的分层变量外，提高分层样本的精确度还必须力求符合分层的原则，即尽可能使各层内部保持同质，以简化总体的构造，使各层之间具有明显的差异性，以便包括总体的各种特性。样本的精确度还于分层数目及样本大小密切相关，分层越细，样本越大，则样本的代表性越好。优点：1.提高代表性，同时减少可能的抽样误差。2.有些研究不仅要了解总体的情形，还要了解某些类别的情形，该抽样方法可以同时满足这两个要求。此外，对总体的不同不分还可以采用不同的抽样方法。（4）多级整群抽样只要该群（丛）被选中，则该群中的所有成员都进入随后的子样本，比如，你可以先从目录中选择美国的大专院校，然后丛被选中的大学的学生名单中挑选学生样本。适用于界质不清的总体。原则：使各个群间的异质性低，而群内的异质性高。不同于分层抽样。并且尽可能地多选取群，而减少每个群中要素到数量。优点：1.可以通过转换抽样单位扩大抽样的应用范围；2.可以节省人力、财力，效率高。缺点：样本分布不均匀，样本的代表性差。有两次误差：对整群进行的初次抽样只在一定的抽样误差范围内代表整群所组成的总体；对其中任何一个被选中的群体的要素进行抽样，同样是在一定的抽样误差范围内代表该群的所有要素。多级整群抽样中的分层：每一个阶段到抽样，都可以使用分层法。一个被选取的群的要素，也可以在被进一步抽样之前加以分层。概率比例抽样一种更为成熟的多级整群抽样形式，其中的群被选取的概率并不相等，其被选中的概率和其规模大小根据其子样本的数量来衡量成比例。当抽样的群的规模很大时，就应当采用这种修正的抽样设计。（5）非比例抽样和加权加权赋予不同概率入选样本的要素不同的权重。最简单的，每个样本要素的权重为其被选中概率的倒数。当所有的要素入选样本的几率相同时，也就无需加权。当所有样本要素被选中的机会都相同时，每个要素被赋予的权重也相同，即为 1。这叫做“自加权”样本。

展开阅读全文