两种研究类型的特点
调查设计
调查设计是对调查研究所作的周密计划,是调查研究取得真实可靠结果的重要保证,包括资料收集、整理和分析各个环节以及整个调查过程的统计设想和科学安排。
1.制订调查计划
(1)明确调查目的,确定调查对象和观察单位 明确调查目的是调查研究中最核心的问题。根据调查目的来确定调查总体、调查对象和基本调查单位,以保证调查对象具有同质性。
(2)确定调查方法
1)普查:普查就是全面调查,即对总体中所有的观察对象进行调查。理论上普查不存在抽样误差,可以直接得到总体参数。一般而言,普查规模大,往往非抽样误差也较大。
2)抽样调查:抽样调查是从总体中随机抽取一定数量且具有代表性的观察单位组成样本,然后用样本的信息来推断总体特征。相对普查而言,抽样调查可节省调查成本,有助于获得较为细致和准确的资料。
3)典型调查(案例调查):即有目的地选定典型的观察单位进行调查。典型调查采用的是非随机抽样,不能作统计推断。
(3)确定样本含量:为提高总体特征的估计精度,在抽样调查前,应估算调查所需的样本含量。
(4)确定观察指标:调查设计时,应将调查目的转化为具体的观察指标,通过指标来达到目的。指标要精选,尽量用客观、灵敏、精确的定量指标。
(5)拟定调查项目和调查问卷:根据调查指标确定的调查项目,通常包括分析项目和备查项目。分析项目是直接用于计算调查指标以及分析因素间的相互影响所必需的内容;备查项目是为了核查、填补和更正而设置的,一般不直接用于分析,如编号、姓名、地址及电话号码等。调查项目要精简,分析项目一个也不可少,备查项目则不宜多。把调查项目按逻辑顺序列成表格供调查使用即形成调查问卷(或称调查表)。
(6)确定调查方式:调查方式主要有直接观察法、直接采访法和间接采访法三种,有时可结合使用。
2.制订资料整理分析计划 资料整理是将原始资料进行科学加工,去粗取精,去伪存真,使之系统化、条理化,便于进一步分析。
3.制订调查组织计划与质量控制
常用的概率抽样方法和非概率抽样方法
概率抽样方法
1.单纯随机抽样
单纯随机抽样方法是其他随机抽样方法的基础。其优点是简单直观,均数(或率)及其标准误的计算简便;缺点是当总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不易组织调查。
2.系统抽样,又称等距抽样或机械抽样
系统抽样的优点是:易于理解,简便易行;容易得到一个在总体中分布均匀的样本,其抽样误差小于单纯随机抽样。缺点是:抽到的样本较分散,不易组织调查;当总体中观察单位按顺序有周期趋势或单调增加(减小)趋势时,容易产生偏倚。例如,住户均为双号,其住房可能都是一个朝向,若进行住户采光的卫生学调查,将产生明显的偏倚。
3.整群抽样
整群抽样的优点是便于组织调查,节省经费,容易控制调查质量;缺点是当样本含量一定时,抽样误差大于单纯随机抽样。
4.分层抽样
分层随机抽样的优点是样本具有较好的代表性,抽样误差较小,分层后可根据具体情况对不同的层采用不同的抽样方法。
四种抽样方法的抽样误差大小一般是:
整群抽样≥单纯随机抽样≥系统抽样≥分层抽样
非概率抽样方法
5.偶遇抽样 又称便利抽样或自然抽样。调查者根据实际情况使用对自己最为便利的方式来选取样本,可以是抽取偶然遇到的人或者选择那些离得最近、最容易找到的人作为调查对象。
6.立意抽样 又称目的抽样或判断抽样。研究者根据研究目标、对情况的主观判断、经验和知识,从总体中选择和确定具有典型代表性或极端性的样本作为调查对象。例如,要对福建省旅游市场状况进行调查,有关部门选择厦门、武夷山、泰宁金湖等旅游风景区做为样本调查。立意抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则很容易引起抽样偏差。
7.配额抽样 也称定额抽样。指先将总体按某种或某些特征分成不同类别,然后依据每一类的个体数占总体的比例来抽取相应数目个体构成样本的方法。该法与分层随机抽样有些相似,但它注重的是样本与总体在结构比例上的一致性,确定配额后的抽样常用便利抽样或立意抽样的方式。
8.雪球抽样 当无法了解总体情况时,可以从能找到的少数个体入手,对他们进行调查;并请他们介绍其他认识的符合条件的人,再去找那些人进行调查。如此重复下去直到达到所需的样本含量。
实验设计的基本要素
受试对象(object)、处理因素(treatment)和实验效应(experimental effect)是实验设计的三个基本要素。
科学研究的目的就是阐明某种或某些处理因素对受试对象产生的效应。
例如观察某降压药的效果。
处理因素------该降压药
受试对象------高血压患者
实验效应------血压下降值
实验设计的关键:如何选择三个基本要素
受试对象
1.定义
是处理因素作用的客体,是根据研究目的确定的总体。
根据受试对象的不同,实验可以分为三类
2.选择受试对象的条件
(1)对处理因素敏感
(2)反应必须稳定
例:如观察某药物对高血压的疗效,高血压临床分为3期,其中,Ⅰ期患者血压波动较大,Ⅲ期高血压患者对药物不够敏感,Ⅱ期患者对药物敏感,且血压波动范围小,较稳定。因此宜选Ⅱ期高血压患者作为受试对象。
(3)受试对象还须有明确的标准(纳入和排除)例:动物实验时,要求受试动物均为同种属、同性别、同体重或同窝者,因为这些条件可能会影响试验结果,必须控制一致。
处理因素
1.定义
根据研究目的确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的因素。
2.非处理因素
与处理因素相对应并同时存在,也能使受试对象产生效应的因素,又称混杂因素。
3.确定处理因素时应注意的事项
(1)分清处理因素和混杂因素
突出处理因素的主导作用,排除混杂因素的干扰作用。
例 研究综合防治高血压病的效果,处理因素为药物治疗加体育锻炼及单纯药物治疗。合理调配饮食结构和其他的辅助治疗措施也能缓解症状,有助于康复,但这并不是本次研究的处理因素。研究者应采取各种措施,尽可能使某些非处理因素在所比较的各组中基本相同,以便充分显示处理因素的作用。
(2)保持处理因素恒定不变
保证结果的准确性和稳定性
例 在实验过程中实验药物的批号、剂量应当一致,手术和操作的熟练程度也都应从始到终保持恒定。
实验效应
1.定义
处理因素作用于受试对象的反应和结局,它通过观察指标(变量)来体现。
2.指标选择时应注意的事项
(1)选用客观性较强的指标
最好选用易于量化,即经过仪器测量和检验而获得的指标。
(2)选用灵敏度和特异度较高的指标
特异性是指该指标鉴别出真阴性的能力,特异度高的指标能较好的揭示处理因素的作用,不易受混杂因素的干扰,可以减少假阳性率;灵敏性是指该指标检测出真阳性的能力,灵敏度高的指标对外界的反应灵敏,能将处理因素的效应更好的显示出来,减少假阴性率。
选择指标时应选择特异性和灵敏性均较高的。
(3)选用精确性较强的指标
精确性包含:准确度(观察值和真实值的接近程度)和精密度(重复观察时,观察值与其平均值的接近程度)
(4)指标观察时采用盲法(单盲-受试对象、双盲-受试对象和实验执行人员和三盲-受试对象、实验执行人员和统计分析人员)
实验设计的基本原则
实验设计的主要作用是减小误差,提高效率。因此在设计时必须遵循对照(control)、随机化(randomization)和重复(replication)的原则。
对照原则
1.对照原则:在确定接受处理因素的实验组时,应同时设立对照组。
目的:平衡非处理因素对试验结果的影响,从而把处理因素的效应充分显露出来。
2.均衡性:设立对照应满足均衡性,指在设立对照时除给予的处理因素不同外,对照组和实验组的其它一切因素应一致。
3.例 大鼠的趋光速度的研究
1927年McDouyall
4.对照的形式
(1)安慰剂对照
目的在于克服研究者、受试对象、评价者等由于心理因素所形成的偏倚。
(2)空白对照
对照组不接受任何处理因素。
例 维生素A预防肺癌的作用
(3)实验对照
对照组不施加处理因素,但施加某种与处理因素有关的实验因素。
例 赖氨酸添加实验
(4)自身对照实验
对照与试验在同一受试对象身上进行。
例 治疗烧伤的新药疗效研究
又如,研究盐酸西布曲明的减肥效果,以肥胖病人用药前的体重作对照。
注意:
前后对照不是同期对照。
在实验中同样需要另外设立一个对照组。
(5)标准对照
用现有的标准方法或常规方法、或者现有标准值或参考值作为对照。
例 某种新的检验方法是否能代替传统方法。
用标准值或参考值作为对照不好
设立对照时应注意两个问题:
①同期对照(concurrent control):在整个实验过程中,对照组和实验组应始终处于同时同地。
②基线(baseline)比较:对照组设立后,应检验两组开始时的状态是否均衡。
随机化原则
随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。
随机化是对付大量不可控制的非处理因素的重要手段,也是进行统计推断的前提。
随机化具体体现在:随机抽样、随机分配和实验顺序上。
重复原则
重复是指在相同实验条件下进行多次研究或多次观察,以提高实验的可靠性和科学性。广义来讲,重复包括三种情形。
(1)整个实验的重复。
(2)用多个受试对象进行重复:保证足够的样本含量。
(3)同一受试对象的重复观察。
重复的作用
(1)估计实验误差。
(2)降低实验误差:多次重复测定的均数误差较小。
完全随机设计
完全随机设计是最为常见的一种考察单因素两水平或多水平的实验设计方法。
配对设计
在医学科研中,配对设计主要有以下情形:
①两同质对象分别接受两种不同的处理。
②同一受试对象分别接受两种不同的处理。
随机区组设计(配伍组设计)
设计方法:
将受试对象按性质相同或相近者组成b个区组(配伍组),每个区组中的k个受试对象分别随机分配到k个处理组中去。
例:将16只动物随机分为4组
称重——编号(由小到大)——确定区组(体重相近的4只作为一个区组)——利用随机数字表进行分组
样本含量的估计
样本含量估计的意义
样本含量估计的目的是在一定的检验水准和检验效能的前提下,确定最少的观察单位数。样本含量估计反映了实验设计中的“重复”原则,过小过大都有其弊端。样本含量过小,观察指标稳定性差,用以推断总体的精密度和准确度差,并且会导致检验效能偏低,易出现假阴性结果;样本含量过大,会增加实际工作的困难,浪费人力、物力和时间,可能引入更多的混杂因素,从而影响数据的质量。
影响样本含量估计的因素
1.第一类错误概率的大小α
α越小所需样本含量越多,对于相同的α,双侧检验比单侧检验所需样本含量更多。
2.第二类错误概率的大小β或检验功效1-β
β越小所需样本含量越多,一般要求检验功效在0.8以上。
3.容许误差δ
容许误差:两总体参数间的差别,比如δ=μ1-μ2
容许误差越大,所需样本含量越小
4.总体标准差或总体概率π
标准差越大,所需样本含量越大。
π越接近0.5,所需样本含量越大。
若研究者无法得到总体参数,可通过预试验来估计,也可用样本统计量来代替总体参数,其中还可根据专业知识由各专业的专家确定有专业意义的差值。
样本含量的估计方法
1.查表法
2.计算法
根据对变量或资料所采用假设检验方法的不同分为
(1)单样本均数检验或均数的配对检验
例 为了解高温作业工人的心率是否高于一般人群。某研究者随机抽取了10名高温作业工人做预试验,测得其标准差S=6.23次/分。若高温作业工人的心率高于一般人群3.0次/分才有专业意义,问当时,需要多大样本含量?
(2)两样本均数检验
Q1,Q2为样本比例
例 某人欲比较黄芪和升血散对粒细胞减少症的疗效。据以往经验,黄芪可平均增加粒细胞1×109个/L, 升血散可平均增加粒细胞2×109个/L?若σ=1.8×109个/L,α取单侧0.05,检验效能为0.8,每组例数相等,问每组需要多少病例?若黄芪组样本含量占整个样本含量的60%,则每组又各需多少病例?
每组40例
黄芪组:84×0.6=50,生血散:84×0.4=34
(3)单样本频率检验
例 用常规方法治疗过敏性鼻炎的有效率为85%,现试验某一新药,预计有效率为95%。若α=0.05单侧,β=0.1,问需多少病例?
【例题】为了解某校锡克试验的阳性率,研究者从该校80个班中随机抽取8个班,然后调查这些班中的所有学生。问此种抽样方法属于 | |
| 『正确答案』D 『答案解析』整群抽样是先将总体划分为K个“群”,每个群包含若干个观察单位,再随机抽取k个群,由抽中的各群的全部观察单位组成样本。,由抽中的各群的全部观察单位组成样本。 |
【例题】在下列研究中,研究者不能人为设置各种处理因素的是 | |
| 『正确答案』A |
【例题】理论而言,在同样条件下,下列抽样方法中抽样误差最大的是 | |
| 『正确答案』C |
【例题】实验设计的基本要素包括_____部分 | |
| 『正确答案』A |
【例题】实验设计的基本原则包括 | |
| 『正确答案』A |
【例题】在同一试验中,其他条件不变的情况下,关于样本含量的估计下列说法正确的是 | |
| 『正确答案』C |