医学研究的五原则今年是什么年?

点击联系发帖人 时间：2011-09-10 03:05

今年是什么年

当前位置： >>
医学科研方法学
医学科研方法学-绪论科研的灵魂在于创新原始创新或源头创新次级创新即跟踪或改良性创新原始性创新是基本概念、理论体系的建立或突破，新方法的建立或在新领域内的拓展等（交叉学科新的生长点等）。所以，它包含全新的研究选题，全新的研究思想，全新的研究方法原始性创新应具有两种基本属性原始性(originality):指科学研究的思想和方法是首先提出的，研究结果将开拓新的领域，由此带来或推动科学发展唯一性(uniqueness): 是指科学研究的思想和方法从来没有人提及过，更没实践过。它与原始性相辅相成，构成源头创新必要且充分的前提次级创新是对现有概念、理论体系、方法等的改良和深化，为充实和完善科学的发展奠定基础和提供依据，为源头创新增添积累?激励学生追求知识的热忱重于传授知识本身 ?学生对教师的话也可以质疑 ?养成课堂内外提问的习惯 ?对现有的证据、假设、概念提出挑战，however naive, ought to be encouraged and seriously addressed标新立异特立独行独树一帜独辟蹊径别出心裁超常破例好奇? 多疑? 钻研医学科研中的循证医学思想?传统医学 ?循证医学（Evidence based medicine, EMB)前最佳的证据C循证医学是指临床医生对病人诊断、治疗应该有充分的科学依据，任何决策需建立在科学证据的基础之上。而这些科学证据也应该是当?大样本的临床RCT及Meta分析的结果，让临床医生很吃惊！（出乎意料） ?临床医生不得不承认，单凭推理或病理生理学理论来指导临床行为有时是不可靠的。从理论上认为有效的疗法，在临床实践中不一定真正有效例1：心肌梗死后心律失常是否应常规应用I类抗心律失常药C过去的临床药理实验表明，恩卡尼(Encainide)和氟卡尼(F1ecainide)能降低急性心肌梗塞AMI（Acute Myocardial Infarction失常的发生率对照组(分别为4.5％和1.2％)，从而否定了这一疗法，美国随即禁止恩卡尼的生产，并限制了氟卡尼的应用例2：阿司匹林对急性心肌梗死的疗效）病人室性心律C年，欧美多中心合作进行了著名的D心律失常抑制试验‖，从选择的2315例研究对象的结果发现，服药组病死率明显高于安慰剂 C阿司匹林对冠心病心肌梗死的疗效直至80年代初期仍有较大争论 C欧美等多国组织了ISIS-2（Second International Study of Infarct Survival---第二项心肌梗死存活国际研究）多中心临床试验，观察了17000例病人，结果证实口服阿司匹林 (162.5mg／d×4周)可显著降低AMI患者发生心肌梗死后35天的病死率，减少非致命再梗死C1988年，ISIS-2多中心临床试验结果发表以后，在世界范围内开始广泛使用阿司匹林治疗AMI，使用率高达70％-80％，AMI临床治疗水平无疑大大提高例3：高血压最佳治疗方案：HOT-PLendil 随机试验CHOT, Hypertension Optimal Treatment C该试验是迄今世界上最大规模的高血压治疗试验研究，研究目的是为了寻找一个最佳的降压水平，即血压降到一个怎样的最合适水平，才能把心血管疾病的危险性降到最低。HOT的试验设计较以往的临床试验设计更严谨，研究结果表明，在一个合理降压范围内，血压降得越低越好例4：The Women‘s Health Initiative Randomized Controlled Trail , 评价雌激素替代疗法C2003年11月-2004年2月，10739例子宫切除的绝经期妇女，随机对照和安慰机组，平均随访6.8年 CCHD: HR=0.91(0.75-1.12); 乳腺癌：HR=0.77(0.59-1.01); 脑卒中：HR=1.39(1.10-1.77); 骨折：HR=0.61(0.41-0.91) C 不建议推雌激素替代疗法预防绝经期妇女慢性病?EBM的核心思想是对患者的医疗保健措施做出决策时，要诚实、尽责、明确、不含糊、明智、果断地利用当前的最佳证据 ?EBM实践就是通过系统研究，将个人的经验与能获得最佳外部证据融为一体 ?EBM强调，任何医疗决策的确定都要基于临床科研所取得的最佳证据，即临床医生确定治疗方案、专家确定治疗指南、政府制定卫生政1策都应根据现有的最佳证据来进行?证据是EBM的基石，它主要来源于医学期刊的研究报告，特别是RCT等设计合理、方法严谨的临床研究，以及对这些研究所进行的Meta分析?EBM指导临床实践时，最关键的内容就是根据临床所面临的实际问题，进行系统的文献检索，了解相关临床问题的研究进展，并对相关研究结果进行科学评价，以获取最佳证拒?EBM特别强调证据的可靠性，即证据必须是来源于设计严谨、方法科学可靠的临床研究报告?EBM是一种思维方法，是一种临床医学的模式，它是相对于经验医学而言的。在过去的临床实践中，我们虽然也在D循证‖，但是，人们并没有像现在这样，研究如何快速地从全世界范围内获取最新的临床宏观证据，也没有注重用严格的方法学原则去评价这些证据?证据分级CI级：研究结论来自对所有设计良好的RCT的Meta分析及大样本多中心临床试验 CⅡ级：研究结论至少来自一个设计良好的RCT CⅢ级：研究结论来自设计良好的准临床试验，如非随机的、单组对照的、前后队列、时间序列或配对病例对照系列 CⅣ级：结论来自设计良好的非临床试验，如比较和相关描述及病例研究 CⅤ级：病例报告和临床总结及专家意见?论证强度的影响因素C样本量/代表性 C随机 C对照 C盲法 C研究的时间方向?实践循证医学的方法C确定临床实践中的问题 C检索有关医学文献 C严格评价文献 C应用最佳证据，指导临床决策 C通过实践，提高临床学术水平和医疗质量高产生物学家的标准 ? 一个生物学家的研究产出率可以客观地用在具有高影响力的国际研究杂志上发表的原始性研究论文数量来衡量 C 如果一个科学家过去10年内在IF为2或以上的研究杂志上发表至少8篇科学论文，同时至少有一篇研究论文发表在IF为5或以上的杂志上，就是一个产出率高的生物科学家（吴瑞，美国康乃尔大学分子生物学与遗传学系，Nature, 428: 206-207, 2004）中国科学家为何低产必要的急迫感（essential tension） C在世界的一流科研机构里，总有一种必要的急迫感，使科学家全身心地投入到解决所面临的科学问题。这种紧迫感可来自科学家要提升自己的渴望、周围同事和学生的挑战、同行的竞争、或者仅是“不发表就完蛋（publish or perish）”的压力 ?低投入（时间、精力、认真严谨的程度、经费） ?缺少合作 ?献身科学的精神 ?和谐社会 ?In major research institutions around the world, there is always an ?essential tension‘ that drives scientists to put their heart and mind into solving scientific problems ?This atmosphere is created by a desire to excel, by challenges from surrounding colleagues and students, by competition with scientific peers, or just simply by the pressure from the ?publish or perish‘ culture 1. 科研的定义?以科学的观点和方法，对未知事物进行探索、观测和分析，从而发展科学知识科学的方法严谨的设计严格的试验严密的观测正确的分析 ? 联合国教科文组织界定的科技活动包括研究与试验性发展活动（R&D）、科技教育与培训活动(STET)、科学技术服务活动(STS) ? 在我国科研工作一般特指R&D 2. 医学科研的分类?按照学科体系C基础医学 C临床医学2C公共卫生/预防医学 C口腔医学 C药学?按照科研的意义C基础研究 C应用基础研究 C应用研究按照科研方法 /设计原理 /论证强度分类医学科研方法 (流行病学研究方法 )是否干预不干预干预观察法是否特别设立了对照是否分析危险因素无特别对照设立特别对照试验法研究目的研究对象干预方式理论与方法学描述性研究分布规律分析性研究预防早期发现病人疾病自然史评价诊断试验预防健康人群群体治疗病人个体横断面研究果推因因推果健康人群个体筛检病例对照研究队列研究现场试验证据强度胡东生社区干临床预试验试验理论流行病学现况生态学研究研究（群体数据）低医学科学研究方法学-绪论方法学设计/测量高数据分析453. 医学科研的程序?选题 ?设计C提出研究的问题/假说 C先进/科学/实用/可行/效益性 C制定解决研究问题的方案/技术路线 C研究方法/对象/分组/干预措施/效应指标/药品/试剂/仪器/数据分析/经费预算/时间安排 C其它考虑（课题名称，logo）?实施 ?数据的统计分析 ?总结概括/论文撰写流行病学病因学研究程序描述流行病学分析流行病学分析流行病学实验流行病学干预策略与措施的实施医学科学研究方法学-绪建立监测系统，长期干预 /监测论提出假设证据强度低检验假设验证假设胡东生高48?某一项临床和基础科研的程序 C动物实验-体外-体内 C基础-临床-I期-II期-III期-IV期 C小样本-大样本-多中心4. 医学科研的任务 3?发现医学中未知事物/未知过程 ?揭示医学中已知事物的未知规律 ?探索医学中已知规律的应用 ?验证与发展医学中已有的理论和学说?医学科研的主要内容 C病因学研究 C发病机制研究 C形态与功能研究 C症状与体征 C诊断试验 C治疗试验 C预后评价 C预防试验 C疾病自然史研究5. 医学科研中存在的问题?选题：缺乏先进性/科学性/实用性 ?设计：研究对象/方法 ?实施：质量控制 ?数据分析： ?论文撰写?临床科研问题较多C国内临床医学模式仍停留在传统的经验医学模式，多数医疗单位的临床研究仍停留在叙述性临床病例总结的水平，临床研究方法十分混乱，许多先进的方法不会用，不了解，只能总结临床经验C临床研究因为方法学的落后，研究水平很难跟基础研究/预防医学研究相比6. 为什么学习医学科研方法学?培养科学素质（创新/严谨） ?遵循科研基本原则 ?指导科研工作 ?应用于课题申报/课题评审 ?应用于成果申报/成果鉴定 ?指导论文撰写/论文审阅 ?提供最佳证据，应用最佳证据，实践循证医学科学家必须具备C严谨认真的科学态度 C开拓创新的科学思维 C勤奋努力的工作精神医学科研的选题与设计主要讨论以下内容?医学科研的选题 ?医学科研设计遵循的原则 ?医学科研设计应考虑的几个关键问题 ?研究方案的制定一、医学科研的选题C1. 医学科研选题应遵循的原则?创新性 ?科学性 ?实用性 ?可行性4?创新性 C创新性可以体现在多个方面，并以不同的程度与方式表现出来，显著的和高层次的创新要求产生和建立新的理论与方法，促进学科的显著发展、推动社会的进步，创新也可以是完善、丰富现有的理论与方法C怎样才能做到创新？?坚实的专业理论基础知识和本领域的研究背景 ?非常熟悉研究选题领域的进展与研究水平 ?创新思维C创新无处不在，无时不有?研究选题要求创新，数据分析、结果呈现、论文撰写都可体现创新?大家都习惯应用统计表的方式表达OR值及其95%可信区间，如果使用统计图表达，则十分直观 ?一个具有新意的论文题目不仅能够准确揭示论文的内容，同时也令人印象深刻The rising tide of cardiovascular diseases in American Indians: The Strong Heart Study (Diabetes Care, 3-156)C创新也要求我们不做重复性的工作，要选择前人没有解决或没有完全解决的问题进行研究。如果都是千篇一律的模仿或固守所谓的经验，科学就不可能前进与发展C这里还要强调考虑创新性时，不要忽视实用性，没有理论和实践应用价值的创新和首创将是毫无意义的，创新不是无中生有，是已有工作基础积累、升华的产物，避免把D创新‖扩大化，没有应用价值的D填补国内外空白‖不能说是创新和特色创新性是科学研究的核心和灵魂！?科学性 C科研选题一定要有充分的科学依据,能够应用现有的科学知识来推测、分析和解释,要不违背现代生物学、医学等理论，在科学上D言之成理‖?实用性 ?可行性?效益性C医学的应用学科特性也决定了医学研究选题时尤其要强调其实用性C完成课题的主/客观条件?必需的仪器设备、现有的实验条件、足够的科研经费、必要的人员配置、时间安排甚至相关部门的支持等2.医学科研选题的来源 ?指令性课题 ?指导性课题（招标课题） ?委托课题 ?自选课题C来自日常工作实践中的课题 C从人类愿望出发提出的课题 C由现有理论与经验事实之间的矛盾而提出的课题 C由不同理论体系之间的矛盾而提出的课题 C现有经验和理论的描述不符合生命空间构型和时间节律的基本原则而提出的课题 C流行病是研究特定人群中健康相关状态与事件的分布及其决定因素，并应用这些研究结果来控制健康问题的学问 CSource: A dictionary of Epidemiology (4th edition, John M. Last, 2001) CD研究‖包括监测、观察、假设检验、分析性研究和实验性研究 CD分布‖是分析疾病的时间、地区和人群的特征 CD决定因素‖包括影响健康的物理、生物、社会、文化和行为因素 CD健康相关状态与事件‖是指疾病、死亡原因、行为危险因素、对预防制剂的反应、卫生服务的提供与使用 CD特定人群‖是那些能够确定其特征的人群 C流行病学的D应用‖是保护、促进和维护健康?由此定义可以看出流行病学的研究范围与研究内容十分广泛 C任何疾病、健康问题 C影响疾病和健康的因素 C预防控制疾病的策略与措施二、医学科研设计遵循的原则C研究设计是有关科学研究的具体内容、方法的设想和计划?专业设计：是从各专业角度考虑研究的科学安排，包括选题、建立假说、确定研究对象、测量指标、技术方法等 ?统计设计：是对资料搜集、整理和分析全过程总的设想和安排，它从统计学的角度考虑设计的科学性和逻辑性，使研究结果具有真实性与可靠性 51.医学科学研究设计的基本要素 C研究对象：流行病学的研究对象通常是人群 C处理因素 ?处理因素是对研究对象施加或去除某因素，观察其对研究对象的影响 ?通常在实验流行病学中对实验组采取的干预措施就是处理因素 ?而在观察性研究中我们不采取任何的干预，但是可以把研究中的暴露因素看作是处理因素C效应指标：是处理因素作用于研究对象而产生的变化的反应，是研究的结局变量 ?可以是生理、生化、病理学指标，也可是分子生物学标志物或者是疾病的发生和死亡?尽量做到数量化、灵敏、特异2.医学科研设计遵循的基本原则C对照重复随机化盲法?对照 C设立对照的意义?使实验组和对照组在研究因素（也称为处理因素）以外的其他因素（也称为非处理因素）基本一致，从而使研究因素的效应得以显露。其意义可用以下符号表达：C设立对照的原则?非研究因素在比较的不同组别中分布均衡、可比C例如研究对象的人口统计学特征性别、年龄、受教育水平、婚姻状况、社会经济地位在实验组和对照组的分布均衡、可比C常见的对照形式?实验研究中：C空白对照?对照组不施加任何处理因素 C安慰剂（placebo）对照 ?给予对照组与受试药物在外形、气味上完全一致但无任何治疗作用的安慰剂 C标准对照 ?应用标准疗法、标准物质做为对照 C历史对照 ?应用以前传统疗法的结果作比较 C匹配对照 C自身对照 ?同一研究对象干预前后比较 ?流行病学研究中 C描述研究中的对照 C病例对照研究中的非研究疾病对照 C队列研究中的非暴露组对照 C实验流行病学研究中的对照?重复?重复是指在相同实验条件下进行多次研究或多次观察，以提高实验的可靠性和科学性C整个实验的重复?如对同一调查对象在短时期内先后调查两次，不同的调查员分别对同一调查对象进行调查，比较两次调查结果是否一致，确保实验的重现性C多个受试对象进行重复?要有足够的样本含量，避免把个别情况误认为普遍情况 ?如欲了解2006年河南省食管癌的死亡率，仅调查1000人是不能真实反映问题的，按照现有的食管癌死亡水平29/10万估计，可能1000人中没有1例死于食管癌C同一受试对象的重复观察?保证了观察结果的精度 ?如：血压的测量一般都测3次，取3次的平均值?重复最主要的作用是估计误差，另一作用就是减小抽样误差 6?随机化 C就是每一个受试对象都有同等的机会被抽取或分配到不同的实验组和对照组 C是对付大量不可控制的非处理因素在各组间分布均匀的一种统计学措施，也是对实验结果进行外推的重要前提，它贯穿于实验设计和实施的全过程中 C抽样的随机 ?使每个符合条件的研究对象都有同等的机会被抽取，从而保证所得样本有代表性 ?常用的随机化抽样方法：单纯随机抽样、系统抽样、分层抽样、整群抽样C分组的随机?使每个受试对象被分配到各组的机会相等，是达到组间均衡性的重要手段 ?随机化的方法：抽签法，掷硬币法，随机数字表或通过计算机产生的伪随机数字 ?随机分组的单位既可以是个体也可是群体C前者如实验某种疫苗有无预防作用而开展的小范围人体实验；后者如为了解自来水加氟能否预防龋齿而开展的大范围人群实验 C实验顺序的随机?每个试验个体接受处理先后的机会均等，从而平衡试验顺序对观察指标的影响?盲法C流行病学研究中的偏倚可以来自各方面和各个环节，通过随机化和设立对照消除和控制了很多影响研究结果的非处理因素，但是研究中来自研究对象和研究者的与疗效评价、检测结果判断、数据分析方面的不客观和不公正态度，甚至心理因素也会引入很大的偏倚C研究者就需要进一步采取措施来消除这些偏倚，即让研究对象、研究观察者和数据的分析者部分或全部不知道研究的分组情况，这样就消除了他们因为个人主观倾向带来的偏倚，这样的方法就称为盲法C单盲?消除研究对象带来的偏倚C双盲?消除研究对象、研究者带来的偏倚C三盲?消除研究对象、研究者、负责结果的评判和数据的分析人员带来的偏倚3.医学科研的精确性与真实性 C研究的整个过程中，许多因素影响研究的准确性使研究结果与真实情况存在偏差 C这种偏差的原因有二：一是随机误差、二是系统误差 ?精确性与随机误差有关，随机误差亦称随机变异，主要来源于对研究对象的选择过程，即抽样过程这种随机变异被称为抽样误差或抽样变异，减小抽样误差以提高研究的精确性 ?真实性与系统误差即偏倚有关，减少偏倚以提高测量的真实性 ?提高研究的精确性 ?用于研究的研究对象，无论从字面上是否提到D抽样‖，都是将研究结果推论到群体的一个样本，不可避免的存在抽样误差 ?提高研究精确性的方法：一是增加研究的样本含量；二是提高研究信息获取的效率及研究效率 C样本含量的估计 ?样本过大可导致人力、物力、时间和费用的增加，提高研究成本 ?根据研究的目的与需要确定适宜的样本大小，并通过合理的抽样获得合适的样本量C研究效率?样本构成C样本中暴露者的比例较小，很难全面评价研究因素的效应 C暴露者与对照者比例合适但研究对象的年龄不合适，研究效率也很低 C即便研究对象总的年龄构成符合要求，如果暴露组与非暴露组年龄分布不均，研究效率也很低?分层技术C许多研究中采用分层技术也会影响研究效率 C如：一项流行病学研究中，样本大小适宜，研究对象暴露者与未暴露者的比例适宜，若用分层很可能会造成各层中两者的构成比例极不一致严重影响研究效率，降低研究的精确性。分层的变量越多，这种现象越容易出现 7C分层技术中提高研究效率的方法?预期的层间暴露与非暴露者的比例或效应值变异很大，非暴露人群又易获得，可以提高两者的比例，可增至1:10或更大，如此可使方差减小，使在同一α 标准下获得较小的β 值，从而提高把握度，保证研究效率。C但是提高的程度有限，统计效率能否真正提高也因研究因素的性质及分布的不同而异?另一方法是，在选择对照时通过配比技术，使研究对象在各层间暴露与非暴露于研究因素者的比例达到均衡，从而提高研究的精确性。C研究效率的衡量?获得的信息与研究成本相比较?提高研究的真实性 C研究的真实性包括两个部分 C一是内部真实性?内部真实性是指对研究对象本身进行推论的真实性C二是外部真实性?外部真实性也称普遍性，或外推性，是指对研究对象以外的人群推论的真实性 ?有学者认为，研究的外部真实性取决于样本人群对目标人群的代表性C一项研究的内部真实性应是其外部真实性的基础和前提4.医学科研的程序和步骤C流行病学研究通常遵循的程序?首先应用描述性研究来产生和形成假设，经由分析性研究（包括病例对照研究和队列研究）检验假设，采用实验流行病学研究方法来验证假设，并在此基础上进一步开展干预和建立疾病发病率或死亡率及其危险因素的监测系统?流行病学研究的程序图C医学科研的步骤?选题 ?研究设计 ?研究实施 ?数据整理与统计学分析 ?研究报告或论文撰写三、医学科研设计应考虑的几个关键问题C明确研究目的 C研究对象的选择 C研究方法的选择 C样本含量的估计 C研究变量的确定 C调查问卷的设计 C研究的实施 C研究数据的统计学分析策略1.明确研究目的?首先提出立项依据 C提出科学问题 C国内外研究现状（解决问题、未解决问题）8C提出本项目的研究工作假说 C项目的科学意义、学术价值 C进一步明确研究目的C选题决定后，就需要明确研究目的?本研究的研究假设是什么？ ?要回答什么问题？C一项研究中解决所解决的问题不宜过多，要重点突出2.研究对象的选择根据研究目的选择研究对象C人群研究应考虑的因素?流动性小，交通方便，以便于研究的实施 ?研究对象生活和居住的社区内有较好的医疗卫生设施，便于进行体格检查和实验室检测 ?研究对象在人口学和其他特征上对目标人群具有良好的代表性 ?研究对象具有较高的拟研究疾病的患病率、发病率或暴露因素的暴露率，这样易于选择到符合要求的研究对象和易于得到结局变量 ?研究对象能够认真遵循研究的要求，配合研究工作，研究对象执行研究要求的程度成为依从性?研究对象的纳入和排除标准 C纳入标准规定了符合的条件，如果具备这些条件则可以作为研究对象 C排除标准规定了在纳入条件基础上的不符合条件，如果具备这些特征则需要剔除这些研究对象?在确定纳入和排除标准时，首先要对研究对象的人口学特征作出明确的规定，然后规定其他特征或条件，例如疾病及其合并症、可能的禁忌症、危险因素的暴露情况、知情同意书的签署情况、研究对象的依从情况等。?所有的标准都要采用国际通用或国内统一的、规范和标准化的诊断或方法，以便与他人的工作做比较?知情同意书(informed consent form)的签署3.研究方法的选择 ?按照是否对研究对象施加干预措施研究方法分为两大类： C观察性研究（observational study） C在不改变研究对象目前的疾病状态及暴露特征的情况下，开展的研究，又可分为两类： ?描述性研究（descriptive study） C是研究疾病或健康状况及其影响因素在不同时间、地区和人群的分布状态。典型的描述性研究包括现况研究和生态学研究 ?分析性研究（analytical study） C在观察性研究设计中特别设立了对照或对照组，通过比较来研究疾病的病因或危险因素。分析性研究包括病例对照研究和队列研究 C实验性研究（experimental study） ?对研究对象施加干预措施 ?根据研究目的、研究对象和干预措施施加的方式不同又分为现场试验、社区干预试验和临床试验 ?研究方法的选择指征 C研究疾病的分布特征，就应用描述性研究、疾病监测和筛检的方法 C探讨疾病的病因或危险因素，则需要应用描述、实验性研究等所有研究方法 C如果是为了早期发现病人、评价筛检实验就需要应用筛检的方法 C如果是研究疾病的自然史，可以应用筛检和纵向研究方法 C为了验证病因、评价干预措施的效果，我们可以采用现场试验、社区干预试验或疾病监测的方法 C如果遇到原因不明疾病的爆发疫情或其它突发公共卫生事件，则需要综合应用各种研究方法，研究其病因、制定预防控制措施并评价其效果 ?各种研究方法不同特点的比较94.样本含量的估计C样本含量估计的意义?充分反映科研设计中D重复‖的基本原则，是在保证研究结论具有一定可靠性的前提下所需要的最小观察单位数C影响样本含量估计的因素?第一类错误的概率α ，即检验水准Cα越小所需样本含量越多。对于相同的检验水准，双侧检验比单侧检验所需的样本含量更大，通常取0.05或0.01?检验功效1Cβ 或第二类错误的概率βC检验功效越大，所需样本含量越多。一般要求检验功效在0.80及以上?研究因素对研究事件的效应大小，即总体参数间的差值δ （容许误差）Cδ 越大，所需样本含量愈小?总体标准差σ 或总体概率πCσ 反映研究指标的变异度，验、查阅文献、经验估计获得 ?研究中比较组的多少σ 愈大，所需样本含量愈多。总体概率π 越接近0.5，则所需样本含量愈多。 σ 或π 一般未知，多由预试C研究中比较的组别越多，则样本含量越大?欲分析变量的多少C如果一项研究有多个研究变量，根据不同变量估计出的样本含量通常不等，此时应以样本量最大的为研究样本 C如果因条件限制不能满足多个研究变量所需的样本量，应分清主要指标和次要指标并尽量满足主要指标所要求的样本量 C对于多因素logistic回归（multiple logistic regression）分析和比例风险分析（proportional hazards analysis）,1个自变量（independent variableregression）至少要有10个结局（outcomes）变量，而在多因素线性回归（multiple linear regression）分析中，1个自变量要有20个研究对象?研究所采用的抽样调查方法C整群抽样＞单纯随机抽样＞系统抽样＞分层抽样的抽样误差，因此，整群抽样一般需更大的样本量，分层抽样所需样本量则较少C不同研究类型的样本含量估计方法不同5.研究变量的确定C研究变量可分为两大类：?自变量（暴露变量）C是指影响疾病的发生或健康状况的分布的变量，是原因变量?因变量（结局变量）C是在暴露变量的作用下产生反应的变量C自变量（暴露变量）的选择?常见的暴露变量包括研究对象人口统计学特征、行为危险因素、营养/膳食因素、体力活动、精神/心理因素、家族/遗传因素、职业/环境特殊暴露因素、社会经济因素、生理、生化和分子生物学标志物等C因变量（结局变量）的选择?结局变量又可分为两类： ?D硬‖结局变量（hard outcome）C包括疾病的发生、死亡，也称为直接结局变量?D软‖结局变量（soft outcome）C指病因和疾病发生之间的那些中间变量 C例如，如果D硬‖结局变量是冠心病的发生，那么血脂的各项测量指标、血压水平就是D软‖结局变量，也称为间接结局变量?与研究目的有关的项目要详尽，不可遗漏，不要包括无关的变量 ?还要充分考虑到暴露变量和结局变量之间关系的生物学及逻辑学的合理性6.调查问卷的设计C一份完整的调查问卷主要包括标题、编码、说明、备查项目、分析项目5个部分1）标题概括说明调查的主要内容，应简明扼要如世界卫生组织（WHO）《健康和卫生系统反应性》量表，InterASIA中国部分－D中国心血管健康多中心合作研究‖ 2）编码包括抽样编码，调查员编码，资料录入人员编码等设置编码一方面便于进行现场质量控制，避免重复编码，另一方面便于对不同地区（或试验中心）进行独立分析如InterASIA研究中采用了四阶段抽样的方式：第一阶段：抽样单位是省市。分别从南部和北部各抽取5个城市，共抽得10个省。对这10个省市进行编码01～10，其中01代表北京第二阶段：抽样单位是县和城市。即从第一个阶段所选的省中随机抽取一个城区（编码01）和一个县（编码02），共抽得10个城区和 10个县第三阶段：抽样单位是街道、镇或乡，从每个城区和县随机抽取1个街道（编码01）和1个镇或乡（编码02），共抽得10个街道和10 个镇或乡第四阶段：抽样单位是个体。全体街道或镇的居民名单将作为样本来源（限年龄在35-74岁），每个现场抽得男（编码1）、女性（编 10码2）居民各400人抽样编码可采用5级编码（共10位数），编码规则如下：3）说明部分一般放在调查问卷的开头，常以简短的指导语告诉被调查者本调查的目的和意义等，旨在获得被调查者的积极配合 4）备查项目如研究者姓名、身份证号码、家庭住址、联系方式、调查日期、问卷开始的时间和结束时间、调查者签名等 5）分析项目包括被访者一般情况和调查研究项目被访者一般情况：被调查者的一些人口统计学特征，如性别、年龄、文化程度、职业等调查研究项目本研究欲分析的所有暴露变量和结局变量，是调查问卷中最重要的部分调查问卷设计的基本原则： ①说明部分应以委婉的语言突出研究的目的和意义 ②调查问卷要精练，分析项目一个也不能少，备查项目不易太多 ③分析项目尽量采用量化的指标、避免暗示性提问、用通俗的文字准确无误地表达、提问的内容应由易到难 7.研究的实施?建立研究工作的组织机构，制定工作手册 C研究需要建立管理课题的组织机构，通常设立有研究的指导委员会（steering committee）,下设各现场中心(field center)、数据中心（data coordinating center）、论文撰写与发表委员会（proposal and publication committee）等C工作手册包括的主要内容为课题研究的背景、研究的组织机构、研究目的、研究设计、研究的实施步骤等 ?准备工作 C对项目参加者进行责任分工，并根据分工不同进行规范培训，之后还要进行考核 C测量工具和仪器的准备和校准 C预调查并进行充分的宣传和动员 ?具体操作C在保障研究质量的前提下规划每天的工作量，将研究对象分为若干个小组，将不同的小组分在不同的时间进行调查和测量，具体的时间间隔由各个小组的实际的人数以及现场操作的速度来决定C在现场工作中需要设立不同的功能分区，首先需要一个控制整个现场工作的前台，然后根据具体的研究课题可以设立体格检查室、人体测量室、问卷室等，并按照工作程序将其进行编号C研究对象需要首先来到前台，在这里进行登记、再次被告知研究目的和意义、如何配合研究工作、签署知情同意书、领取各种测量表格和问卷C完成当天的调查工作后要对当天现场工作进行审查、总结，做好质量控制8.研究数据的统计学分析策略数据分析方法的选择指南 C（1）数据的分析程序 ?首先根据数据的性质了解数据分析的程序，具体的分析程序见图C（2）根据研究设计类型选择?完全随机设计C若是两组比较需要应用t检验或χ 检验 C若是病例对照研究设计则要按照病例对照研究数据的分析方法进行分析211C多组比较需应用方差分析、行×列表χ?配对（自身实验前后）设计2检验或分级的病列对照研究数据的分析方法C配比的t检验，χ?重复测量的设计2检验及配对的病例对照研究方法进行数据分析C这类设计方法是在给定一个处理因素后在不同的时间重复测量某一效应变量的改变情况。如欲评价生物制品接种后的免疫学效果，在接种后的2周、4周、6周和8周测定抗体滴度，即为此类设计类型C应用重复测量的方差分析方法进行数据的分析或logit模型（分类变量）进行分析?多因素设计C若在研究设计中有多个自变量，则可根据因变量的性质选择合适的多因素分析方法 C如果自变量是数值变量，则可考虑应用多元回归分析方法、协方差分析方法 C如果是分类变量，则可选择logistic回归分析方法、判别分析方法及聚类分析方法等C（3）根据变量的类型选择?变量的类型C数值变量，numerical (continuous) variable C分类变量，categorical (nominal) variable C有序变量，ordinal variable C生存时间，survival variable不同变量类型的数据分析方法选择：不同研究设计和数据类型的数据分析方法：C（4）不同研究类型的数据分析方法?1.现况研究2C在现况研究中通常描述研究人群的患病率、危险因素的流行率及数值变量的分布情况，可以使用相关回归分析、分析等方法分析数据检验、t检验及方差C在现况研究中根据数据的情况也可以使用多因素分析方法, C还可以应用现况研究的数据计算人群归因危险度?2.分析性研究的数据分析方法例如ANCOVA, logistic回归分析C病例对照研究数据的分析程序如下：12C队列研究数据的分析程序如下图所示：?3.实验研究的数据分析方法C干预组与对照组某疾病的发病率 C分析效果指数，保护率 C干预组与对照组危险因素的暴露率 C干预组与对照组数值变量均值水平的差异 C显著性检验方法有 2检验、t检验及方差分析等 C多因素分析：ANCOVA，Cox模型, Kaplan-Meier estimates四、研究方案的制定C1.研究方案的基本内容?研究课题名 ?研究背景 ?研究目的 ?研究对象 ?研究方法 ?研究进度 ?研究基础 ?预期成果 ?质量控制方法 ?参考文献13?课题名称 C对研究内容高度概括的总结，要求用简练、规范和专业的语言来准确反映研究课题的核心内容 C在课题名称中体现医学研究的三要素 C为了国际交流的方便，还可以考虑给研究课题一个简称和徽标（logo） ?研究背景 C研究背景指进行该项研究的动机、意义及相关依据 C通常是根据文献复习或以往相关研究工作的结果或经验进行整理，目的是集中介绍该研究的立题依据 C内容包括自己以往的研究以及国内、外学者所进行的相关研究现状和趋势 ?研究目的 C是研究课题的核心，研究有关的一切工作都是围绕目的而进行的 C如目标人群的确定、研究对象和研究方法的选择等 ?研究对象 C包括目标人群的确定 C研究对象的样本含量 C研究对象的选择原则、标准、来源 C选择的方法如抽样、匹配等?研究方法C研究方法类型?如是横断面研究、病例对照研究、临床试验，还是不同方法类型的交叉设计C资料收集方法?包括调查问卷的拟定、调查员培训、观察指标 ?信息获取方法，如访谈、函访、常规资料的摘录等 ?以及需测量项目的测量指标、测量方法、以及标准化等C数据整理分析方法?包括数据是手工整理还是计算机整理、所用的分析软件、数据分析策略及具体分析方法如多因素分析模型、交互作用分析模型?研究进度 C研究进度介绍研究的总体时间安排，如整个研究工作分几个步骤，每一步骤计划于何时完成，以便对整个研究工作的时间安排心中有数，有利于对整个研究工作的进度控制?研究基础与预期成果 C研究条件包括与完成该项研究有关的人力、物力条件，如课题组成员情况，组织情况，所需仪器设备，相关的研究工作基础以及研究所需经费落实的情况等C研究方案中应说明已具备的条件与尚待解决的条件及拟解决的途径 C预期成果指完成该研究后可以得到的结果或数据，及其理论或应用价值与学术水平的预测 ?质量控制?研究的质量控制是贯串于研究设计、研究实施以及结果分析与总结的各个环节C研究对象的选择过程：?包括样本大小的估计，抽样方法，研究对象的选择标准、来源、方法等C如在病例对照研究中，病例与对照选自人群或医院病人，以何种方法选择 C在队列研究中，暴露队列与非暴露队列的选择 C在实验性研究中，研究对象的划定以及分组等C数据收集过程：?包括调查问卷的设计，获取信息的方式、方法，用于测量的仪器设备，调查员的选择与培训，以及研究对象的配合情况。如应答率，依从性等C数据整理阶段：?包括数据完整性的核对，对不符合要求数据的处理，数据的量化方法，数据录入人员的技术水平，录入准确性的核对等环节C数据分析与总结阶段：?包括选用的数据分析策略、分析摸型、有关变量的使用以及对分析结果的解释与推论等C2.研究方案的对照检查提纲?一项研究的研究方案拟定后，往往需要反复检查、斟酌、修改，以保障在研究完成后能达到预期的研究目的 ?如：以下是一份针对病例对照研究设计方案的对照检查提纲（Schlesselman，1982）的一部分，对其他类型的研究设计也具有参考价值（一）研究背景 1 是否已全面复习了有关的文献？（1）国外的文献复习了没有？（2）国内的文献复习了没有？（3）最近发表的主要的综述性文献阅读了没有？ 142 是否对以往有关的研究结果做了评价？（1）相关流行病学研究工作。（2）与流行病学研究有关的研究工作，如基础研究、动物实验等。 3 基于已了解的背景，需要在那些方面做进一步的研究？还需要获取那些新知识？ 4 本研究是否与问题3所提出的研究任务相吻合？本研究能否对已有的研究作重要的补充、充实或验证？ 5 本研究的目的和意义是什么？本研究将使哪些人和哪些学科领域受益？社会、经济效益如何？（二）研究目的 1 该项研究的具体目的是什么？是探索性的开拓性研究，还是从某一方面深入的分析性研究？ 2 该研究的主要假设是什么？是否很简练而明确地将假设予以表达？ 3 是否还想研究、分析假设之外更多一些的问题？具体包括哪些？（三）研究设计 1 该研究的方法是否能够检验所提的假说？所选用的具体方法是否对本研究最为合适？是否需要其它方法？可否证明所选用方法的正确性？ 2 所需的研究对象数是否有把握获得？ 3 如果可以使用盲法进行研究，是否已经采用？ 4 统计分析的方法是如何考虑的，会不会在分析阶段还需要其它方法？ 5 调查问卷与试验仪器以及试剂、药品是否都已齐备？有无在实施过程中更换的可能性？ 6 研究现场的条件是否了解？与合作者是否已达成了协议？合作内容是否均作了安排？ 7 物质的、经济的、技术的、行政的等各方面的申请或安排，是否可以得到有关部门的批准？ 8 所需经费、设备和人力是否已经精确地估算？（四）研究对象的选择研究对象不外四种类型，即病人，非病人，暴露于研究因素者，非暴露于研究因素者。 1 对所有这些对象，定义是否均已明确？ 2 对病例来说，排除该病和确定该病的标准是否很明确、具体？使用的是新发病例还是现患病例？是在规定地区内选择的，还是临时由其它地区选择的？可否获得足够的样本数？具体措施是什么？ 3 若为病人对照，要明确是来自医院还是来自社区。一个病例选配几个对照？配比的变量、数目和方法是否明确、恰当？（五）研究的准备与实施 1 要不要进行预试验？ 2 调查问卷是否已经准备好？计划调查和测定的项目是否均已列入？不必要的项目是否都已删掉了？是否还需要其它表格？ 3 调查问卷是由研究对象本人回答还是由调查员去调查？调查员是否已经经过良好的培训？ 4 是否需要自医院的病案或其它信息来源摘录信息？是否需要用其它特殊表格来记录体检或实验室检查的结果？ 5 能够评价所用各种研究方法或工具的真实性与可靠性吗？ 6 可用什么方法来提高和促进被调查者回忆的精确性与完整性？ 7 所获得的信息是否足以进行分析比较，例如病例与对照之间某些方面较细致的比较？ 8 是否收集了关于潜在的混杂因素的信息？ 9 何人负责收集、保存数据和控制数据的质量？何人负责监督调查员和其他工作人员的工作。 10 是否编写了供调查员、信息摘抄员等人使用的工作手册？是否对其中有关事项都做了明确的规定？如何能使各有关工作人员均能准确地按既定的工作程序操作？（六）数据整理与分析 1 数据总的处理分析方案是什么？对要研究的变量、指标是否已明确？ 2 如果拟分析剂量反应关系，是否对资料已做了相应的准备？ 3 如何在分析时检验和排除某些因素可能带来的偏倚？ 4 如何评价相关因素之间的交互作用？ 5 若作分层分析，在数据整理分析时的分层是否和设计时一致？ 6 如何评价无应答者对研究结果的影响？有否搜集这方面的资料？ 7 数据的分析可否评价设计时的假说，达到预期的研究目的？医学科研方法分类一、按研究目的分类?形态、功能研究 ?病因研究 ?疗效研究 ?预后研究 ?诊断方法研究 ?实验室方法、技术研究二、按设计分类?观察性研究 ?实验性研究15?理论性研究1.观察性研究 ?描述性研究横断面调查普查、抽样调查、典型调查（病例报告、病例分析属典型调查）常规资料分析生态学研究纵向描述 ?分析性研究病例对照研究队列研究其他病例病例研究巢式病例对照研究病例交叉研究 2.实验性研究?基础实验 ?动物实验 ?人群实验临床实验社区实验动物实验 3.理论性研究?模型研究描述性研究?利用已有的的资料或对专门调查的资料，描绘疾病或某特征的状况、规律 ?分类横断面调查普查、抽样调查、典型调查（病例报告、病例分析属典型调查）常规资料分析生态学研究纵向描述?原则代表性客观性可信性准确性表达的科学性第一节横断面研究一、概念横断面研究（cross-sectional study）是对特定时间与特定范围内观察对象的目标变量进行观察测量，运用统计学方法对观察结果归纳、概括，描述目标变量的规律。根据观察对象的范围，横断面研究可分为普查、抽样调查和典型调查。二、横断面研究的目的（一）描述疾病或某事件的特征。（二）描述某变量与疾病之间的关联。（三）评价防制措施的效果。（四）确定所有病人或高危人群（五）建立某生理指标。三特点★一般不设对照组 ★特定时点或期间内完成 ★确定因果联系受限、对不改变的暴露因素，可作因果推论 ★正确描述方法与统计学密切相关，分类资料一般不能计算发病率等真正的率16四、横断面研究的种类（一）普查 1.概念：于一定时间内对一定范围的人群中每一成员所作的调查或检查。 2.普查的适用条件（1）适用于患病率较高的疾病。（2）疾病的检测手段和方法简单准确，最好有可靠有效的治疗方法。（3）调查范围小，人数少时，可直接用普查。（4）具备人力、物力和设备等条件，有完成普查的可行性。（5）应能保证一定的普查率。一般不低于 80％。3.普查的优缺点（1）优点 1）确定调查对象上比较简单。不存在选择性偏倚。 2）不需要进行统计推断 3)可查出某人群中患某病的所有病人，使其得到及时治疗。 3）普查的同时也开展了一次医学科普教育。（2）缺点 1)普查对象多，调查期限短，漏查是难免的。 2)参加普查的工作人员多，他们掌握调查技术和检验方法的程度不等，调查质量不易控制。 3)患病率或阳性率低，诊断技术复杂的疾病不宜进行普查。（二）抽样调查 1.概念指只调查有代表性的样本，根据调查结果估计出人群某病的患病率或某特征的情况。 2.要抽取一个有代表性的样本，就必须遵循随机化原则和样本大小适当的原则。（1）随机化原则是指整个研究总体中的每一个单位（可以是个人，也可以是个人的集合体，如学校、连队、班级或居民委员会等）被选入样本的概率相等。 (2)样本大小适当的原则是指样本应达到一定数量，样本过小时可能所抽出的样本的代表性不够；样本过大不但浪费人力、物力，而且工作量过大，容易因调查不够细致而造成偏倚。 3.常用的随机化抽样方法（1）单纯随机抽样（2）系统抽样（3）分层抽样（4）整群抽样（5）两级或多级抽样１０００个随机数字 00-04 05-09 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 01
4.样本含量估计（1）决定样本大小的因素 1）容许误差 2）预期患病率（阳性率）或标准差（2）样本含量的计算 171）计量资料公式中n为样本含量，d为容许误差，即样本均数与总体均数之差，由调查设计者根据实际情况规定。s为样本标准差。例：欲调查某病病人血红蛋白含量，根据以往的经验，s＝3.0g/100ml，要求误差不超过0.5g/100ml，则该调查样本大小为：2）计数资料当容许误差d=0.1P 时，则 N=400×Q/P 当容许误差d=0.15P 时，则 N=178×Q/P 当容许误差d=0.2P 时，则 N=100×Q/P 上式中Ｐ是某病患病率，Q=1－P，N即样本数量。此公式适用于呈二项分布性质的资料，且患病率不太大或太小的情况。 3)患病率很低疾病的样本含量估计按泊松分布期望值的可信限进行估计。例如：某地的肝癌发病率估计为20/10万，欲对该地的肝癌发生情况进行调查，问应抽多少人？如果随机抽1万人，按估计的发病率计算，可能发生2例病人。参考Poisson分布可信限表，期望值为2的90%可信限下限为0.355, 上限为6.30。这样我们就有可能见不到病例，使调查工作失去意义。当期望值为4时，90%可信限下限为1.37，即有90%的机会可见到病例。这样，抽取20000人可满足期望值为4的要求。如采用整群抽样，样本量须加大，可粗定为加大简单随机抽样的样本量的1/2，即应抽取30000人。5.抽样调查的优缺点（1）优点：抽样调查和普查相比具有省时、省力、省材料和省经费的特点。由于调查样本相对较小，因而较易集中人力、物力和器材设备，调查结果也易作到细致、准确。（2）缺点：抽样调查的设计、组织实施以及资料分析等方面比较复杂。重复和遗漏不易发现。也不适用于变异过大的材料。（三）典型调查对选定的典型人群的全部进行调查研究。四、横断面研究的步骤１.选题和确定本次调查研究的目的一般要求调查的目的明确、具体；一次调查的解决的问题不宜太多。２.确定研究对象和调查方法是普查还是抽样调查或典型调查。普查需确定普查的范围；抽样调查则需确定抽样方法和样本大小。３.确定研究变量及其定义和测量方法应尽量采用简单、易行的技术和灵敏度高的检验方法。 4.拟订调查表调查表类型：一览表式、一研究单位一表开放式、封闭式、复合式。一般包括三个部分。第一部分，即一般性项目，包括姓名、年龄、性别、出生年月、出生地、文化程度、职业、民族、工作单位、现住址等。主要是为了保证分析项目填写完整、正确、便于核查，补填或更正而设置的。第二部分，即调查研究项目，这是调查研究的实质部分。在设计这部分内容时，有下列几项原则可供参考。 ①与本次调查有关的项目一项也不能缺，而与本次调查无关的项目一项也不应有。 ②每个调查项目都要用通俗的文字准确无误地表达出来。不应使被调查者产生误解或出现不同的理解。 ③应尽量选用那些能以客观指标来回答的问题询问调查对象。第三部分，即调查者部分?调查质量的评价 ?记录特别的情况 ?列出D调查者‖和D调查日期‖，5.挑选和培训调查员。有助于查询和明确责任。 186.进行现场调查。方式：面访、通信调查、电话调查、自我管理式调查。 7.对调查资料进行整理和分析现况调查所得资料，可按下列步骤进行整理和分析： ①检查与核对原始资料检查原始资料的准确性、完整性，填补缺漏，删去重复，纠正错误。 ②率的计算将疾病现况调查资料按不同的人口学特征（性别、年龄、种族、职业、文化程度、生活方式等）和地区等方面加以整理，并计算疾病的患病率、感染率、死亡率。 ③计量资料均数、中位数、几何均数、百分位数、标准差。运用卫生统计学方法计算出这些差异是否有显著意义以及某种分布特征与其它因素的关联强度。五.横断面研究中常见的偏倚及其防止（一）偏倚的概念 1.误差：测得值与真实值之差。（1）抽样误差：由于抽样产生得样本指标与总体参数之差。常用抽样方法的抽样误差由大到小依次为：整群抽样、单纯随机抽样、系统抽样、分层抽样。（2）系统误差：由于某些较恒定的因素造成的测得值倾向性得偏离真实值。在流行病学上系统误差被称为偏倚。 2.偏倚产生的原因：（1）来自受试者：（2）来自观察者：（3）来自仪器：（4）来自外环境的非实验因素： 3.偏倚的控制找到偏倚产生的原因，消除偏倚。如：通过正确的设计控制偏倚；严格校正仪器、培训实验人员控制偏倚。（二）横断面研究中可能发生的偏倚 1.选择偏倚（1）选择性偏倚（2）无应答偏倚（3）幸存者偏倚 2.信息偏倚（1）调查对象所引起的偏倚（2）调查员偏倚（3）测量偏倚（二）防止产生偏倚的措施针对偏倚产生的原因采取相应措施。 1.在设计中明确规定为随机样本的，必须严格遵守随机化的原则。尽量提高应答率。设法补查一部分无应答者并作分析。 2.训练调查员并对其进行监督和质量控制。 3.选用精良的仪器设备并事先作好校准。在整个调查中所用试剂力求一致，以消除可能引起的差异。第二节生态学研究一、生态学研究的定义：以群体为观察、分析单位，通过描述不同人群某因素的暴露情况与疾病的频率，分析该因素与疾病的关系。二、生态学研究的方法 1.生态比较研究：比较不同人群中某疾病的发病率、死亡率或健康状态的差别，了解某些因素的出现率与疾病率的关系，从而获得病因的线索。 2.生态趋势研究：连续观察一个或多个人群中平均暴露水平的改变和某疾病的发病率、死亡率的变化的关系。三、生态学研究的用途★提供病因线索，产生病因假设 ★评估人群干预措施的效果四优点★经济，出结果快 ★提供病因未明疾病的病因线索 ★对个体剂量无法测量的情况，是唯一可供选择的方法 ★适用于研究因素暴露变异范围小，较难测量暴露与疾病的关系 ★人群干预措施的评价及估计疾病发展趋势五、生态学研究的局限性★出现生态学谬误 ★难以控制混杂因素19★存在多重共线性问题 ★难以确定因果联系:相关资料中的暴露水平只是近似值或平均水平，而不是个体的实际的值。第三节常规资料分析?常规资料一般指医疗卫生系统的工作原始记录，是医疗机构不断积累并常年保存的可供查阅、提供医学科研信息、评价防治工作的资料，包括日常填写的工作记录和定期整理归档的统计报表两类。第四节纵向描述纵向描述：包括随访调查和疾病监测，是对研究对象或监测的疾病疾病进行长时间、连续的动态观察。分析性研究?通过专门设计的不同组间的比较，分析研究因素的作用的观察性研究方法。 ?病例对照研究，队列研究 ?脑动脉炎引起的瘫痪－钩端螺旋体 ?脑动脉炎引起的瘫痪,非瘫痪病例－－对照 ?63对 ?钩体补体结合实验，1：20以上阳性 ?脑动脉炎引起的瘫痪阳性43例 ?非瘫痪病例－－对照阳性5例 ?43/63; 5/63分析性研究之病例对照研究第一节一.基本原理概述（1）a/a+c=b/b+d 暴露因素与疾病无关（2）a/a+c&b/b+d 暴露因素为疾病危险因素（3）a/a+c&b/b+d 暴露因素为疾病保护因素二.定义：选定患某病病例和未患该病的对照，分别调查其既往暴露于某个（或某些）危险因子的情况及程度，以判断暴露危险因子与某病有无关联及其关联程度大小的一种观察研究方法。三.暴露：指曾经接触过某种研究因素或具备某种特征。四、用途： 1.探索疾病的病因或危险因素。 2.药物有害作用的研究。 3.疾病预后研究。 4.评价疾病预防与治疗措施的效果。五、特点 1.属于观察法 2.设立对照组 3.观察方向由D果‖及D因‖ 4.不能确实证明暴露与疾病的因果关系。第二节病例对照研究的种类（一）病例与对照不匹配的病例对照研究20要求对照人数应多于或等于病例人数。（二）病例与对照匹配的病例对照研究匹配：即要求对照组在某些因素或特性上与病例组保持相同。匹配的目的：排除匹配因素对研究结果的干扰。与疾病及所怀疑的病因因素都有联系的因素，可能是混杂因素，可选为匹配因素。匹配的优点（1 ）增加流行病学效率。（2 ）排除非研究因素的影响。匹配的缺点：（1 ）选择对象复杂。（2 ）需匹配因素多时，难以决定合适的匹配因素。 1.成组匹配：就是要求对照组匹配因素所占比例与病例组一致。 2.个体匹配：以每一病例为单位，选择在某些特征或变量方面与病例一致的一个或几个对照，组成计数和分析的单位。第三节病例对照研究的实施（一）明确目的（二）选择适宜的对照形式 1.广泛地探索疾病的危险因子――不匹配，成组匹配。 2.罕见病――个体匹配。 3.对照的性质――兄弟，姐妹，邻居等为对照――个体匹配。（三）对象的选择： 1.病例的选择：病例是指患所研究疾病者或发生某事件者。（1）诊断标准：应尽量采用国际和国内的标准。（2）病例来源： 1）来源于医院： 2）来源于社区（3）病例有三种：新发病例、现患病例和死亡病例。 2.对照的选择：对照是指未患所研究疾病者，可以是健康人，也可以是患与所研究疾病病因无关的其他疾病的病人。（1）对照应代表病例的源人群。（2）对照的来源： 1）同一或多个医疗机构中诊断的其他病例； 2）病例的邻居或所在同一居委会、住宅区内的健康人或非该病病例； 3）社区团体人群中的非该病病例或健康人； 4）病例的配偶、同胞、亲戚、同学或同事。（3）选择对照应注意： 1）对照必须不患所调查的疾病，不是隐性病例，也不是处于潜伏期的病例。 2）与病例的病因因素无关或无联系；如肺癌，慢性支气管炎，肺结核均可能与吸烟有关，不能互为对照。 3）必须与病例选自同一人群，即在研究时他如患病，他将是被研究的病例。 4）选择的方法应事先规定，规定后要严格遵守，不可随意更改。 5）对照与病例组除要比较的因素外，其他各方面的特性应尽量一致，即所谓均衡。（四）样本含量的估计 1.影响样本大小的因素 (1).研究因素在对照组中的暴露率P0； (2).估计该因素引起的相对危险度RR或暴露的比值比OR。 (3).希望达到的检验显著性水平，即假设检验第Ⅰ类错误的概率α ； (4).希望达到的检验把握度（1-β ），β 为统计学假设检验第Ⅱ类错误的概率. 2.估计方法 2.非匹配病例对照研究P1=(OR×P0)/(1-P0+P0×OR) P0＝（P0＋P1）/2 Z0.05=1.96 Z0.10=1.28P=OR/(1+OR)≈RR/(1+RR) m为结果不一致的对子数则需要的总对子数M为： M ≈m/(P0q1+P1q0) P0、P1为对照组、病例组的暴露率 P1=(OR×P0)/(1-P0+P0×OR) q1＝1－P1，q0＝1－p0 ? 病例组为经胃镜确诊的胃溃疡患者中的Hp感染者 ? 6个月内无消化性溃疡及溃疡病史，无慢性胃炎，功能性消化不良，胃癌等Hp相关疾病的Hp感染者为对照 ? 暴露因素：毒力基因包括vacA的亚型s1a, s1b, s1c, s2, m1, m2a, m2b ；cgaA、babA2、iceA1、iceA2 3.样本含量估计的注意事项 21（1）实际研究中往往同时探索几个因素，而每个因素都有各自的 OR及P0 ，这时估计样本大小常以最小的OR和最适合的P0为准进行估计，以使所有的因素都能获得较高的检验效率。（2）样本含量估计中几个参数的相互关系 1）对一定的α ，β 和P0来说，当OR增大时，所需样本含量减少 2）对一定的α 、β 和OR来说，P0接近50％时，所需样本含量最小。 3）对一定的β 、OR、P0来说，α 增大时，样本含量减少 4）对一定的α 、OR和P0来说，β 增大时，所需样本含量减少 ?研究口服避孕药与先天性心脏病的关系，α ＝0.05，β ＝0.1 1:1病例对照研究对照组暴露比例p0＝0.3, OR=2 先求P1＝0.46, P=2/3, m=90 M=186 ?CCL3L1基因表达量与性传播HIV易感性的关系 ?1:1病例对照研究 ?按照CCL3L1 mRNA的中位数将病例、对照分为高表达组和低表达组，估计OR值为3，对照组低表达暴露率为20％，α 取0.05,β 取0.1,不匹配病例对照研究，计算得样本含量为85，即两项病例对照研究分别需要病例和对照85例。（五）研究因素的选择： 1.变量的选择 2.变量的规定（六）资料的收集询问、查阅档案，采样化验，实地查看等第四节资料整理与分析一.资料的整理 1.原始资料的核查 2.原始资料的分组、归纳或编码输入计算机。二.数据的分析 1.描述性统计（1）描述研究对象的一般特征（2）均衡性检验 2.统计性推断 (1)不匹配（或成组）不分层资料的分析 1）按每个因素将资料整理成四格表病例对照研究资料整理表2)暴露率的假设检验：3）计算暴露与疾病的关联强度相对危险度（RR）：暴露组发病率与非暴露组之比。 RR&1：正联系，危险因素 RR&1：负联系，保护因素 RR=1：无联系病例对照研究无法计算RR。比值比（OR ）： OR ＝ad/bc OR95% 可信区间： 4) 得出结论：有无联系，联系强度。口服避孕药（OC）与心肌梗死关系的病例对照研究22X2=7.70 p&0.01 OR=2.20 OR 95% C.I.:1.26-3.84 （2）不匹配分层资料分析层－－组分层的目的：排除混杂因素的干扰。 1)不分层分析 2)分层资料的整理：3)计算各层OR值：若各层OR值无显著性差别，则计算ORMH。否则，不宜计算ORMH，应计算标准化死亡率或标准化率比。 4)计算总的OR值： ORMH。如OR与ORMH有差别，则有混杂存在。如OR与ORMH无差别，则无混杂存在。 5)计算总的x2： 6)得出结论：OR1＝2.80 ORMH＝2.79 X2MH＝11.79 （3）分级资料的分析 1）资料整理OR2=2.78 ORMH95％C.I.：3.18－2.22 ν ＝4-1=3 P&0.012）卡方检验 3)计算各级的OR值：应进行趋势检验 4）得出结论OR 1 .0 8 .1 x2=43.15 P&0.001 趋势检验：（4）个体匹配资料的分析 1)将资料整理成四格表：11.5217.93232)x2检验：3)计算OR及OR95%可信区间：4)得出结论：X2＝19.53 P&0.005 OR=9.67(2.31-40.41) (5)计量资料的分析?计量资料直接比较 ?转换为分级资料或2分变量资料 ?应用多元回归分析第五节病例对照研究的优缺点（一）优点： 1.特别适用于罕见病的研究。 2.省时间、省人力、省经费，易于组织实施。 3.一次可调查多个因素。分析性研究之队列研究第一节概述一、定义、基本原理及有关概念（一）定义：选定暴露及未暴露于某因素的两种人群，追踪其各自的某种疾病结局，比较两者疾病结局的差异，从而判定暴露因子与发病或死亡有无因果关联及关联大小的一种观察研究方法。（二）队列：指有共同特征或有共同经历一群人。（三）基本原理二、队列研究的特点： 1.属于观察法 2.设立对照组 3.观察方向由D因‖及D果‖ 4.能确证暴露与疾病的因果联系三、队列研究的目的 1.检验病因假设 2.描述疾病的自然史 3.评价自发的预防效果 4.预后、疗效研究四、队列研究的类型 1.前瞻性队列研究 2.历史性队列研究 3.双向性队列研究 24第二节一、确定研究因素：研究因素暴露因子定义，测量方法二、确定研究结局结局指研究者预期的结果事件。队列研究的步骤三、研究对象的选择 1.选择研究对象的两种基本方式（1）按规定的暴露选择一组有暴露的人群，然后另外选择一组非暴露人群；这组非暴露人群称为外对照组。（2）选择一个暴露因素分布不均匀的人群，将其一分为二，即分成暴露组和非暴露组，这个非暴露组叫内对照组。 2.暴露人群的选择（1）职业人群（2）特殊暴露人群（3）一般人群（4）有组织的人群团体 3.对照人群的选择：应注意其与暴露人群的可比性（对照人群除未暴露于所研究的因素外，其它各种因素或人群特征应尽可能与暴露人群相同）。（1）内对照：在同一研究人群中，无暴露或暴露水平最低的人员。（2）特设对照（外对照）：（3）总人口对照：（4）多重对照：四、确定样本大小 1.决定样本大小的因素：（1）一般人群中所研究疾病的发病率水平p0：p0越接近0.5，所需观察的人数越少。（2）暴露人群的发病率p1：d＝p1－p0，d值越大，所需观察人数越少。（3）显著性水平：α 0.05或0.01 （4）把握度：1-β β ＝0.9 2.计算公式 3.注意事项：（1）暴露组与对照组的比例：通常采用两组等量的方法。（2）通常按10%来估计失访率，故计算出来的样本量再加10%做为实用样本量。五、资料的收集－－随访或追踪 1.基础信息的收集：随访研究对象之前，研究人员要获得有关研究对象的多种必要的确实材料做为判断研究终点和分析比较的基础，这称为基础资料。（1）内容： 1)研究对象暴露于研究因素的情况。 2)与判断终点有关的资料：例如观察终点是糖尿病，则全部对象要测尿糖、空腹血糖等以排除糖尿病患者。 3)有关协变量的资料：即暴露于其它与患病有关的危险因素的情况。 25（2）获取基础资料的方式： 1)查阅记录或档案： 2)访问研究对象或其它能够提供信息的人 3)对研究对象进行测定或检查 4)有时要对环境作调查与检测目的是确定一项暴露，如对水质进行化验。 2.随访（1）随访的对象和内容暴露组和对照组同等对待。随访内容： 1)确定研究对象是否仍处于观察之中。 2)确定研究人群中的结局事件。 3)进一步收集有关暴露和混杂因素的资料，以备分析资料时用。（2）方法：利用记录或档案；特殊随访：定期体检、访问等；对环境做调查或检测 3.观察终点和终止时间（1）观察终点：指观察对象出现了预期的结局，至此就不再继续观察该对象。（2）观察终止时间：指整个研究工作观察的截至时间。即随访期，可根据潜隐期确定。第四节资料分析一、描述性分析二、率的计算（一）累计发病率（CI）：当观察人口的人数比较多，比较稳定时计算。 CI＝D/N D:观察期内发病人数 N:观察开始时的人口数（二）发病密度（ID）：当研究人群的人数比较多，人口不稳定，每个观察对象随访时间不同时计算。 ID=D/PY PY:观察人年数。（三）人年的计算 1.以个体为单位计算暴露人年0＋8/12＋01/30/12=0.67人年 2.动态人群3.寿命表法：Lx=Ix+1/2(Nx-Dx-Wx)，Ix+1=Ix+Nx-Dx-Wx 26三、率的假设检验卡方检验率的U检验四、暴露与疾病关联强度的指标 1.相对危险度（RR） RR＝Ie/Io RR表示暴露组发病或死亡的危险度是非暴露组的多少倍。 RR95%可信区间：2.特异危险度（AR）：暴露组的率与非暴露组的率之差。 AR=Ie-Io AR表示：在暴露组中完全由暴露因素所造成的率。 3.归因危险度百分比（AR%）： AR%=(Ie-Io)/Ie×100% AR%表示：暴露人群中由暴露因素造成的发病或死亡占全部发病或死亡的百分比。 4.人群归因危险度（PAR）： PAR＝It-Io PAR表示在一般人群中完全由暴露因素造成的率。 5.人群归因危险度百分比（PAR%）： PAR%=(It-Io)/It×100% PAR%表示：在一般人群中由暴露因素造成的发病或死亡占全部发病或死亡的百分比。例：吸烟者肺癌年死亡率Ie＝0.96‰ 非吸烟者肺癌年死亡率Io＝0.07‰ 全人群肺癌年死亡率It＝0.56‰ RR=Ie/Io＝ 0.96‰/ 0.07‰=13.7 AR=Ie-Io＝ 0.96‰－0.07‰=0.89 ‰ AR％＝(Ie-Io)/Ie×100% =(0.96‰－0.07‰)/ 0.96‰=92.7% PAR＝It-Io= 0.56‰－ 0.07‰＝ 0.49‰ PAR%=(It-Io)/It×100% ＝(0.56‰－ 0.07‰)/ 0.56‰=87.5% 五、得出结论：第五节队列研究中的偏倚及其防止一、常见的偏倚选择偏倚失访偏倚信息偏倚错分偏倚：暴露错分、疾病错分、联合错分混杂偏倚混杂偏倚：当研究暴露于某因素与疾病的关系时，由于一个或多个既与疾病有制约关系，又与暴露密切相关的外来因素的影响，掩盖或夸大了所研究的暴露因素与疾病的联系，这种误差称为混杂偏倚或混杂。 27二、偏倚的控制选择偏倚：严格按规定的标准选对象；参加者与不愿参加者主要特点是否有不同失访偏倚：降低失访率；失访率＞10%时分析失访的作用；失访率＞20%，结果真实性可疑信息偏倚：提高设计水平和调查质量；校正仪器；错分偏倚：采用灵敏度、特异度高的方法，两组一视同仁混杂偏倚第六节队列研究优缺点（一）优点 1.可获得发病率或死亡率，可直接计算RR。 2.可证实病因联系。 3.有助于了解疾病自然史。 4.可研究一种暴露与多种疾病的联系。 5.样本量大，结果稳定。 6.可了解基线率，因而能够发展和实施控制、预防和健康促进规划。 7.不存在回忆偏倚。（二）缺点 1.不适合发病率很低的疾病的病因研究。 2.失访难以避免。 3.费时间、费人力、费经费。 4.研究过程中，未知变量的引入可能导致结局受影响。 5.设计要求高，实施难度大。诊断试验的评价§1.概述一、概念诊断试验（diagnostic test）:是指应用实验、仪器设备等手段对疾病进行诊断的一切检测方法。包括各种实验室检查（生物化学、免疫学、微生物学、病理学等）、影像诊断（超声波、CT、X线、核磁共振等）、仪器检查（心电图、脑电图、核素扫描、内窥镜等），还包括病史询问、体格检查等。二、诊断试验的目的是把病人与可疑有病、但实际无病的人区别开来，以便对确诊的病人给予相应的治疗。三、为什么要评价诊断试验 1. 新的诊断试验方法不断被提出 2. 现有诊断方法缺陷需要新的方法 3. 对诊断结果的解释（指导临床实践）四、诊断试验评价的应用状况上海医科大学临床流行病学中心调查结果抽查了年在5种中华医学会系列杂志发表的有关诊断试验评价的论著112篇。结果：90%以上的论著设计不合理。存在的问题： 1. 缺乏金标准：18篇 2. 仅有阳性率：40篇（无敏感度、特异度等评价指标） 3. 用LR（似然比）和AUCROC（ROC曲线下面积）：0篇?确定诊断临界值（正常参考值缺陷）正常参考值范围的研究，常用正态分布、百分位数及受试者工作特征曲线（ROC）法。常见缺陷有：?千篇一律使用正态分布法； ?样本例数过少，其代表性和结果的稳定性差； ?盲目沿用国外或以前实验室建立的诊断临界值；?选择金标准缺陷?以不可靠的诊断方法作为D金标准‖； ?金标准与所评价的诊断试验不独立；?评价指标缺陷?诊断试验评价：概念混淆，张冠李戴； ?一致性评价：仅比较新旧标准差异，无金标准； ?联合诊断试验评价：平行试验；系列试验?非盲法缺陷?未采用盲法判定金标准和诊断试验的结果； ?对D病例组‖中试验结果为(-)者，重复试验，增加了(+)机会；?对象选择缺陷?研究对象构成范围过窄，不具有代表性； ?Work-up偏倚。五、诊断试验与筛检试验的区别 28§2.诊断试验的评价一、概念金标准（Gold standard）：是公认可靠、准确的诊断方法。如病理检查(活检、尸检)、手术探查、病原体的分离及抗体检测、特殊影像学检查等。有些疾病尚无特异性诊断标准，则以专家制订、得到公认的临床诊断标准为依据。 Need to remember that all gold standards are actually gold, though: new test may be better than the gold standard表血清肌酸磷酸激酶测定诊断急性心肌梗死二、诊断试验的评价指标 1. 真实性（validity）真实性又称准确度(Accuracy)或有效性，是指诊断试验所获得的测量值与实际值(D金标准‖)的符合程度。 2. 可靠性（reliability）又称信度，指某一诊断方法在相同条件下重复测量同一受试者时，所获结果的稳定程度。 3. 预测值（predictive value）应用诊断试验判定受检者患病和不患病可能性的大小。 ⒈ 真实性指标 29? 灵敏度(sensitivity)(真阳性率) 即实际有病且被该诊断试验正确判为有病的百分率。 ? 假阴性率(false negative rate)(漏诊率、第二类错误) 即实际有病而被诊断试验判定为非病者的百分率。 ? 特异度(specificity)(真阴性率) 即实际无病且被该诊断试验正确判为无病的百分率。 ? 假阳性率(false positive rate)(误诊率、Ⅰ类错误) 即实际无病而被该诊断试验判为有病的百分率。 ? 约登指数（Youden’s index）也称正确指数，是灵敏度和特异度之和减去1。约登指数= (灵敏度+特异度) -1 = 1- (假阳性率+假阴性率) 约登指数的取值范围（0~1）。 ? 似然比(likelihood ratio) 为病人中出现某种检测结果的概率与非病人中出现相应结果的概率之比。 1) 阳性似然比(Positive likelihood ratio) 是指真阳性率与假阳性率之比，说明病人中出现某种检测结果阳性的概率是非病人的多少倍，即一项试验按某已定标准判断某病人结果为阳性。2) 阴性似然比（negative likelihood ratio）是指假阴性率与真阴性率之比，说明病人中出现某种检测结果阴性的概率是非病人的多少倍。阳性似然比越大诊断试验的真实性越好；诊断试验才可能具有临床价值，阴性似然比越小诊断试验的真实性越好。 ? 一致率（agreement/consistency rate）又称符合率，是诊断试验判定的结果与标准诊断的结果相同的数占总受检人数的比例。粗一致性和调整一致性说明诊断检试验阳性与阴性结果均正确的百分比。Kappa分析：考虑了机遇因素对一致性的影响表血清肌酸磷酸激酶测定诊断急性心肌梗死灵敏度（真阳性率）=(225/250)×100%=90.0% 漏诊率（假阴性率）=(25/250)×100%=10.0% 误诊率（假阳性率）=(24/145)×100%=16.6% 特异度（真阴性率）=(121/145)×100%=83.4% 约登指数=90.0%+83.4%-1=73.4% 30阳性似然比=90.0%/16.6%=5.42 阴性似然比=10.0%/83.4%=0.12 粗一致率=(225+121)/395×100%=87.6% 调整一致率=1/4(225/250+225/249+121/145+121/146)=86.7% Kappa 值=0.65 ⒉ 可靠性（reliability）又称信度，指某一诊断试验在相同条件下重复测量同一受试者时，所获结果的稳定程度。可通过 Kappa 检验进行评价。影响因素 ? 受试对象生物学变异 ? 观察者 ? 实验室条件真实性与可靠性的图示3.预测值（Predictive values）?诊断试验本身特点决定了灵敏度和特异度。 ?临床医生想知道如果诊断试验阳性(+PV) 或阴性，试验本身是正确的概率。 ?阳性预测值：如果诊断试验结果是阳性D病人‖真正有病的可能性。 ?阴性预测值：如果试验结果是阴性，D病人‖真正无病的概率。3.预测值（Predictive values）应用诊断结果来判定受试者患病和不患病可能性的大小。 ? 阳性预测值(positive predictive value)：指诊断试验阳性者患目标疾病的可能性。?阴性预测值(negative predictive value)：指诊断试验阴性者不患目标疾病的可能性。影响预测值的因素：患病率、灵敏度、特异度。 (1) 患病率与预测值的关系假设灵敏度和特异度均为95%，按上述公式计算阳性、阴性预测值结果，如下：? 患病率越低，阳性预测值越低，阴性预测值越高； ? 患病率越高，阳性预测值越高，阴性预测值越低； ? 当患病率＝50%时，阳性预测值与阴性预测值均较好。31(2) 灵敏度、特异度与预测值的关系当患病率一定时，随着灵敏度降低，阴性预测值下降。特异度升高，阳性预测值升高。其它指标 ?诊断效率(DE)=(a+d)/n；DE取值0~1之间，愈接近1，效率愈高 ?诊断指数(DI)=Se+Sp；当DI&100时，这种诊断试验应淘汰。一般认为当DI&150时，才有较好的临床应用价值。 ?可用度(DA ?可靠度(DR)=1-(c/(a+c)+b/(b+d))；DR取值-1~+1之间，一般当DR≥0.5时才有应用价值 ?比数积(RP)或优势比：RP=ad/bc；RP取值0~∝，RP愈大，应用价值愈高。当Se与Sp均为0.5时，RP=1，故RP≤1的诊断试验是没有价值的，一般认为，只有当RP≥9的试验才有应用价值。三、诊断界值的确定诊断界值确定时需要满足以下原则：?如果疾病的早期诊断将使病人获得有效治疗和康复，漏诊或延误诊断将会造成严重后果时，则尽可能使该诊断试验的灵敏度增加，目的是尽可能发现可疑病人；?如果误诊将会对病人造成严重的心理、生理和经济上的影响或是对某病的确诊时需使特异度增加； ?如果疾病的漏诊和误诊同等重要，应将诊断试验阳性界值定在灵敏度和特异度均较高的位置。四、联合试验定义：联合试验是指采用多个诊断试验判定一种疾病。目的：提高灵敏度或特异度联合试验诊断糖尿病的结果32串联：全阳为阳，否则为阴；并联：一阳即阳，全阴才阴。单项试验及联合试验诊断糖尿病结果选择联合试验的原则： 1. 采用并联方法的情况： ① 必须迅速做出判断； ② 目前尚无一种灵敏度很高的试验； ③ 灵敏度高的试验费用昂贵且安全性差； ④ 漏掉一个病人时后果严重，应尽可能发现全部病人。 2. 采用串联方法的情况： ① 不必迅速做出判断； ② 目前对该病的几种诊断方法特异度不太高； ③ 必须做某些昂贵或不安全的试验。 §3.诊断试验评价的基本步骤诊断试验评价的基本步骤一、确定金标准二、确定研究对象三、估计样本含量四、盲法判断试验结果五、整理分析资料六、质量控制一、确定金标准金标准（gold standard）标准诊断（standard diagnosis）金标准能正确区分研究对象是否患病；通常，一种疾病有一个国际或国内公认的标准的诊断方法，是能够肯定或排除某种疾病的最可靠的诊断方法；病理学检查、手术、尸体解剖、特殊的影像学诊断以及微生物学培养、生物学标志检测是普遍意义的金标准。二、确定研究对象 ? 原则：代表性； ? 病例组：按金标准确诊为D有病‖的病例，包括各种临床类型的病例； ? 对照组：按D金标准‖确诊为无目标疾病的其他病例，特别是与该病容易混淆的病例。正常人一般不宜纳入对照组。三、估计样本含量与样本量有关的因素 ? 灵敏度 ? 特异度 ? 显著性检验水平 ? 容许误差33式中： n:所需样本量； uα :正态分布中累积概率为α /2时的u值，(如u0.05＝1.96)； δ :为容许误差，一般定在0.05～0.10； p:为待评价筛查方法的灵敏度或特异度。用灵敏度估计病例组所需样本量，用特异度估计对照组样本量。实例 ? 假如待评价诊断试验的估计灵敏度为75%，估计特异度为55%，试计算病例组和对照组所需样本量。 ? 设α =0.05，δ =0.08。 ? n1=(1.96/0.08)2×(1-0.75)×0.75=113 ? n2=(1.96/0.08)2×(1-0.55)×0.55=149对率作抽样调查时所需样本大小n (α =0.05)四、盲法判断试验结果即要求判断试验结果的人，不能预先知道该病例用金标准划分为?有病‘还是?无病‘，以免发生疑诊偏倚。待评价的诊断试验结果应与金标准诊断的结果进行同步对比，并列出四格表。五、整理分析资料１．选定诊断界值界值（critical value）又称截断点（cutoff），即将定量资料划分为两部分数值，需将定量测定的数据转换成阳性（异常）和阴性（正常）两类定性结果。界值一般就是正常值的界值，在诊断试验中可根据其目的进行调整。２．评价指标的分析全面分析和评价诊断试验的真实性、可靠性和预测值。诊断试验评价的ROC分析方法是目前公认的诊断试验准确度评价的标准方法，在循证医学、临床试验、临床检验、统计模型好坏的判别等方面具有十分重要的应用价值。 ROC曲线(receiver operator characteristic curve,受试者工作特性曲线) 是用真阳性率和假阳性率作图得出的曲线，它可表示灵敏度和特异度之间的关系ROC曲线常用来决定最佳临界点，通常最接近左上角那一点，可定为最佳临界点34通过比较ROC曲线下面积可比较两种和两种以上诊断试验的诊断价值，从而作出最佳选择。ROC曲线下面积的取值范围（0.5~1）。当为0.5时，该诊断试验无实际意义。曲线下面积越大，该诊断试验越好。0.5～0.7之间时表示准确性较低； 0.7～0.9之间时表示准确性中等； 0.9以上时表示诊断准确性较高。采用ROC方法表示检查的准确性，与每个检查者采用的诊断标准无关，而且正是由于诊断标准的不同，才能绘制出ROC曲线。 ROC曲线只与检查结果中患者与正常人所属的两个正态分布的重叠程度有关，它决定了ROC曲线的位置和形状。当两个分布完全重叠时，无论采用什么标准也不能区分患者和正常人。手动制作ROC曲线35SPSS做ROC曲线数据库建立 Graphs――ROC Curve… 将诊断指标选入Test Variable；将金标准结果选入State Variable； Value of State Variable中选择患病的组别；点击Option后，在Test Direction中选择结果较小还是较大时，为患病。36Excel做ROC曲线 289-291 根据手算特点，分别计算各种情况的灵敏度与特异度，然后采用散点折线图，进行绘制。ROC方法的补充 LROC 应用ROC曲线进行比较时，往往都是比较整条曲线，但有时曲线的一部分并没有临床意义，或与整条曲线的临床意义相反，对整条曲线的评价带来不利影响。特别是两条曲线相交时，曲线下面积可能相等。比较整条曲线没有现实的临床意义，因此有必要对ROC曲线分段比较，这就是LROC (local ROC)。 FROC 经典的 ROC 方法不能解决对一幅图像上多个异常进行评价的实际问题， 70 年代提出了无限制 ROC 的概念 (free-response ROC ； FROC)。FROC允许对每幅图像上的任意异常进行评价。但目前没有可供广泛应用的软件，使临床应用受到限制。 SROC 在ROC曲线方法的基础上，有学者于1993年提出用Summary ROC方法。该方法将一个诊断试验的多个相互独立的研究结果综合之后进行分析，即ROC法的meta分析。 GROC法 Francois于1991年提出GROC分析(Generalize ROC Analysis)的概念，将传统的ROC曲线和临界值方法用于医学决策问题。将常规的诊断试验准确性评价资料和其他医学问题联系起来，包括风险、成本、实用性以及疾病的先验概率等，可以解决多种诊断试验、多个灵敏度和特异度的复杂情况，因此可以考虑不同质的总体，即发病概率不同的人群资料的诊断试验评价问题。六、质量控制应该采用盲法判断试验结果避免或减少偏差。诊断试验所用的仪器型号、试验条件、试验步骤、试剂质量等要统一、标准化。诊断试验所涉及的方法须反复测试。观察指标要客观、特异，判断结果的标准要明确具体。参与调查的研究者应经过严格培训。 §4.诊断试验评价的原则与金标准盲法比较是否与金标准同时进行试验并实施盲法判断试验对象具有代表性病例组: 各型病人（如轻、中、重型病人）。对照组: 所诊断疾病易相混淆的其他疾病。样本含量是否足够，组间具有可比性。除了诊断指标以外，其他可能影响诊断的因素应尽可能相匹配。对研究地点、环境、试验对象等是否作了充分描述明确诊断试验的可重复性和临床意义诊断试验临界值的确定（对诊断阈值或诊断标准的规定是否准确合理）正态分布法：均数±2S.D.为正常值； 37百分位数法：95%可信区间（样本量&120）; ROC曲线方法联合诊断试验时是否对每一个诊断试验的敏感度与特异度等重要指标都进行了测量是否交代了诊断试验的具体操作步骤诊断试验应经过效用分析，用可靠的依据说明其临床意义和实用性，包括正确判断的收益和错误判断的可能后果。小结诊断试验与筛检试验的区别和联系诊断试验的步骤诊断试验的评价指标 ROC曲线的绘制以及曲线下面积的意义诊断试验的评价原则预后研究在临床实践中必然要涉及到疾病的预后问题，例如：患者的病情是否严重？能否痊愈？是否引起患者残废或死亡等？因此，必须研究各种疾病的转归或预后，探索影响预后的因素，发现估计预后的预测指标和改善疾病预后的措施，借以提高临床医学水平，同时也为准确判断疾病的预后提供科学依据，促进临床医学的发展。 §1.概述一、预后的概念预后(prognosis)是指疾病发生后，对将来发展为各种不同后果(痊愈、复发、恶化、伤残、并发症和死亡等)的预测或事前估计，通常以概率表示，如治愈率、复发率、n年生存率等。预后研究就是关于疾病各种结局发生概率及其影响因素的研究。就是对上述各种后果的预测。对目前尚无特殊治疗措施的疾病来说，主要研究其发病的自然转归。对有特殊治疗措施的疾病来说，主要研究经干预措施后的转归情况。二、研究和评价疾病预后的目的 1. 研究疾病对人类的危害性 2. 探索影响疾病预后的重要因素 3. 研究改善疾病预后的措施三、预后研究的内容 1 . 将发生什么结果（定性）？ 2. 发生不良结局的可能性有多大（定量）？ 3. 什么时候会发生（定时）？四、有关预后研究的若干概念 1.疾病自然史（natural history of disease）是指在不给任何治疗或干预措施的情况下，疾病从发生、发展到结局的整个过程。研究自然史的意义 ?早期诊断、早期治疗疾病，改善疾病的预后 ?判断治疗效果，即预后的好坏 ?对于一些尚无有效治疗措施的疾病，需要了解其自然转归情况 382.临床病程(clinical course) 即疾病的临床期，是指疾病开始出现症状、体征直到最后结局所经历的全过程。其中可经历多种不同医疗干预措施。临床医生可通过采取不同的医疗干预措施来改变其病程。通过采用适当治疗措施，可以改变疾病的发展过程,加速痊愈结局的到来，缩短整个病程。临床病程与自然史的异同 ?临床病程的概念和自然史不同，后者是指从发生疾病到出现疾病结局的全过程，而前者仅指其中的临床期；后者无医疗干预措施，而前者伴有医疗干预措施。 ?在预后研究中，主要是研究临床病程及何种医疗干预措施能改变临床病程、改善预后。 3. 预后因素与危险因素预后因素(prognostic factors)是指影响疾病预后的任何因素，是在患者中与疾病结局有关的因素。若患者具有这些因素时，其病程发展过程中出现某种结局的概率就可能发生改变。危险因素(risk factors)是指作用于健康人，使其患病危险性增加的因素。因此疾病的危险因素和预后因素是不同的概念，虽然有些疾病中某些危险因素也可能同是预后因素，但多数是不相同的。§2.疾病预后的测量指标疾病预后的研究主要包括以下两个方面 ? “率”的估计，常用率指标： ?病死率（Fatality rate） ?缓解率（remission rate） ?复发率（recurrence rate） ?功能丧失率(function losing rate) ?治愈率（response rate） ?生存率（survival rate） ?预后因素研究 ?一、常用的率指标 1.病死率表示一定时期内患某疾病的总人数中，死于该病的患者所占的比例。2．缓解率给予某种治疗后，进入疾病临床消失期的病例数占总治疗例数的百分比。有完全缓解率、部分缓解率和自发缓解率之分。3．复发率某种疾病患者（缓解或）痊愈后经过一定时期又重复发作的人数占（缓解或）痊愈者总数的百分比。4．功能丧失率因疾病而引起的人体结构或功能发生缺陷或异常在全体患者中所占的百分比。5．治愈率指某病患者治愈的人数占接受治疗患者总数的比例。6. 生存率表示在接受某种治疗的病人或患某病的人中，经若干年随访后，存活的病例数所占的比例。上述作为预后指标的各种率中： 39病死率常用于病程短易引起死亡的疾病，如急性传染病、急性中毒、心脑血管疾病的急性期和迅速致死的癌症。治愈率常用于病程短不易引起死亡的疾病。缓解率、复发率、功能丧失率等常用于长病程低死亡率的疾病，如慢性非传染性疾病。此类疾病病情复杂，预后多样，可缓解、复发、好转、恶化、致残、死亡等。生存率常用于长病程致死性疾病，如各种癌症，病程较短的癌症可用 1 年生存率(1Po)，一般癌症用 5 年生存率(5Po)表示预后。二、影响预后的因素 1.早期诊断，及时治疗任何疾病能否得到早期正确诊断、及时合理治疗，是影响预后的重要因素。下述方法有利于筛选病例可作到早期诊断临床前期患者, 有利于改善病人预后。 ?普查 ?定期健康体检 ?医院常规检查 2.患者病情通常病情与预后密切相关,病情不同、预后各异。凡病情较轻的病人预后较好,病情较重者预后较差。例如：肝硬化的预后与Clild-Pugh分级有关，Clild-Pugh分级是依据肝性脑病的有无和严重度、腹水的有无和严重度、血清胆红素浓度、白蛋白减少程度及凝血酶原时间延长的程度综合评分，A级5~8分，B级9~11分，C级12~15分，评分C级表示病情严重，预后差。 3.医疗条件包括:医疗设备完善,医护人员专门知识与技能,科学管理水平等,都是提供优良医疗措施的必要保证。例如败血症在基层医院治疗由于抗生素选择不合理，疗效往往较差。三甲医院结合细菌培养、药物敏感试验合理选用抗生素，疗效可以提高，预后也就较好。急性心肌梗死在基层医院由于医疗条件差，许多疗效好的治疗措施都不能进行，病死率较高，而三甲医院不仅医疗条件好，且有专科医师抢救经验丰富。许多有效治疗措施如溶栓治疗、经皮冠状动脉腔内成形术、冠状动脉搭桥手术等都可以选择，从而降低了病死率，改善预后。 4.患者身体的素质患者身体的素质是一项综合指标，包括年龄、性别、营养状况、免疫功能等。同一种疾病，由于患者身体素质不同预后差别可以很大。例如同一病理类型的非霍奇金淋巴瘤，如患者身体素质较差、年龄大、有许多慢性病、营养状况差，不能耐受强烈化疗，使病情进展，预后差，生存期短，而身体素质好的患者，经过正规强烈化疗，不仅可长期生存，甚至可治愈。 5.疾病本身的特点包括: 疾病的性质、病程、临床类型与病变程度等常是影响疾病预后的重要因素。某些自限性疾病如上呼吸道病毒感染，勿需治疗也可自愈，预后良好，但同样是病毒感染如艾滋病和重症肝炎，预后就很差；败血症虽然病情很重，但可采用有效抗生素治疗而痊愈；运动神经元疾病肌萎缩侧束硬化虽发展缓慢，但无有效治疗，预后很差，最终会因呼吸麻痹并发肺部感染死亡；霍奇金病的预后与病理类型有关，淋巴细胞为主型预后最好，5 年生存率为 94.3％，而淋巴细胞削减型预后最差， 5 年生存率仅 27.4％。 6.社会、家庭因素如医疗制度、社会保险制度、家庭成员之间关系、家庭经济情况、家庭文化教养、患者文化教养及心理因素都会影响患者疾病的预后。 §3.疾病预后的研究设计疾病预后研究包括:预后的评价及预后因素的研究。预后的评价可用D病死率、治愈率、缓解率、复发率、致残率、生存率‖等客观频率指标表示。根据研究的目的及可行性的原则，可选择有关研究设计方案：描述性研究、病例对照研究、队列研究，但预后研究的最佳研究方案是队列研究，包括回顾性队列研究和前瞻性队列研究。所选用研究设计方案不同，研究结果可能相差很大。 }

我就爱健康网