留出法-统计

留出法(holdout method),指一种简单的模型评估方法。将数据集随机分为互斥的两部分,大部分用于训练模型,小部分用于测试模型性能。通常训练集占70-80%,测试集占 20-30%。实现简单,计算成本低,但评估结果可能受数据划分影响较大。 ...

医疗卫生机构基础设施建设达标率-统计

医疗卫生机构基础设施建设达标率(compliance rate of the construction of health institutions),指报告期末由主管部门审核达到由上级主管部门按照国家发改委和原卫生部下发的《中央预算内专项资金项目-县医院、县中医院、中心乡镇卫生院、村卫生室和社区卫生服务中心建设指导意见》审核达到业务用房面积和设备配置标准 ...

实监督户数-统计

实监督户数(number of units supervised),指报告期内某地区应监督户数中实际实施经常性监督的被监督单位总数,是反映卫生监督情况的统计指标之一。

高杠杆点-统计

高杠杆点(high leveragepoints),指回归分析中自变量(X)取值极端、远离数据中心的观测点,其杠杆值显著高于平均水平。这类点可能对回归系数的估计产生较大影响,但若因变量(Y)合模型预测趋势,则未必导致模型偏差。高杠杆点需结合残差分析判断其实际影响,常用杠杆值阈值进行识别。 ...

最小截尾二乘回归-统计

最小截尾二乘回归(least trimmed squares regression),指通过截尾部分极端残差来提高回归模型稳健性的方法,将最小二乘法与截尾技术结合,减少异常值对估计结果的影响。适用于数据中存在显著异常值或非正态分布的情境,增强模型对异常数据的抵抗力。广泛应用于稳健统计分析中,提供可靠的参数估计和模型拟合。 ...

S 估计-统计

S 估计(S-estimation),指一种稳健回归方法,通过最小化残差的尺度函数来估计参数,具有较高的崩溃点,能够有效抵抗数据中大量异常值的干扰,适用于高污染数据集。

安慰剂对照-统计

安慰剂对照(placebo control),指使用一种与实验药在外观、气味、口味、重量等完全相同,不能被实验对象所识别,且无药理作用的制剂做成的对照。常用于临床试验。

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...

左删失-统计

左删失(left censoring),指在生存分析中,事件发生时间早于观察期开始时间,导致事件时间仅知为某一时间点之前。常见于研究开始时已发生事件的个体,影响数据完整性和分析精度。处理左删失数据需要特殊统计方法。

两阶段孟德尔随机化-统计

两阶段孟德尔随机化(two-step Mendelian randomization),指一种基于孟德尔随机化方法的因果推断策略,为探讨暴露因素是否通过中介变量而导致疾病结局的改变,针对暴露变量和中介变量分别选择合适的遗传变异,并分两阶段分别探讨暴露到中介和中介到结局间的因果效应,从而阐明暴露到结局的中间机制。 ...

崩溃点-统计

崩溃点(breakdown point),指衡量统计估计方法对异常值抵抗能力的指标,定义为导致估计失效所需的异常值比例。崩溃点越高,方法的稳健性越强,能够抵御更多的异常值影响。用于评估估计量在数据异常或污染情况下的可靠性。广泛应用于稳健统计分析,帮助选择适合处理噪声和异常数据的模型。 ...

R 估计-统计

R 估计(R-estimation),指基于秩统计量的估计方法,通过利用数据的秩信息而非具体数值,提供对参数的稳健估计。适用于处理异常值或非正态分布数据,减少对分布假设的依赖。广泛应用于稳健统计和非参数统计中,增强模型对数据异常和分布偏离的抵抗力,确保估计结果的可靠性和解释性。 ...

生存时间-统计

生存时间(survival time),又称“失效时间(failure time)”,广义指从规定的观察起点到某一特定终点事件出现的时间长度,狭义指研究对象在死亡前所经历的时间。

方差齐性-统计

方差齐性(homogeneity of variance),指不同组别或条件下的数据方差相等的统计特性,是方差分析(ANOVA)和线性回归等重要统计方法的前提假设之一。若方差非齐(异方差),可能导致统计检验效能降低或结果偏差。常用 Levene 检验(莱文检验)、Bartlett 检验(巴特利特检验)等方法进行验证。满足方差齐性时,组间比较的 ...

梅特罗波利斯-黑斯廷斯算法-统计

梅特罗波利斯-黑斯廷斯算法(Metropolis-Hastings algorithm),又称“Metropolis-Hastings 算法”,指一种用于从分布函数未知的概率分布中抽样的马尔科夫链蒙特卡洛方法。通过构建一个马尔科夫链,使得该链的平稳分布与所需的概率分布相对应,然后利用该马尔科夫链生成的样本进行统计推断和模型估计。 ...

析取克里金法-统计

析取克里金法(disjunctive Kriging),指在已知任意区域化变量的二维概率分布的假设下,对待估点的值或待估点值超过给定阈值的概率进行估计的一种非线性空间插值统计方法。

系统聚类-统计

系统聚类(hierarchical clustering),又称“层次聚类”、“分层聚类”,指将相似的样本或变量进行归类的方法,先将每个被聚对象各自视为一类,然后计算各类之间的距离,将类间距离最近的两类合并成一新类;接着计算新类与其他类间的距离,再将其中最近的两类合并。重复上述过程,逐步合并至所有的被聚对象都合并为一类。 ...

参数估计-统计

参数估计(parameter estimation),指根据样本数据估算总体中所关注特征的取值大小。

交叉设计的方差分析-统计

交叉设计的方差分析(analysis of variance for crossover design),指用于分析交叉试验数据的统计方法。在该设计中,受试者按特定顺序接受不同处理,通过比较阶段、处理和个体差异的变异,评估处理效应及残留效应。其优势在于控制个体变异,提高检验效能,广泛应用于医学、心理学等领域的干预研究,但需满足无携带效应和 ...

新型农村合作医疗参合率-统计

新型农村合作医疗参合率(rate of enrollment of the new rural cooperative medical scheme),指本年度某地区新型农村合作医疗参合人数占上年末该地区农业人口数的比例,其中农业人口数系当地统计局数字,部分地区为应参合人数(即农业人口数-参加城镇居民基本医保或城镇职工基本医保的农民及学生数)。是反映基本医保覆 ...
1 ...45678910111213... 90下一页
×
CHARLS指标专栏

中国健康与养老追踪调查

CHARLS分析指标一应俱全,不断完善

指标按照特性多重分类,立刻存到收藏夹