总符合率-统计

总符合率(agreement),指分类结果与实际结果完全一致的样本占总样本的比例,反映整体分类的准确性。

测试集-统计

测试集(testing set),指用于最终评估统计模型和机器学习模型性能的独立数据子集。通过模拟真实应用场景,测试模型在完全未见数据上的泛化能力。通常占总数据 10-20%,仅在模型训练和调优完成后使用。提供模型性能的客观评价,反映实际应用效果。 ...

过拟合-统计

过拟合(overfitting),指模型在训练数据上表现优异,但在新数据上性能显著下降的现象。由于过度复杂,模型捕捉了训练数据中的噪声和细节,导致泛化能力差。常见于参数过多、训练时间过长的情况。可通过正则化、早停等方法缓解。 ...

托布勒地理学第一定律-统计

托布勒地理学第一定律(obler's first law of geography),又称“地理学第一定律”,指任何事物都与其他事物相联系,但邻近的事物比较远事物联系更为紧密,形成了距离衰减概念的理论基础。

收敛-统计

收敛(convergence),指某个统计量、模型参数或目标函数值,随着数据量、迭代次数或训练时间的增加,逐渐趋近于某个稳定值或理论值的过程。

不完全数据-统计

不完全数据(incomplete data),指生存分析中,由于删失(右删失、左删失或区间删失)导致部分研究对象的事件发生时间未知的数据。

贝叶斯因子-统计

贝叶斯因子(Bayes factor),指一种用于比较两个或多个统计模型相对拟合优度的指标。它是将数据观测到的概率与模型参数的先验概率相乘,再对所有可能的参数值进行积分求和所得。

比例风险-统计

比例风险(proportional hazards),指任意两个个体风险函数之比,即风险比为常数,不随时间变化。

剂量毒性曲线-统计

剂量毒性曲线(dose-toxicity curve),指以剂量为自变量,以毒性为因变量的表现剂量与毒性之间关系的曲线图。

人均日能量摄入量-统计

人均日能量摄入量(daily calorie intake per capita),指由一定时期内调查人群能量摄入总量除以同期调查人群总人日数计算得出,反映人群每人每日平均能量摄入量,是反映健康影响因素的指标之一。

测量偏倚-统计

测量偏倚(detection bias),指组间的结果检测存在系统差异导致的偏倚。

最终聚类中心-统计

最终聚类中心(final cluster center),指在多均值聚类迭代结束时,计算得到的代表每个类的中心点。

受试者工作特征曲线-统计

受试者工作特征曲线(receiver operator characteristic curve),又称“ROC 曲线”,指以 1-特异度为横坐标,灵敏度为纵坐标,依照连续变化的诊断阈值,由不同的灵敏度和特异度画出的曲线。

后退法-统计

后退法(backward),指从建立一个包含全部自变量的回归方程开始,按照某种规则(如P 值最小且有统计学意义)每次剔除一个自变量,自变量由多到少,直至无可剔除的自变量为止的一种变量筛选方法。

条件独立假设-统计

条件独立假设(conditional independence assumption), 又称“条件可交换性假设(exchangeability assumption)”,指给定协变量后,响应变量的潜在取值与处理变量的取值无关的假设,即暴露于某种状态的个体,若暴露于另一种状态,其响应变量取值与已知暴露于该状态的个体一致。 ...

2×2 列联表-统计

2×2 列联表(2×2 contingency table),指用于分析两个二分类变量关系的表格,由两行两列组成,四个格子分别为两种变量不同水平组合下的频数。

研究内偏倚-统计

研究内偏倚(within study bias),指从纳入的文献中提取数据信息时产生的偏倚。包括提取者偏倚,研究质量评分偏倚,报告偏倚。

列线图-统计

列线图(nomogram),将多个预测因素整合为一个可视化图形的工具,通常由多条带有刻度的线条组成,可用于直观地展示各因素对结果的影响程度,并通过简单计算预测特定事件发生的概率或风险。

对数变换-统计

对数变换(logarithm transformation),指对原始数据值取对数,是用于将偏态数据转换成一个新尺度的常用数据变换方法。

无效估计-统计

无效估计(ineffective estimation),指相对于其他估计方法所得结果而言,具有较大方差的估计值。
1 ...181920212223242526... 90下一页
×
重塑学科基石

欢迎有闲之士完善公卫百科

值得:你的点滴投入,大家长期受益

回报:VIP会员特权,大额钢镚奖励