山东大学公共卫生学院生物统计学系
- 作品数:79 被引量:427H指数:11
- 相关作者:蒋正徐静更多>>
- 相关机构:济宁医学院附属医院泰山医学院公共卫生学院劳动卫生与环境卫生学教研室泰山医学院公共卫生学院更多>>
- 发文基金:国家自然科学基金山东省自然科学基金国际科技合作与交流专项项目更多>>
- 相关领域:医药卫生生物学社会学经济管理更多>>
- 基于遗传算法的随机森林模型在特征基因筛选中的应用被引量:6
- 2016年
- 目的探索基于遗传算法的随机森林模型在特征基因筛选中的效果和特点。方法通过本文构建的基于遗传算法的随机森林模型(GARF)对真实基因数据和模拟数据进行特征基因筛选,以筛选后基因进行判别分析,计算ROC曲线下面积AUC值,同时观察GARF方法对模拟实验中预设的差异基因排序结果。结果对真实基因数据和模拟数据的分析结果均显示,采用GARF方法筛选得到的特征基因建立判别模型能获得更好的分类效果,在模拟实验中与随机森林相比能将预设的差异基因排在更靠前的位置。结论 GARF方法能够有效地用于基因芯片数据特征基因筛选,在FDR控制上具备潜力,具有研究价值。
- 赵发林张涛李康
- 关键词:遗传算法
- SARIMA模型在流行性腮腺炎发病预测中的应用被引量:6
- 2016年
- 目的利用SARIMA模型预测未来山东省济宁市流行性腮腺炎发病情况,为流行性腮腺炎防控提供决策依据。方法收集山东省济宁市2009年1月至2013年7月流行性腮腺炎月发病数据资料,利用时间序列分析方法,构建SARIMA模型,并对2013年8月至12月的发病数资料进行预测。结果济宁市2009至2013年共报告流行性腮腺炎病例数8 520例,且发病具有明显的周期性和季节性特征。最终建立的最优模型为SARIMA(0,1,1)(0,1,1)_(12),赤池信息准则(AIC)为74.45,且通过了统计学检验,模型残差为白噪声。实际月发病数与拟合月发病数进行相关性分析结果显示为显著性相关(r=0.75,P<0.000 1)。对2013年8月至12月发病数进行预测,均在95%置信区间内,且与实际发病数变动的趋势一致,验证了模型合理性。结论 SARIMA模型能较好地拟合济宁市流行性腮腺炎月发病数动态变化,可用于流行性腮腺炎的短期预测。
- 李润滋章涛梁玉民罗成蒋正薛付忠刘言训刘静李秀君
- 关键词:时间序列分析流行性腮腺炎
- 基于健康管理队列的高血压风险预测模型被引量:4
- 2017年
- 目的基于健康管理队列,构建高血压风险预测模型。方法依托山东多中心健康管理纵向观察队列,排除基线高血压、心脑血管疾病、血肌酐>177μmol/L、年龄<20岁者,构建高血压研究队列(共22 177人,其中男12 044人,女10 133人),分性别采用Cox回归建立高血压预测模型,并评价模型预测效果。结果观察期间新发高血压4 571例,发病密度为62.84/1 000人年。最终男性模型中的变量包括年龄、体质量指数、收缩压、舒张压、空腹血糖和红细胞压积,ROC曲线下面积(AUC)为0.821(95%CI:0.812~0.830);女性模型中的变量包括年龄、体质量指数、收缩压、红细胞计数和高密度脂蛋白,AUC为0.818(95%CI:0.806~0.828)。十折交叉验证结果显示,男女AUC分别为0.819(95%CI:0.810~0.828)、0.814(95%CI:0.803~0.825)。结论该模型具有较好的预测能力,可用来识别高血压高危个体。
- 于涛刘焕乐冯新徐付印陈亚飞薛付忠张成琪
- 关键词:高血压
- 基于健康管理队列的冠心病风险预测模型被引量:7
- 2017年
- 目的构建基于山东省健康管理队列的冠心病风险预测模型。方法构建山东省健康管理队列,基于国际上较为通用的冠心病风险预测模型变量,应用Cox比例风险回归模型进行单因素分析,利用竞争风险模型建立心脑血管事件预测模型,使用十折交叉验证法检验模型稳定性。结果共纳入队列73 386人,其中男41 968人,女31 418人。队列中位随访时间3.10年。经随访共有1 545人发生冠心病,其中男958人,发病密度为5.95/1 000人年;女587人,发病密度为4.90/1 000人年。建立的男性模型AUC为0.809(95CI:0.804~0.815),O/E值为0.98;女性模型AUC为0.869(95%CI:0.863~0.874),O/E值为1.02。经十折交叉内部验证,男性模型AUC为0.806(95%CI:0.801~0.812),女性为0.866(95%CI:0.860~0.872)。结论构建的冠心病预测模型在健康管理队列中有较好的预测能力。
- 王春霞许艺博杨宁夏冰王萍薛付忠
- 关键词:冠心病
- 健康管理人群高脂血症风险预测模型被引量:10
- 2017年
- 目的建立20岁以上健康管理人群高脂血症风险预测模型并对其预测效果进行评价。方法依托山东多中心健康管理纵向观察队列共纳入30 056人,采用Cox比例风险回归建立高脂血症预测模型,利用ROC曲线下面积(AUC)进行模型评价,十折交叉验证法检验模型的预测效果和判别能力。结果随访期间共新发高脂血症5 063例,发病密度为47.78‰。预测模型纳入的变量为年龄、性别、吸烟、饮酒、总胆固醇、甘油三酯、总胆红素、高密度脂蛋白、糖尿病和高血压10个变量。预测模型的ROC曲线下面积AUC为0.741(95%CI:0.731~0.752),经十折交叉验证平均AUC为0.741。结论构建的高脂血症风险预测模型在健康管理人群中具有较好预测能力。
- 张光王广银吴红彦张红玉王停停李吉庆李敏康凤玲刘言训薛付忠
- 关键词:高脂血症队列
- 健康管理人群缺血性异常心电图的影响因素被引量:8
- 2017年
- 目的阐明健康管理人群的缺血性异常心电图的影响因素及非缺血性异常心电图对重要的缺血性异常心电图的预测价值。方法选择山东多中心健康管理纵向观察队列中至少参加2次体检的个体,排除冠心病及缺血性异常心电图患者,构建随访队列。对随访中发生缺血性异常心电图者与未发生缺血性异常心电图者,比较其基线信息,并筛选影响缺血性异常心电图的危险因素,进一步构建缺血性异常心电图的Cox回归分析模型。结果队列中共纳入45 546例,随访时间1~7年,平均3.24年,随访中共有7 656例出现缺血性异常心电图,发病密度为77.57/1 000人年。缺血性异常心电图发生的主要影响因素是年龄偏高、女性、高收缩压和舒张压、高空腹血糖、白细胞计数高以及非缺血性异常心电图R波高电压。结论本研究探讨导致缺血性异常心电图的危险因素,为制定切实可行的健康干预措施提供了科学依据。
- 李江冰宋心红林海燕张冬芝李向一许艺博王丽薛付忠
- 关键词:影响因素队列研究
- 健康管理人群2型糖尿病发病风险预测模型被引量:25
- 2017年
- 目的构建健康管理人群2型糖尿病3年发病风险预测模型。方法依托山东多中心健康管理纵向观察大数据库,选择20~75岁的基线未患2型糖尿病者构建队列。采用Cox比例风险回归构建2型糖尿病预测模型,以受试者工作特征曲线下面积(AUC)评价模型的预测效能,以十折交叉验证法检验模型的稳定性。结果随访期间共新发糖尿病1 624例,男性和女性的发病密度分别为15.00‰、10.83‰。男性预测模型最终纳入的变量包括年龄、体质量指数、空腹血糖、甘油三酯、谷丙转氨酶、白细胞计数。纳入女性预测模型的变量包括年龄、空腹血糖、甘油三酯、高密度脂蛋白、谷丙转氨酶。男性和女性预测模型的AUC分别为0.795(95%CI:0.764~0.827)和0.707(95%CI:0.654~0.759)。结论分性别建立的2型糖尿病发病风险预测模型在健康管理人群中均具有较好预测能力。
- 苏萍杨亚超杨洋季加东阿力木.达依木李敏薛付忠刘言训
- 关键词:2型糖尿病队列
- 健康管理人群代谢综合征发病风险预测模型被引量:12
- 2017年
- 目的基于健康管理人群队列,构建代谢综合征的5年发病风险预测模型。方法依托山东多中心健康管理纵向观察队列,选取20~80岁且基线未患代谢综合征者构建队列,采用Cox比例风险回归构建预测模型,并利用十折交叉验证法检验模型的稳定性,通过受试者工作特征曲线(ROC)下面积(AUC)和观测/期望(OE比)评价模型的预测效果。结果随访期间共发生代谢综合征1 591例(男1 273例,女318例),发病密度为38.57/1 000人年。男性代谢综合征预测模型纳入的变量包括年龄、BMI、空腹血糖、甘油三酯、高密度脂蛋白、血尿酸、总胆固醇和是否高血压,女性模型纳入变量包括年龄、BMI、空腹血糖、甘油三酯、血尿酸和是否高血压;模型ROC曲线下面积分别为0.751(95%CI:0.742~0.759)和0.745(95%CI:0.734~0.756);OE比分别为1.03和1.00;十折交叉验证ROC曲线下面积平均值分别为0.749和0.746。结论本研究利用健康管理纵向队列数据,建立了代谢综合征5年发病风险预测模型,经十折交叉验证结果表明,其在健康管理人群中有较好的预测效果,有助于识别高发病风险人群,进而减少和预防代谢综合征的发生。
- 孙苑潆杨亚超曲明苓陈雁敏李敏王淑康薛付忠刘云霞
- 关键词:代谢综合征
- 2018年肥城市户籍居民主要恶性肿瘤死亡及减寿分析
- 目的 分析2018 年肥城市户籍居民主要恶性肿瘤的死亡水平、分布特征及对人群寿命的影响,为恶性肿瘤防控提供数据支持和科学依据方法 2018 年肥城市户籍居民全死因登记资料和人口资料由肥城市人民医院肿瘤防治中心提供,其录入...
- 杨佳李琰琰张楠顾建华卢培培高冬青刘金辉李霞王家林
- 关键词:恶性肿瘤死亡率去死因期望寿命潜在减寿年数
- 健康管理人群脑卒中风险预测模型被引量:9
- 2017年
- 目的构建20岁以上健康管理人群脑卒中发病风险预测模型。方法依托山东多中心健康管理纵向观察大数据库,构建20岁以上人群的脑卒中发生队列。采用Fine-Gray竞争风险模型分性别分别构建脑卒中风险预测模型。结果观察期间共新发生脑卒中患者1 299例,其中男829例,女470例,发病密度为4.51‰。男性预测模型纳入变量为年龄、高血压、冠心病史、糖尿病、吸烟、体质量指数、甘油三酯、白细胞计数、血小板计数、高密度脂蛋白、总胆固醇;女性预测模型纳入变量为年龄、高血压、冠心病史、红细胞计数、血红蛋白、体质量指数。男性与女性预测模型的受试者工作特征曲线下面积(AUC)分别为0.846(95%CI:0.828~0.864)、0.878(95%CI:0.858~0.898)。结论成功构建的脑卒中风险预测模型在健康管理人群中具有很好的预测能力。
- 李敏王春霞夏冰朱茜孙苑潆王淑康薛付忠贾红英
- 关键词:脑卒中