恶性甲状腺肿瘤的预测判别

时间:2020-7-31来源:疾病知识 作者:佚名 点击:

近年来,我国甲状腺肿瘤的发病率在全球排名不断升高。本文借助国家人口与健康科学数据共享服务平台,对恶性甲状腺肿瘤的预测问题进行实证研究。首先选取对目标变量有影响的10个指标,并对变量进行了处理,然后采用logistic回归模型进行预测判别,根据预测结果进行了参数调优。

一、Logistic回归

对L(w)求极大值,得到w估计值。从模型的优化角度来讲,损失函数改变,基于损失函数最优化求解的参数的取值必然改变,因此我们以正则化来防止过拟合。对于参数penalty,通过输入”l1”和”l2”来指明使用的正则化标准。其中,若选择“l1”正则化,则参数solver仅能够使用“liblinear”;若使用“l2”正则化标准,参数ssolver中所有的求解方式都可以使用。参数c默认情况下是1.0,当参数c越小,正则化的效力越强。二、实证分析(一)数据来源及处理本文数据来自于国家人口与健康科学数据共享服务平台发布的多个甲状腺肿瘤患者的临床诊断记录。该数据集涵盖了病例的17个特征,共有个观测值。鉴于数据质量较好,只有部分回声水平与纵横比数据存在缺失值,因此选择删除有缺失值的数据剔除缺失值之后的样本总数为。原始数据示例如表1:其中指标解释如下:(1)良恶性:甲状腺肿瘤分为良性和恶性两种。本文研究的主要内容就是判别不同患病个体甲状腺肿瘤的状况,因此将良恶性作为因变量。(2)结构:根据甲状腺肿瘤是否为实性将其结构分为五类。其中,实性的包含各种内在细胞和间质,囊性的外有一层薄膜跟正常的甲状腺组织隔离,一般表现为蜂窝状的图像。甲状腺肿瘤的结构对恶性甲状腺肿瘤的判别有一定影响,因此将其作为自变量。(3)大小:甲状腺肿瘤的大小指的是肿瘤直径,根据检测结果分为五类:0.5cm,0.5-1cm,1-1.5cm,1.5-2cm,2-3cm,>3cm。肿瘤大小对于恶性甲状腺肿瘤的判别有直接影响,因此也作为自变量。(4)回声水平:甲状腺肿瘤做超声检测,癌组织一般回声不均匀,而良性的一般都均匀。据此将回声水平分为高回声、低回声。癌组织回声是良恶性判别标准之一,因此将回声水平作为自变量。(5)纵横比:纵横比是短径与长径的比例,短径超过长径则表示纵横比失调,根据检测结果分为:<1,≤1,≥1。(6)形态:形态是否规则也可作为判断甲状腺肿瘤的良恶性的依据,因此将其选作自变量。(7)边界:根据检测结果判断边界是否清晰,边界清晰与否影响甲状腺中肿瘤良恶性的判别。(8)边缘化:根据甲状腺肿瘤边缘状态将其分为:边缘小分叶及毛刺,边缘小分叶,毛刺,无特殊。边缘成分叶,通常恶性几率较大,因此将其作为自变量。(9)钙化形态:钙化是肿瘤内部结构改变,常存在于恶性结节中,因此钙化水平是判断恶性甲状腺肿瘤的重要依据。(10)血液:根据甲状腺肿瘤血液的有无分为两类。如果没有血液流通,甲状腺肿瘤是恶性的几率相对较小,但有所影响,因此将其作为自变量之一。(11)与被膜关系:与被膜关系,即甲状腺肿瘤与被膜的位置关系,分为四类:紧邻被膜、远离被膜、被膜连续性中断、突出被膜外。与被膜关系也是判断甲状腺肿瘤良恶性的重要依据。(12)风险分层:根据良恶性风险几率分为高危、低危。根据上述甲状腺肿瘤的指标解释以及对良恶性判别的影响,选出十个指标——结构、大小、回声水平、纵横比、形态、边界、边缘、钙化形态、血流、与被膜关系、风险分层作为自变量,甲状腺肿瘤的良恶性为因变量。对选出来变量进行处理,表2中展示变量的含义及处理过程:(二)模型构建及参数优化对上文预处理后的训练集数据进行标准化处理。在Logistic模型中,使用fit函数训练模型的参数,可以得到Logistic模型的预测结果:图1中,横坐标表示测试集中案例的编号,可基于编号找到对应的记录信息,纵坐标为预测值与测试集实际值的差。当该差值不为0时说明模型预测错误,当差值为0时,预测结果与实际结果一致,说明预测正确。从图1可以看出在突出5个点的预测值与测试集实际值存在偏差,其他预测均正确。在已建立的Logistic模型的基础上,选取模型关键参数进行调参。选取参数penalty,用来调节模型的惩罚项;选取dual用来选择目标函数是原始形式还是对偶形式;用tol优化停止算法的条件;用c来控制正则化的强弱;用max_inter优化算法的迭代次数。经过一系列的参数调整之后,共建立了5个不同参数下的Logistic模型,发现模型的精度提升不大。特别是penatly、dual调整后会降低模型的精度,所以仍然采用默认设置下的参数建立Logistic模型来进行预测。直观来看Logistic模型正确率较高,只有极少数预测错误。使用Logistic自带的评分函数对测试集的预测结果进行评价,可以得到调参后的结果表3:预览时标签不可点

转载注明  http://www.qblsw.com/jbzs/10689.html

首页| 网站简介| 发布优势| 广告合作| 隐私保护| 服务条款| 合作伙伴| 网站地图| 版权申明

版权所有 桥本氏病 
Copyright 2012-2020 All Rights Reserved.