2. 青海省人民医院肿瘤内科, 青海 西宁 810007;
3. 青海大学附属医院感染科, 青海 西宁 810007
2. Department of Oncology, Qinghai Provincial People's Hospital, Xining 810007, China;
3. Department of Infection, Affiliated Hospital of Qinghai University, Xining 810007, China
临床上,化学治疗(化疗)作为治疗肿瘤的重要手段之一,能有效遏制癌症发展,提高患者生存质量[1],但大多数化疗肿瘤患者容易出现下呼吸道感染,影响患者康复及肺功能恢复[2],严重感染可能导致患者死亡。因此,建立感染预警模型对预防化疗肿瘤患者下呼吸道感染具有重要意义。有研究[3-4]指出,化疗肿瘤患者下呼吸道感染主要受到年龄、合并基础疾病、营养状况和使用抗菌药物影响,由于其呼吸道感染发病率低于8%~13%,造成感染和非感染病例数据之间的不平衡。传统统计分析方法对不平衡数据处理效果欠佳[5],对多数类预测效果高,而对少数类预测效果较差,不适合喉癌患者术后下呼吸道感染预警模型构建。为解决数量不平衡数据分类问题,有研究者引入重采样技术重建数据平衡少数类与多数类的数据数量。少数类样本合成过抽样技术(synthetic minority over-sampling technique,SMOTE)由Chawla等[6]于2011年提出,其根据少数类属性特征随机产生相似样本,有效平衡少数类与多数类之间数量,减少数据集过度倾斜。相关研究已经通过SMOTE算法成功建立脑损伤继发精神障碍[7]、绝经后骨质疏松性骨折[8]和癫痫发作[9]等少数类预警模型。本研究调查2019年1月—2021年6月西宁市4所三级医院收治的接受化疗的肿瘤患者临床资料,构建基于SMOTE算法的感染预警模型,为预防化疗肿瘤患者下呼吸道感染提供指导。
1 对象与方法 1.1 临床资料本文选取2019年1月—2021年6月西宁市4所三级医院收治的接受化疗的肿瘤患者临床资料,数据纳入标准:①经病理学和影像诊断确诊为恶性肿瘤;②年龄≥18岁,临床资料完整;③行肿瘤化疗;④患者对本研究知情同意。排除标准:①合并呼吸系统疾病者,先天性免疫系统缺陷和未接受化疗的恶性肿瘤患者;②转入重症监护病房(ICU)的昏迷、病危或病亡者;③转院或临床资料不完整者。
1.2 下呼吸道感染诊断根据相关资料确定下呼吸道感染诊断标准[10],包括:①胸部X线检出支气管或肺部炎症改变;②静脉血检出白细胞数和(或)嗜中性粒细胞比例上升;③下呼吸道分泌物培养检出病原菌,肿瘤患者化疗开始后出现同时满足①②、①③或①②③项均可判断为下呼吸道感染。化疗期间,由其主管医生和研究者每周通过微信或电话询问患者是否出现剧烈咳嗽、多痰、发热、胸痛、打喷嚏、流鼻涕、咽痛、低热、喘、呼吸困难等症状,若出现以上症状由主管医生、医院感染专家和研究者共同确诊是否为下呼吸道感染。
1.3 研究方法 1.3.1 数据分组将所收集病例(2 384例)按照7∶3的比例随机分为建模组1 668例和验证组716例(随机种子为20190820),建模组数据用来建立模型,验证组数据对所建立的模型进行验证。将建模组根据是否发生下呼吸道感染分为感染组99例和非下呼吸道感染组1 569例(包括非感染患者和其他部位感染患者),基于SMOTE算法建立模型,具体实施步骤为:设少数类样本数=下呼吸道感染组,增加样本数n=1 569/99≈16,最近邻点数k=16,实施算法处理步骤如下[9]:第1步,计算数据集内各少数类样本的k个最近邻点,近邻选择为距离或相似系数;第2步,随机取少数类样本点i的k个最近邻点中1个样本j;第3步,计算样本i和样本j全部属性的差值Q;第4步,产生一个区间为[0, 1]的随机数R;第5步,产生少数类的合成样本:Samplenew=Samplei+R×Q;第6步,重复第1步到第5步,直到少数类样本i增加n倍并达到要求后停止;第7步,重复第1步到第6步,直到B个少数类样本全部被处理完后停止。通过对类样本点与其最近邻样本点间进行随机插值,得实际抽为非下呼吸道感染组=1 569例,感染组=1 584例,下呼吸道感染组和非下呼吸道感染组比例近1.01。
1.3.2 资料收集内容使用自制量表收集患者基线资料(姓名、性别、年龄、学历、居住地、婚姻状态),生理状况[身体质量指数(BMI)值是否正常、吸烟史、饮酒史、有无合并高血压、糖尿病、肺部疾病],恶性肿瘤病情(恶性肿瘤分期、是否远处转移、是否接受肿瘤根治术),化疗情况(化疗时间),发生下呼吸道感染情况(是否发生感染、感染病原体类型)。
1.4 模型构建应用SPSS 25.0和R 3.5.2进行模型构建,计数资料选择例数或百分比表示,组间比较选择卡方检验或Fisher’s确切概率法检验,在建模组中,将单因素分析有意义的变量(P<0.05) 纳入多因素logistic回归中分析下呼吸道感染的危险因素,选择SMOTE算法进行过抽样插值后构建下呼吸道感染预警模型,P≤0.05为差异具有统计学意义。
1.5 模型验证利用构建的风险预测评分模型对建模组和验证组患者进行评分,以患者是否发生下呼吸道感染为状态变量,以各患者的总风险评分值为检验变量,绘制受试者工作特征曲线(ROC曲线)评价模型的区分度,采用Hosmer-Lemeshow(H-L)检验评价模型的校准度,使用真正类率(TPR)、阳性预测值(PPV)、F分数(F-score)和ROC曲线下面积(AUC)验证预测模型对验证组数据预测准确性,用以评估模型的临床应用价值。
2 结果 2.1 调查对象的基本特征共收集2019年1月—2021年6月2 488例行化疗的肿瘤患者资料,依据纳入排除标准,剔除病历缺失或不完整病例,得到有效数据2 384例,其中发生下呼吸道感染者152例(6.38%),152例下呼吸道感染患者未合并其他部位感染,共检出菌株256株,革兰阴性菌176株(68.75%),包括铜绿假单胞菌96株(37.50%)、肺炎克雷伯菌40株(15.63%)、大肠埃希菌16株(6.25%)、阴沟肠杆菌12株(4.69%)、鲍曼不动杆菌12株(4.69%);革兰阳性菌80株(31.25%),包括金黄色葡萄球菌52株(20.31%)和凝固酶阴性葡萄球菌28株(10.94%)。将所收集病例按照7 ∶ 3的比例随机分为建模组1 668例和验证组716例(随机种子为20190820),将建模组根据是否发生下呼吸道感染分为下呼吸道感染组99例(5.94%)和非下呼吸道感染组1 569例(94.06%),99例感染患者检出菌株162株,革兰阴性菌108株(66.67%),包括铜绿假单胞菌61株(37.65%)、肺炎克雷伯菌22株(13.58%)、大肠埃希菌11株(6.79%)、阴沟肠杆菌7株(4.32%)、鲍曼不动杆菌7株(4.32%);革兰阳性菌54株(33.33%),包括金黄色葡萄球菌38株(23.45%)和凝固酶阴性葡萄球菌16株(9.88%)。
2.2 化疗肿瘤患者下呼吸道感染单因素分析单因素比较,两组化疗肿瘤患者不同年龄、BMI值是否正常、恶性肿瘤分期、吸烟史、合并糖尿病、合并肺部疾病、化疗时间比较,差异均有统计学意义(均P<0.05)。见表 1。
表 1 建模组化疗肿瘤患者下呼吸道感染单因素分析[例(%)] Table 1 Univariate analysis on LRT infection in chemotherapy tumor patients in modeling group (No. of cases[%]) |
![]() |
以是否有下呼吸道感染为因变量(否=0,是=1),选择单因素分析有统计学意义的变量为自变量引入多因素logistic回归分析,设置ɑ入=0.05,ɑ出=0.10,可获得年龄、BMI值是否正常、恶性肿瘤分期、吸烟史、合并糖尿病、合并肺部疾病均是化疗肿瘤患者下呼吸道感染的独立危险因素(均P<0.05),见表 2。
表 2 建模组化疗肿瘤患者下呼吸道感染logistic回归分析 Table 2 Logistic regression analysis on LRT infection in chemotherapy tumor patients in modeling group |
![]() |
选择多因素logistic回归分析结果获得化疗肿瘤患者下呼吸道感染的影响因素,利用SMOTE算法对感染组原样本进行16倍过抽样,获得感染和非感染比例近似为1(实际抽样为非感染1 569例,感染1 584例,感染/非感染=1.01),然后对过抽样后数据进行多因素logistic回归,设置ɑ入=0.05,ɑ出=0.10,见表 3。
表 3 建模组化疗肿瘤患者基于SMOTE算法的下呼吸道感染多因素分析 Table 3 Multivariate analysis on LRT infection in chemotherapy tumor patients in modeling group based on SMOTE algorithm |
![]() |
以化疗肿瘤患者是否下呼吸道感染为因变量y(y= 1为感染,y=0为非感染),年龄(x1)、BMI值是否正常(x2)、恶性肿瘤分期(x3)、吸烟史(x4)、合并糖尿病(x5)、合并肺部疾病(x6)为自变量,通过原始数据多因素logistic回归和基于SMOTE算法下重建数据多因素logistic回归分析,可获得原始数据预警模型:Logit(P)=0.055x1+0.967x2-0.195x3+ 1.383x4+0.968x5+0.939x6-14.073和基于SMOTE算法的预警模型:Logit(P)=0.090x1+ 1.092x2-0.249x3+1.724x4+1.136x5+1.344x6- 14.859。分别以2个模型的预警概率P为诊断变量,以化疗肿瘤患者是否感染为金标准,对模型预警效应进行ROC曲线分析,获得基于SMOTE算法的预警模型对原始数据的AUC为0.949(95%CI:0.937~0.961),高于原始数据预警模型的AUC 0.780(95%CI:0.734~0.846),基于SMOTE算法的预警模型H-L检验P值(P=0.594)也高于原始数据预警模型(P=0.301),见表 4。
表 4 预警模型ROC曲线的预测效应比较 Table 4 Comparison of warning efficacy of ROC curve of early warning model |
![]() |
利用构建化疗患者下呼吸道风险预测评分模型对验证组患者进行验证,获得原始数据预警模型AUC为0.757(95%CI:0.708~0.805),基于SMOTE算法的预警模型AUC为0.908(95%CI:0.855~0.961),基于SMOTE算法的预警模型对验证组患者预测TPR值低于原始数据预警模型,而PPV、F-score均高于原始数据预警模型,见表 5、图 1~2。
表 5 预警模型对验证组患者预测概率验证 Table 5 Validation of warning probability of patients in va-lidation group by early warning mode |
![]() |
![]() |
图 1 原始数据预警模型预警概率的ROC曲线 Figure 1 ROC curve of warning probability of original data early warning model |
![]() |
图 2 基于SMOTE算法预警模型预警概率的ROC曲线 Figure 2 ROC curve of early warning probability of early warning model based on SMOTE algorithm |
本研究调查结果显示,2 384例化疗肿瘤患者发生下呼吸道感染率为6.38%,低于毛振宇等[11]研究中喉癌患者术后化疗期下呼吸道感染率8.75%,表明该院对化疗肿瘤患者下呼吸道感染预防重视程度较高,使超过50%的患者接受相应的抗菌药物治疗,有效降低下呼吸道感染率。152例下呼吸道感染化疗肿瘤患者检出菌株256株,主要为革兰阴性菌156株,占68.75%,与其他研究[12]结果相符。整体检出菌类型集中于铜绿假单胞菌(37.50%)和金黄色葡萄球菌(20.31%),其能破坏化疗肿瘤患者机体,阻碍其代谢功能,从而降低其免疫功能,成为化疗肿瘤患者下呼吸道的主要感染菌种。
本研究结果表明,年龄、BMI值是否正常、恶性肿瘤分期、吸烟史、合并肺部疾病、合并糖尿病均是化疗肿瘤患者下呼吸道感染的影响因素,与其他研究[13-15]结论相符,表现为高龄、BMI值异常、有吸烟史、合并肺部疾病及糖尿病患者下呼吸道感染风险更高,这是因为:①化疗肿瘤患者年龄越大,其自身免疫功能下降程度和生理健康恶化程度越高,导致其身体抵御病原体侵袭的能力下降,从而增加了其感染风险;②若肿瘤患者BMI值过低,其身体营养状况不良程度越明显,从而自身免疫功能抗感染效率越被限制,研究[16-17]显示,过低BMI值甚至可降低恶性肿瘤患者生命质量,增加其病死率,而肿瘤患者BMI值过高,其存在肥胖及代谢功能疾病,合并糖尿病、冠心病及神经系统疾病概率较高,可造成免疫功能受到限制,增加下呼吸道感染率。③患者恶性肿瘤分期越高,其身体受到肿瘤侵袭程度及损伤越重,导致其身体免疫功能越差,造成其下呼吸道感染风险越高。④长期吸烟能损伤支气管黏膜,导致呼吸道纤毛变短、断裂和运动功能下降,降低支气管清除感染病原体的能力,且吸烟也能增加呼吸道内诱导痰内炎性因子表达,恶化感染程度。⑤肺部疾病如慢性肺炎、支气管炎、慢性阻塞性肺疾病等可致呼吸系统组织及器官长期受到炎性环境的刺激,导致支气管黏膜腺体增生,刺激其分泌大量黏液,堵塞细支气管形成易感染菌定植环境,增加下呼吸道感染率。⑥糖尿病患者本身就属于医院感染高危人群,其身体在强刺激源如伤害或恶性肿瘤作用下因激素调节和细胞因子分泌异常出现应激性高血糖,高糖环境能增高机体内反应性氧化物(ROS)表达,ROS可诱导各种促炎因子表达上升,产生炎性级联反应诱发和恶化感染,因此合并糖尿病能进一步增加化疗肿瘤患者下呼吸道感染风险。因此,对有吸烟史、伴有慢性阻塞性肺疾病、慢性气管炎、慢性支气管炎和慢性肺炎等肺部疾病或炎症的肿瘤患者,监督其遵医嘱按时服药治疗肺部病症,术前指导其进行相应的呼吸功能训练,指导家属正确给患者翻身和叩背,鼓励患者进行深呼吸训练提升肺活量;整个化疗期为伴有高血压及糖尿病患者制定降血压及血糖控制的干预方案;指导家属为其准备富含蛋白质、维生素及低糖、低脂肪、低盐的食谱,给其补充足够营养,加快其损伤身体恢复;观察患者心理状态,视情况进行心理干预,降低其焦虑及抑郁心理。
本研究中化疗肿瘤患者发生下呼吸道感染者占6.38%,非下呼吸道感染者占93.62%,可获得感染和非下呼吸道感染患者数据数量存在明显不平衡。传统统计学预警模型对多数类如非感染人数预测效果高,而对少数类如感染人数预测效果较差[18],是因为当统计数据高度不平衡时,筛查特异度能显著影响模型预测精度,导致其对阳性个体预测结果误差较高,因此,需要解决本研究中感染与非下呼吸道感染患者数量不平衡数据分类问题,本文引入过抽样方法即SMOTE算法对原始数据进行重采样技术重建,获得感染和非感染比例近似为1新样本数据,结合多因素logistic回归分析结果,得到基于SMOTE算法的预警模型。以预警概率P为诊断变量和化疗肿瘤患者是否感染为金标准,对模型预警效应进行ROC曲线分析,结果显示SMOTE算法预警模型对原始数据预警效率AUC为0.949(95%CI:0.937~0.961),高于原始数据预警模型AUC面积0.780(95%CI:0.734~0.846),利用构建化疗患者下呼吸道风险预测评分模型对验证组患者进行验证,获得原始数据预警模型AUC为0.757(95%CI:0.708~0.805),基于SMOTE算法的预警模型AUC为0.908(95%CI:0.855~0.961),基于SMOTE算法的预警模型对验证组患者预测TPR值低于原始数据预警模型,而PPV、F-score均高于原始数据预警模型,说明使用SMOTE算法对本研究下呼吸道感染与非下呼吸道感染患者不平衡数据进行重建,使用重建数据拟合logistic预测模型,获得新预警模型预测准确率相对更高。
由本研究结果可知,化疗肿瘤患者发生下呼吸道感染受年龄、BMI值是否正常、恶性肿瘤分期、吸烟史、是否合并肺部疾病、糖尿病的影响,结合上述影响因素基于SMOTE算法对数据进行重采样技术重建,获得的预警模型比传统logistic回归建立的模型预测效应更优。由于本研究因时间和环境所限,本研究仅收集了4所医院化疗肿瘤患者为研究对象,导致所选样本量选择较少,且未对其他不同感染部位患者的混杂因素进行比较分析,导致研究结果不完善,需要进一步扩大研究对象范围及纳入更多可能的影响因素,从而使研究结论更完善。
[1] |
滕兆霞, 王志英, 蔡珂. 消化系统肿瘤患者化疗后感染病原学分布及其影响因素分析[J]. 临床内科杂志, 2020, 37(2): 112-114. DOI:10.3969/j.issn.1001-9057.2020.02.012 |
[2] |
程鹏, 郭苹, 朱俊琳. 放化疗食管癌患者肺部感染的影响因素分析[J]. 中华医院感染学杂志, 2019, 29(16): 2436-2439. |
[3] |
薛静, 阳甜, 陈明伟. 肺癌化疗患者下呼吸道感染病原菌分布及影响因素分析[J]. 现代肿瘤医学, 2017, 25(13): 2058-2061. DOI:10.3969/j.issn.1672-4992.2017.13.012 |
[4] |
李妍, 史爱华. 急性白血病化疗后下呼吸道感染病原菌分布及耐药性分析[J]. 临床和实验医学杂志, 2018, 17(5): 548-550. DOI:10.3969/j.issn.1671-4695.2018.05.030 |
[5] |
Blagus R, Lusa L. SMOTE for high-dimensional class-imba-lanced data[J]. BMC Bioinformatics, 2013, 14: 106. DOI:10.1186/1471-2105-14-106 |
[6] |
Chawla NV, Bowyer KW, Hall LO, et al. SMOTE: synthetic minority over-sampling technique[J]. J Artif Intell Res, 2002, 16: 321-357. DOI:10.1613/jair.953 |
[7] |
孙秀彬, 辛涛, 薛付忠, 等. 基于SMOTE算法的颅脑损伤患者继发精神障碍预警模型[J]. 中国卫生统计, 2013, 30(6): 790-793. |
[8] |
章轶立, 魏戌, 聂佩芸, 等. 基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构[J]. 中国骨质疏松杂志, 2019, 25(1): 1-5. DOI:10.3969/j.issn.1006-7108.2019.01.001 |
[9] |
吴庆忠, 车峰远, 薛付忠. 基于非平衡数据的癫痫发作预警模型研究[J]. 山东大学学报(医学版), 2012, 50(2): 141-144, 148. |
[10] |
胡必杰. 下呼吸道感染实验诊断规范[M]. 上海: 上海科学技术出版社, 2006: 45-46.
|
[11] |
毛振宇, 江涛. 喉癌术后并发下呼吸道感染的调查分析[J]. 中华全科医学, 2015, 13(8): 1382-1384. |
[12] |
杨桂强, 刘文超, 刘滋润. 肺癌患者化疗后肺部感染病原菌及耐药分析[J]. 中国卫生检验杂志, 2017, 27(9): 1341-1343. |
[13] |
孙瑶, 李乃坤, 武金凤, 等. 复发或转移性食管癌患者放化疗后再应用紫杉类药物化疗引起肺炎的风险分析研究[J]. 医学与哲学(B), 2017, 38(6): 50-54. |
[14] |
王海. 探讨化疗后肺癌患者合并下呼吸道感染的临床特点及影响因素[J]. 航空航天医学杂志, 2017, 28(7): 820-821. DOI:10.3969/j.issn.2095-1434.2017.07.023 |
[15] |
魏娟娟. 老年肺癌放化疗前后肺部感染的病原菌培养及药敏分析[J]. 实用癌症杂志, 2017, 32(3): 466-468. DOI:10.3969/j.issn.1001-5930.2017.03.035 |
[16] |
刘联斌, 黄刚, 郭守俊, 等. 晚期肺癌患者化疗后肺部感染的病原菌分布和对免疫功能的影响研究[J]. 中华医院感染学杂志, 2017, 27(22): 5105-5108. |
[17] |
陈卓, 贺亚宁, 陈琦, 等. 体重指数对乳腺癌新辅助化疗病理完全缓解及预后的影响[J]. 国际外科学杂志, 2019, 46(1): 20-25. |
[18] |
Gong HL, Zhou L, Wu HT, et al. Long-term clinical outcomes of supracricoid partial laryngectomy with cricohyoidoepiglottopexy for glottic carcinoma[J]. Acta Otolaryngol, 2019, 139(9): 803-809. DOI:10.1080/00016489.2019.1616820 |