导读:本文包含了生存预测模型论文开题报告文献综述及选题提纲参考文献,主要关键词:晚期,口腔鳞癌,预后,独立危险因素
生存预测模型论文文献综述
丁红忠,许从平,周永敏[1](2019)在《晚期口腔鳞癌患者独立预后因素及生存预测模型的建立》一文中研究指出目的:探讨晚期口腔鳞癌患者的独立预后因素并构建生存预测模型。方法 :收集117例晚期口腔鳞癌患者的一般资料及既往病史,所有患者均行口腔鳞癌切除术并联合放疗,根据患者情况进行羟基喜树碱及平阳霉素化疗。所有患者随访时间为手术结束至术后5年,记录患者生存情况,分析晚期口腔鳞癌患者预后的独立危险因素。采用SPSS 20.0软件包对数据进行统计学分析。结果:随访期间,2例因其他原因死亡,4例因失访而剔除。剩余111例患者中,42例死亡,69例存活,生存率为62.16%;年龄、T分期及M分期不同的晚期口腔鳞癌患者生存情况无显着差异(P>0.05);性别、组织分化程度、N分期及化疗情况不同的晚期口腔鳞癌患者生存情况差异显着(P<0.05);性别、N分期及是否联合羟基喜树碱与平阳霉素化疗是晚期口腔鳞癌患者生存情况的独立危险因素(P<0.05);组织分化程度不是晚期口腔鳞癌患者生存情况的独立危险因素(P>0.05);性别、N分期及是否联合羟基喜树碱与平阳霉素化疗的生存曲线对晚期口腔鳞癌患者生存情况具有一定预测作用。结论:性别、N分期及是否联合羟基喜树碱与平阳霉素化疗是晚期口腔鳞癌患者生存情况的独立危险因素;性别、N分期及是否联合羟基喜树碱与平阳霉素化疗的生存曲线,可作为晚期口腔鳞癌患者的生存预测模型。(本文来源于《上海口腔医学》期刊2019年05期)
齐惠颖,江雨荷[2](2019)在《基于多组学数据融合构建乳腺癌生存预测模型》一文中研究指出【目的】更好地预测乳腺癌生存期,探索融合多种组学数据利用机器学习方法构建乳腺癌生存预测模型。【方法】通过对TCGA数据库中乳腺癌的基因表达、拷贝数变异、DNA甲基化和蛋白质表达4种组学数据的融合,使用随机森林算法建立预测模型。【结果】在测试数据集上该模型对乳腺癌分类预测的精确率为97.22%,召回率为98.13%。通过AUC值对比不同类型组合组学数据的预测性能,融合多组学数据的AUC值为0.8393,性能最好。【局限】由于样本数量的限制,模型普适性还有待进一步验证。【结论】融合多种组学数据构建乳腺癌预测模型是一种有效提高预测性能的方法。(本文来源于《数据分析与知识发现》期刊2019年08期)
潘辉,张亚雷,肖大凯,郭志华,张晋昕[3](2019)在《基于SEER数据库构建小细胞肺癌术后患者生存预测模型》一文中研究指出目的:证实手术治疗对于小细胞肺癌患者长期生存的作用。鉴定小细胞肺癌术后患者生存影响因素,构建小细胞肺癌术后患者的生存预测模型。与现有的AJCC分期系统、VALSG分期系统和IASLC的分期系统预测性能进行比较。方法:选取2004年至2012年SEER数据库中确诊为小细胞肺癌的患者(small cell lung cancer, SCLC),提取相应的变量数据。采用Kaplan-Meier比较不同分期下手术组与非手术组患者的生存状况,并绘制生存曲线。针对手术治疗的SCLC患者,利用赤池信息准则(AIC)筛选变量,基于Cox回归模型构建Nomogram预测模型。比较新模型与AJCC分期系统、VALSG分期系统和IASLC分期系统的一致性指数(C-index),评价模型的预测效能。结果:通过数据检索,共有45 226例SCLC患者入选本研究,其中867例为手术治疗患者。多因素分析发现,影响手术患者预后的因素包括年龄、性别、手术方式、放疗顺序、肿瘤大小、肿瘤侵犯范围、T分期、N分期、淋巴结清扫数量、病理分化程度和远端转移情况。经过赤池信息准则(AIC)筛选,年龄、性别、肿瘤大小、肿瘤侵犯范围、淋巴结侵犯情况、远端转移情况、手术方式、放疗情况、淋巴结清扫数量、病理分化程度共10个变量入选模型。比较4个模型的一致性指数,Nomogram为0.706,AJCC模型为0.700,IASLC模型为0.667,VALSG模型为0.665。Nomogram模型显示最佳的预测准确度。结论:患者是否接受手术影响小细胞肺癌患者的生存时间。肿瘤的大小和肿瘤侵犯的范围是独立的预后因素。Nomogram生存预测模型的预测性能明显优于其它分期系统。(本文来源于《肿瘤预防与治疗》期刊2019年06期)
杜坤朋[4](2019)在《基于临床数据的食管癌动态生存预测模型的构建与应用》一文中研究指出背景:预测模型是临床实践中不可或缺的一部分,有助于确定个体患者的最佳治疗策略。目前可用的食管癌预测模型的一个缺陷是仅可用于在确诊时或治疗结束后等的单一研究起点的预测,忽略了在随访阶段中的不同预测时间点仍有进行5年生存率的预测需要。此外,目前可用的预测模型通常是假设预测变量对患者总体生存率的影响是不会随时间而改变的,即具有“时间固定效应”。实际上,有些协变量的相对风险比可能会在随访期间发生变化,继而对患者的5年生存率产生动态的影响,这种效应称为“时变效应”。本文旨在探究食管癌患者中存在的具有时变效应的变量,并尝试构建一个动态预测模型,该模型可以计算随访期间不同预测时间点的5年动态生存概率。方法:利用SEER数据库中的经组织学确诊为食管癌的9132例患者的临床病理学信息及生存资料进行预测模型的构建。纳入的协变量包括:年龄、婚姻状况、性别、种族、肿瘤原发部位、组织学类型、病理分级、T分期、N分期、M分期、是否手术、是否化疗、是否放疗。使用Kaplan-Meier生存分析法找出食管癌患者的预后因素。使用PBLS模型(一种扩展COX模型)评估了协变量的时变效应并构建了一个动态食管癌生存预测模型。利用一个由99例食管癌患者构成的独立中国患者队列对预测模型进行外部验证。包括对区分度(Discrimination)和一致性(Calibration)的验证,评价模型的指标包括C-index,AUC 以及The heuristic shrinkage factor。结果:Kaplan-Meier生存分析中,发病年龄、婚姻状态、种族、肿瘤发病部位、组织学类型、分化程度、放疗、手术、T分期、N分期、M分期的不同分组之间的生存率均有统计学意义(P<0.01),性别、化疗的不同分组之间的生存率无统计学差异(P分别=0.803、0.058)。在食管癌患者各种预测变量中,年龄、原发肿瘤部位、组织学类型、化疗、手术和T分期对总生存率展示出显着的时变效应。相反地,婚姻状况,种族,性别,分化程度,N分期和M分期表现出时间固定效应。动态预测模型的外部验证结果:C-index= 0.746;AUC= 0.736,表明本预测模型具有较好的区分度。The heuristic shrinkage factor=0.996,表明模型具有较好的一致性。结论:对于食管癌患者,年龄、原发肿瘤部位、组织学类型、化疗、手术和T分期的相对风险比是会随时间改变而发生变化的,展示出显着的时变效应。时变效应的存在表明了在随访期间更新5年生存概率的重要性。本研究首次使用动态预测分析中的PBLS模型对食管癌患者的不同时间点的5年生存率进行预测。这种新型的动态预测模型,可以随着时间的推移更新患者5年生存概率,可用于根据对患者预后的动态评估协助医生做出更好的个体化治疗决策,也可以用于增强患者信心、提高治疗依从性。(本文来源于《南方医科大学》期刊2019-05-21)
[5](2019)在《中国学者建立预测胃癌患者生存及化疗有效性的模型》一文中研究指出目前,胃癌的主要治疗方法仍是手术和化疗,特别是进展期的胃癌患者术后需要化疗,有约30%的患者能够从化疗中获益。但是,如何准确的预测患者的预后及筛选出化疗获益者仍是临床面临的难题。世界上通用的TNM分期方法,不能准确预测患者预后,更无法区分哪一类患者能通过化疗获益。因此,建立更准确的肿瘤分期方法并对化疗有效性进行预测,成为了当今胃癌临床研究的重点。近期,由南方医科大学与中山大学等单位合作进行了多(本文来源于《中国肿瘤临床与康复》期刊2019年05期)
桑浩凯,郭树理,曲红,赵敏,曲大成[6](2019)在《利用组学数据建立针对四种女性癌症的基于机器学习方法的生存预测模型》一文中研究指出乳腺癌、宫颈鳞状细胞癌、子宫内膜癌、卵巢癌是女性常见的癌症.由于癌症的恶性发展并缺乏有效的早期诊疗手段,这些癌症已成为当今世界女性患者的头号杀手.为了探索高通量组学数据能否促进癌症患者的预后,本研究利用美国癌症基因组图谱项目中四种女性癌症的1861个样本的临床数据和多维组学数据(包括DNA甲基化、mRNA表达、miRNA表达和基于芯片的蛋白表达组学数据),建立了Cox比例风险模型和随机生存森林模型用来回顾性地预测患者的生存率.本研究发现,在宫颈鳞状细胞癌中,通过整合临床与DNA甲基化及miRNA表达组学数据建立的模型,生存预测能力显着高于仅使用临床数据的模型(一致性指数c-index中位数提高了8.73%~15.03%).本研究虽然验证了有些组学数据对特定癌症生存模型的预测能力有提升作用,但也存在着相对于临床数据,组学数据对模型的预测能力无显着提升的情况.这些结果为系统地开展基于癌症基因组学的生存预测研究及提升临床生存分析的预测准确性提供了有用经验.(本文来源于《中国科学:生命科学》期刊2019年06期)
蒋雪超[7](2019)在《射波刀治疗脑转移瘤预后因素评估及肺癌脑转移生存预测模型的建立与验证》一文中研究指出目的脑转移是恶性肿瘤患者常见的转移方式和死亡原因,最常见的原发疾病是肺癌,约10%至30%的肺癌患者会发生脑转移。患者发生脑转移后往往预后很差。但是近年来随着分子靶向治疗和免疫治疗等全身治疗方式的进步,肺癌的生存得到改善,患者发生脑转移的机会因此增加,这一趋势以及核磁共振成像的广泛应用,导致肺癌脑转移患者的数量增加。立体定向放射治疗(stereotactic radiosurgery,SRS)被广泛用于脑转移瘤的治疗,部分脑转移瘤患者能够获得较长的生存时间。为了预测脑转移患者的生存,基于美国肿瘤放射治疗协作组织(Radiation Therapy Oncology Group,RTOG)进行的叁项临床试验中的1200名患者的数据用于建立了递归分区分析(Recursive Partitioning Analysis,RPA),包括四个预测指标:患者年龄、功能状态评分(Karnofsky Performance Status,KPS)、原发病灶是否控制及有无颅外转移。根据评分将患者分成预后不同的叁组,中位生存时间2.3-7.1个月。另外一个基于五个RTOG临床试验(RTOG7916,8528,8905,9104,and 9508)1960例患者的资料开发应用的评分系统是分级预后评估(Graded Prognostic Assessment,GPA),也包括了四个预测指标:年龄,KPS,颅内肿瘤数量及有无颅外转移,将患者分为预后不同的四组,中位生存时间为2.6-11个月。两个评分系统已在临床研究和实践中广泛使用。然而,这两个评分系统对于脑转移患者射波刀治疗后具体生存概率的预测价值有待进一步确定。因此,本研究首先评估了RPA和GPA对于接受射波刀治疗的脑转移患者早期死亡(≤3月)和长期生存(≥12月)概率的预测价值。同时,本研究建立并验证了两个列线图模型,用于预测肺癌脑转移患者射波刀治疗后短期(≤6月)与长期(≥12月)生存,并与预后评分系统进行比较,为预测肺癌脑转移患者射波刀治疗后个体化生存概率提供依据。为了全面评价射波刀治疗脑转移患者生存预后相关因素,本研究对于首次治疗后发生颅内复发与转移的脑转移瘤患者接受再程射波刀挽救治疗后的预后因素进行分析。同时,分析颅内进展后的生存影响因素,指导进展后的治疗方式的选择。方法本研究分为四个部分:第一部分回顾性分析2006年9月至2015年12月在天津医科大学附属肿瘤医院接受射波刀治疗的脑转移瘤患者,研究纳入标准为:年龄≥18岁,死亡日期明确的恶性肿瘤脑转移患者,或自射波刀治疗结束后随访时间至少1年。共有492例患者符合入组标准并纳入本研究。评价预后评分系统RPA、GPA预测患者早期死亡(≤3个月)和长期生存(≥12个月)概率的能力。利用COX风险比例模型进行单因素和多因素分析,筛选出与总生存时间相关的独立影响因素,建立一个新的多因素预测模型,并与两个评分系统进行比较。用于评价模型预测能力的指标包括总体评价、区分度、符合度和临床获益。第二部分回顾性分析2006年9月-2016年7月在天津医科大学附属肿瘤医院接受射波刀治疗脑转移病灶的肺癌患者。入组病人为首次行立体定向放射治疗,或首次治疗失败后行射波刀挽救治疗。研究入组标准:1.年龄≥18岁;2.死亡日期明确,或自射波刀治疗结束后随访时间至少1年。所有入组病例随机分为建模组和验证组。在建模组应用COX风险比例模型进行单因素及多因素分析,筛选出影响患者总生存时间的独立预后因素。分别建立预测短期(≤6个月)和长期(≥12月)生存的两个列线图模型,并进行内部验证和外部验证。通过受试者工作特征(Receiver Operating Characteristics,ROC)曲线获得两个列线图的ROC曲线下面积(Area under the curve,AUC),与预后评分系统RPA、GPA、BSBM、GGS以及Rades进行比较。应用Hosmer-Lemeshow检验判断列线图模型的拟合优度,应用决策曲线分析(Decision curve analysis,DCA)评价列线图预测模型的临床获益。第叁部分回顾性分析2006年9月至2015年12月在天津医科大学附属肿瘤医院接受再程射波刀治疗的患者临床资料。共有63名患者符合入组标准并纳入研究。应用Kaplan-Meier法计算患者总生存时间和颅内无进展生存时间,并进行单因素分析筛选出影响生存的相关预后因素。应用Cox比例风险回归模型进行多因素分析,筛选出影响生存的独立预后因素。第四部分回顾性分析在2006年9月至2015年12月天津医科大学肿瘤医院接受射波刀治疗后发生颅内复发与转移的患者临床资料。对影响颅内进展后生存的因素进行了分析。使用Kaplan-Meier法计算生存时间并进行单因素分析,Log-rank检验进行组间差异比较。随后Cox比例风险回归模型进行多因素分析。组间治疗方式的差异比较分类变量应用卡方检验。结果第一部分:492例验证人群的生存结果显示,11.4%的脑转移患者接受射波刀治疗后在3个月内死亡,40.4%的患者生存时间超过了12个月。在预测早期死亡概率方面,评分系统RPA和GPA的区分度比较没有统计学差异,AUC分别为0.638和0.580(P>0.05)。新的多因素模型区分度显示,AUC高于RPA和GPA(P<0.01)。决策曲线分析结果显示新模型比GPA和RPA有更好的临床获益。在预测长期生存概率方面,评分系统GPA比RPA表现出更优的区分度,两者AUC分别为0.638和0.580(P<0.01)。与RPA比较,DCA显示GPA和新的多因素模型有更多的临床获益。第二部分结果显示:403例患者中位生存时间14个月。原发肺肿瘤组织病理学类型不是影响生存的相关因素。将KPS、有无颅外转移、肺内原发肿瘤状态(稳定或进展)、表皮生长因子受体(Epithelial Growth Factor Receptor,EGFR)状态、总的计划靶区体积(total plan target volume,total PTV)以及肺内原发肿瘤是否切除作为预测指标建立两个列线图模型:射波刀治疗肺癌脑转移短期(≤6月)和长期(≥12月)生存预测列线图,并进行内部和外部验证。预测短期生存(≤6月)列线图的ROC曲线显示,AUC为0.69,显着优于预后评分系统RPA、GPA、GGS及Rades(AUC 0.52-0.61),P<0.05。只有BSBM评分系统与列线图模型比较没有统计学差异(P=0.28)。但是BSBM的AUC值为0.66,低于列线图AUC值。预测长期生存(≥12月)的列线图ROC曲线显示,AUC为0.67,显着优于预后评分系统RPA、GPA、GGS、BSBM及Rades(AUC0.54-0.61),P<0.05。列线图模型在外部验证组中观察到更加显着的结果:预测短期生存(≤6月)列线图的AUC为0.75,显着优于预后评分系统RPA、GPA、GGS、BSBM及Rades(AUC 0.56-0.62),P<0.05;预测长期生存(≥12月)列线图的AUC为0.73,同样显着优于预后评分系统RPA、GPA、GGS、BSBM及Rades(AUC 0.57-0.66),P<0.05。符合度检测显示两个列线图预测结果与实际结果有良好的吻合度。并且在大多数的风险阈值范围内,短期和长期生存的列线图净获益均明显好于预后评分系统。第叁部分结果:再程射波刀治疗后的患者中位生存时间为18个月。多因素分析结果显示,影响生存的独立预后因素为:(1)首次和再程射波刀治疗计划靶区总体积之和(t PTV);(2)最小剂量。第四部分结果:射波刀治疗开始到发生颅内进展的时间间隔、进展后治疗方式以及颅外器官/区域转移部位的数量是颅内进展后总生存率的独立预后因素。结论RTOG预后评分系统RPA和GPA对射波刀治疗脑转移患者的早期死亡预测价值相似,而GPA预测长期生存概率优于RPA。进一步探索包括各种临床和治疗指标在内的多因素模型可进一步提高对立体定向放疗脑转移患者生存的预测效力,对治疗决策有更优的指导作用;两个列线图模型为接受射波刀治疗的肺癌脑转移患者提供了个体化生存概率预测依据,而不再是仅仅基于以往常用的评分系统的分组预后评估。同时,列线图在常规临床实践中更容易使用。本研究建立的列线图纳入肿瘤总的PTV和EGFR状态这两个新的预测因素,对于选择预期能够长期生存的肺癌脑转移患者进行包括射波刀在内的立体定向放疗具有一定价值。将来的研究应通过增加更多预测因素包括原发肿瘤或转移瘤的放射组学分析、肿瘤生物学行为的相关标志物等,以进一步提高列线图预测的准确性;脑转移瘤的再程射波刀治疗可作为首次治疗后颅内进展患者的安全、有效的挽救治疗方案。首次和再程PTV总和是影响患者总生存时间的独立预后因素,这一结果有助于选择潜在的可能有生存获益的患者人群接受再程射波刀治疗。前瞻性研究中应当进一步探讨包括总体积等多种因素对再程射波刀治疗的影响。射波刀治疗开始到颅内进展的时间间隔较长、进展后积极的局部治疗方式及颅外器官/区域转移部位数量较少与较高的进展后生存率显着相关。(本文来源于《天津医科大学》期刊2019-05-01)
谢果红[8](2019)在《胸腺瘤生存分析及风险预测模型研究》一文中研究指出目的:(1)估计胸腺瘤患者的中位生存时间及t年(t=1,5,10)生存率并筛选出影响胸腺瘤患者生存的主要因素;(2)构建胸腺瘤患者的个体预后指数方程及列线图模型,为临床上对胸腺瘤患者进行预后评估及治疗方案的选择提供参考。方法:(1)参考相关文献并咨询专家,自制“胸腺瘤患者临床资料及随访资料收集表”。借助自制表在湖南省肿瘤医院病案管理系统中收集2006年1月~2016年12月间良性胸腺瘤住院患者(WHO分型中的A型、B型、AB型)的一般情况及临床特征资料。采用电话访问、信函调查及门诊复查等方式对患者生存情况进行随访,随访信息录入自制表;(2)不同特征胸腺瘤患者生存率的估计及比较分别采用Kaplan-Meier法和Log-rank法。基于单因素分析结果,采用多元Cox回归确定影响胸腺瘤患者生存的因素;(3)根据多因素分析结果,建立个体预后指数方程,其应用价值的判断用误判概率。以上分析方法均在软件SPSS20.0中完成;(4)列线图模型的构建用R软件3.5.1中的rms包,其预测效果的评价使用一致性指数。结果:(1)本研究共随访胸腺瘤患者271例,死于本病127例,存活138例,失访6例,失访率为2.21%。胸腺瘤患者的中位生存时间为7.17年,1年、5年和10年生存率分别为94.1%、63.1%和31.3%;(2)单因素分析结果显示,年龄、住院时间、肿瘤切除完整性、手术类型、Masaoka分期、肌无力、吸烟水平、WHO分型、肿瘤最大直径、肿瘤转移情况及淋巴结肿大情况等可能是胸腺瘤患者生存的影响因素;(3)Cox回归多因素分析结果显示:年龄、肿瘤切除完整度、辅助治疗方式、Masaoka分期、WHO分型、肿瘤最大直径及有无并发肌无力等是胸腺瘤患者生存的影响因素,低龄、肿瘤切除完整、有辅助治疗、肿瘤最大直径小、未并发肌无力、较早的Masaoka分期及较低等级的WHO分型是胸腺瘤患者生存的保护因素;(4)个体预后指数方程预后预测能力评价,结果显示,灵敏度为83.3%,特异度为82.6%,误判概率为0.17。(5)列线图模型预后预测能力评价,结果显示,一致性指数为0.837,接近于1,模型预测能力较好。结论:(1)年龄、肿瘤切除完整度、辅助治疗方式、Masaoka分期、WHO分型、肿瘤最大直径及有无并发肌无力等是胸腺瘤患者生存的影响因素,当患者处于低龄、肿瘤切除完整、有辅助治疗、肿瘤最大直径小、未并发肌无力、较早的Masaoka分期及低级别的WHO分型时,生存时间更长,预后更好;(2)本研究所构建的胸腺瘤个体预后指数方程,可为患者预后评估提供科学依据。(3)本研究所构建的列线图模型,可帮助临床医生更简便、更直观的对患者预后情况进行评估。(本文来源于《湖南师范大学》期刊2019-05-01)
戴赟,陆俊,李平,郑朝晖,黄昌明[9](2019)在《皮革胃患者术后生存情况预测的列线图模型研究》一文中研究指出目的:构建皮革胃患者术后预后的列线图预测模型,并验证其准确性。方法:收集2008年12月—2014年9月共203例在福建医科大学附属协和医院胃外科行R_0切除的皮革胃患者的临床病理资料。根据Cox逻辑回归分析确定的独立预后因素,用R软件建立列线图预测模型,并分析所建模型对皮革胃患者预后预测的准确度。结果:全组患者中,男152例,女51例,其平均年龄为60.3(21~89)岁;II期患者25例(12.3%),III期患者178例(87.7%);中位随访时间38(2~111)个月;3、5年总体生存率分别为31.2%、18.7%。多因素分析结果示,BMI(P=0.006)、肿瘤细胞分化程度(P=0.042)、T分期(P=0.032)、N分期(P=0.032)、ASA评分(P=0.016)是预后的独立危险因素。根据以上独立危险因素建立列线图,并根据列线图的得分将患者进行危险分组分析发现,高危组(>16分)、中危组(>8~16分)和低危组(≤8分)患者的生存差异有统计学意义(P<0.001)。列线图的线性χ~2、阳性似然比、赤池信息量值准则均优于第七版AJCC-TNM分期系统(68.99 vs. 58.58、70.18 vs. 58.36、1 473.38 vs. 1 485.04)。结论:所建立的列线图模型能有效预测皮革胃患者的术后总体生存率,其预测准确度优于第7版AJCC-TNM分期系统,但该结果仍需进一步通过大宗的病例和多中心研究验证。(本文来源于《中国普通外科杂志》期刊2019年04期)
沈思鹏[10](2019)在《基于生存结局的多组学预测模型统计学方法研究与应用》一文中研究指出在大数据时代,随着分子生物学的发展,对于复杂疾病的研究已经发展至多种组学时代。组学数据是一种生物医学大数据,其具备高维度,小样本的特点(p>n),对传统的统计学方法提出了新的挑战。复杂疾病一般被认为是外在环境因素与内在遗传特征交互作用所导致的,而遗传学特征根据中心法则由上而下包括了多种微观组学数据,如基因变异,DNA甲基化,基因表达,miRNA表达,蛋白质表达等各个层面。全面认识不同组学层面的信息对认识疾病的发生发展至关重要。在医学临床研究中,组学数据与患者的疾病进展乃至疾病结局都有着紧密的联系。因此,组学数据亦常常被作为生物学标志物来预测患者的结局优劣。然而,仅仅利用单个变量(位点,基因等)来进行预测往往效果不如整合多个变量乃至多个组学的数据。本文针对肿瘤患者的预后结局,围绕常见组学数据,就无监督和有监督两部分预测模型构建方法进行研究。每一个部分又分为模拟实验和实例分析。第Ⅰ部分是基于无监督类别组学预后预测模型的算法提出并与常见方法比较。我们提出一种无监督类别多组学整合预测模型的算法Random partition fusion based on K-means(RPFKM),并与现在常见的算法[K-means,系统聚类,基于高斯混合模型的EM算法聚类,iCluster和Similarity network fusion(SNF)]进行比较。随后我们进行了多组学模拟实验,模拟了多元正态分布、介于0-1之间的beta分布和叁分类定性资料叁种常见类型的组学数据。通过模拟实验,我们发现,在使用标准互信息量和调整兰德指数评价分类效果时,整体的分类效果随着模拟参数阳性变量比例,阳性变量效应值,组间差距的增大而提升。其中,RPFKM的分类效果表现较其他几种方法好,尤其在阳性变量比例较低时分类效果较为出众。在使用C-index来评价结局预测能力时,阳性变量比例较低时RPFKM的预测能力较高,而当阳性变量比例较高时几种方法差别不大。在实例数据分析中,我们使用了癌症基因图谱(TCGA)数据库多肿瘤数据来全面评估RPFKM算法在各肿瘤中的预测表现。我们选取了ImmPort数据库的免疫基因谱对应的肿瘤组织的基因表达、DNA甲基化和具有广泛调控关系的miRNA叁种组学数据。结果发现在大部分肿瘤中都能显着识别患者的预后优劣,有着较高的C-index,在所有肿瘤中平均C-index为0.668,标准差为0.084。我们也发现了在部分肿瘤中分类效果欠佳,可能是由于分子生物学特征之外的其他环境因素交互作用所导致。第Ⅱ部分是基于有监督类别组学预后预测模型的方法学评价。我们对现有常见有监督类别组学预后预测模型的方法进行系统评价,包括了单变量筛选,惩罚回归类方法[最小绝对收缩和选择算子(LASSO),弹性网(ENET),确定独立筛选(SIS)等]以及机器学习类方法(随机森林,CoxBoost等)。在模拟实验中,我们模拟了多元正态分布数据,并根据数据协方差结构设置了独立变量、关联变量和基于实际数据结构的叁种场景。从整体预测效果C-index,模型拟合程度R~2,真阳性率TPR和假阴性率FNR来看,LASSO,ENET和CoxBoost叁种方法的预测表现较佳。但就错误发现率FDR而言,各种变量筛选方法都有着较高的FDR,不容忽视。在实例数据分析中,本文针对口腔鳞状细胞癌的甲基化、基因表达和临床因素叁种组学数据进行了整合分析。为了识别口腔癌中的甲基化特征,本研究使用了一个多阶段筛选策略首先建立DNA甲基化的预后模型。首先使用TCGA口腔癌数据作为训练集,并从GEO数据库中选取两个独立的数据集验证模型。随后本文探讨了甲基化与基因表达之间的关系以及表达预后的关联。最后使用中介分析来研究DNA甲基化、基因表达和患者预后间的因果关联。本研究最终筛选出7个CpG位点来建立预后模型,能够显着预测患者的生存结局,ROC曲线显示模型具有一定的预测能力[训练集:危险比(HR)=3.23,P=5.52×10~(-10);验证集1:HR=2.79,P=0.010;验证集2:HR=3.69,P=0.011]。7个CpG位点对应的基因表达(AJAP1、SHANK2、FOXA2、MT1A、ZNF570、HOXC4和HOXB4)也与口腔癌患者的生存显着相关。中介分析表明甲基化对于预后的影响部分是由基因表达所中介的。整合DNA甲基化、基因表达和临床数据叁大组学能够提供最好的预后预测能力(AUC=0.78)。DNA甲基化和基因表达生物标志物的识别有助于提高口癌癌的早期诊断和生存预测,为临床辅助治疗提供帮助,为精准医疗提供依据。(本文来源于《南京医科大学》期刊2019-03-01)
生存预测模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
【目的】更好地预测乳腺癌生存期,探索融合多种组学数据利用机器学习方法构建乳腺癌生存预测模型。【方法】通过对TCGA数据库中乳腺癌的基因表达、拷贝数变异、DNA甲基化和蛋白质表达4种组学数据的融合,使用随机森林算法建立预测模型。【结果】在测试数据集上该模型对乳腺癌分类预测的精确率为97.22%,召回率为98.13%。通过AUC值对比不同类型组合组学数据的预测性能,融合多组学数据的AUC值为0.8393,性能最好。【局限】由于样本数量的限制,模型普适性还有待进一步验证。【结论】融合多种组学数据构建乳腺癌预测模型是一种有效提高预测性能的方法。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
生存预测模型论文参考文献
[1].丁红忠,许从平,周永敏.晚期口腔鳞癌患者独立预后因素及生存预测模型的建立[J].上海口腔医学.2019
[2].齐惠颖,江雨荷.基于多组学数据融合构建乳腺癌生存预测模型[J].数据分析与知识发现.2019
[3].潘辉,张亚雷,肖大凯,郭志华,张晋昕.基于SEER数据库构建小细胞肺癌术后患者生存预测模型[J].肿瘤预防与治疗.2019
[4].杜坤朋.基于临床数据的食管癌动态生存预测模型的构建与应用[D].南方医科大学.2019
[5]..中国学者建立预测胃癌患者生存及化疗有效性的模型[J].中国肿瘤临床与康复.2019
[6].桑浩凯,郭树理,曲红,赵敏,曲大成.利用组学数据建立针对四种女性癌症的基于机器学习方法的生存预测模型[J].中国科学:生命科学.2019
[7].蒋雪超.射波刀治疗脑转移瘤预后因素评估及肺癌脑转移生存预测模型的建立与验证[D].天津医科大学.2019
[8].谢果红.胸腺瘤生存分析及风险预测模型研究[D].湖南师范大学.2019
[9].戴赟,陆俊,李平,郑朝晖,黄昌明.皮革胃患者术后生存情况预测的列线图模型研究[J].中国普通外科杂志.2019
[10].沈思鹏.基于生存结局的多组学预测模型统计学方法研究与应用[D].南京医科大学.2019