导读:本文包含了变量筛选论文开题报告文献综述及选题提纲参考文献,主要关键词:压缩感知,蛋白质组学,变量筛选,小样本
变量筛选论文文献综述
张薇,张秋菊,王玉鹏,谢彪,孙琳[1](2019)在《压缩感知理论在小样本量蛋白质组学变量筛选研究中的应用》一文中研究指出目的探索基于压缩感知理论变量筛选方法在小样本量蛋白质组学研究中应用的效果和特点,为小样本量的蛋白质组学的变量筛选提供更灵敏、可靠的方法。方法模拟实验比较基于CS理论的变量筛选方法与偏最小二乘(PLS)及随机森林(RF)筛选变量的能力,通过灵敏度、特异度及平衡准确度评价其变量筛选效果;利用CS变量筛选方法筛选非小细胞肺癌两亚型组(腺癌和鳞状细胞癌)的差异蛋白。结果模拟实验表明,CS理论的变量筛选方法在样本量较小时具有较好的变量筛选效果,灵敏度、特异度及平衡准确度均较高;利用基于CS理论的变量筛选方法筛选,获得肺腺癌和鳞状细胞癌间差异表达蛋白22种,被证明是肺腺癌和鳞状细胞癌间有差异的蛋白为:Cytokeratin 6A、Cytokeratin 6B、Cytokeratin 6C、PKP1、P63、MCT1。结论基于CS理论的变量筛选方法在样本量特别少时,筛选变量的效果优于PLS和RF,更适用于小样本蛋白质组学数据变量筛选研究。(本文来源于《中国卫生统计》期刊2019年05期)
刘晶,何伦志[2](2019)在《丝绸之路经济带核心区新型城镇化驱动因素量化分析与对策——基于LASSO的变量筛选》一文中研究指出在"一带一路"与新型城镇化两大体系融合的背景下,新疆作为丝绸之路经济带核心区,其城镇化的健康发展不仅关系着新疆社会稳定、长治久安与经济的可持续发展,同时对"一带一路"建设起到支撑作用。影响新型城镇化发展的因素众多,采用LASSO方法从可能影响新疆新型城镇化发展的经济贸易、基础设施、社会保障、政府制度、教育科技、医疗卫生、金融发展、人民生活、人口就业、民族文化、资源环境、能源消耗以及兵团建设13个方面选取64个驱动因子进行量化分析,依据模型压缩系数实现指标精简。对各因素的影响效果进行分析,从基础设施建设、兵地融合、参与"一带一路"建设、对口援疆以及水资源利用方面给出推进丝绸之路经济带核心区新型城镇化发展的对策与建议。(本文来源于《干旱区地理》期刊2019年06期)
蔡雨晴,宋微,徐欢,李康[3](2019)在《差异网络分析方法在组学数据变量筛选中的应用》一文中研究指出组学数据(omics data),如基因组、转录组、蛋白质组和代谢组等数据能够反映疾病的发生、发展和预后的情况。对于组学数据的分析,主要是筛选有用的生物标志物、分析调控网络和建立预测模型。一般是通过变量差异表达量分析不同类别之间的差别。但在实际中,也可能有这样一种情况,即在不同分类中,变量的量值变化不大,但其网络拓扑结构(network topology structure,NTS)却发生了变化,这种情况同样能反映不同的生物学特征,并据(本文来源于《中国卫生统计》期刊2019年04期)
倪葎[4](2019)在《超高维离散变量筛选方法》一文中研究指出作为一种降维技术,变量筛选在超高维数据分析中发挥至关重要的作用,并且在过去十年间许多文献对其进行了讨论.无论响应变量是连续的还是离散的,大部分的现有变量筛选方法均明示或暗含着一个假设,协变量是连续的.Huang,Li&Wang(2014)[37]首先提出了一种基于Pearson卡方统计量的变量筛选方法(PC-SIS).该方法解决了在分类问题中如何筛选超高维离散变量,虽然这是一个常见的实际问题,却很少在以往文献中进行讨论.当不同协变量的分类个数不同时,变量筛选方法采用原始筛选统计量或其p值调整值的筛选表现均欠佳.本论文的主要工作具体如下:在一个分类问题中,本文发展了一种全新的且无模型假设的变量筛选方法,可用于筛选超高维的离散协变量.其独特性在于不但允许协变量的分类个数是不相等的,而且允许协变量的分类个数是发散的.响应变量的分类个数也被允许是发散的.该方法所采用的筛选信号结合了决策树算法ID3中所定义的信息增益与一个定义为协变量分类个数的对数的倒数的校正因子.而这个变量筛选方法可表示为IG-SIS.在这个方法中,每一个筛选统计量可度量响应变量和某一特定的协变量之间的相关性并用于评判这个协变量的预测能力.本文从理论和实际两个角度改进了 Huang,Li&Wang(2014)[37]所提出的变量筛选方法和调整参数的选择方法.该改进后的筛选统计量是由原本的Pearson卡方筛选统计量乘以在变量筛选方法IG-SIS中所采用的校正因子而定义的.这个变量筛选方法可称为调整后的Pearson卡方变量筛选方法(APC-SIS).当协变量分类个数不相等时,APC-SIS的筛选表现远比PC-SIS好得多.在超高维数据分析中,缺失数据是一个很常见的现象.在缺失数据中发展变量筛选的方法是非常具有挑战的,这是因为无法将传统的缺失数据处理方法直接运用于超高维的情况.本文提供了一种无模型假设的方法,可用于筛选存在可忽略缺失值的离散协变量(IMC-SIS).这种变量筛选方法可适用于有大量的存在缺失值和不存在缺失数据的协变量的数据,其中某一协变量取值的缺失仅仅与响应变量和一小部分无缺失值的协变量有关.这个缺失机制的假设就是随机缺失.本文提出了一种“两步”的变量筛选方法.对于每一个存在缺失值的协变量,第1步在无缺失概率函数的假定下筛选与缺失指示器相关的协变量;第2步基于离散数据的特殊结构,通过第1步所确定的协变量的调整,从而估计该缺失协变量与响应变量的联合概率.在给定联合概率的估计之后,本文进一步定义了变量筛选统计量,由此可以选出具有良好预测能力的协变量.就理论而言,本文证明了所提出的变量筛选方法都具有变量筛选(选择)一致性.从实际的角度,本文在多个模拟数据中验证了所提出的变量筛选方法的实际筛选效果.结果表明,其一,IG-SIS和APC-SIS在有限样本中表现相似,且比其他现有的离散数据的变量筛选方法具有优势;其二,不管缺失概率较大且协变量的相关性较高,IMC-SIS可以成功地挑选出活具有良好预测能力的协变量.另外,本文将所提出的变量筛选方法应用于信用卡评级和网络招聘的两个实际数据,其筛选结果是具有解释性且有助于下一步分析。(本文来源于《华东师范大学》期刊2019-05-01)
吴子俊,卢景琦,黄剑,程德伟[5](2019)在《激光诱导击穿光谱结合CARS变量筛选检测油漆涂层中的Pb》一文中研究指出利用激光诱导击穿光谱(LIBS)技术,对油漆涂层中的重金属Pb进行定量检测研究。优化实验参数后,利用多通道光谱仪采集油漆涂层308~417nm范围内的等离子光谱,为了得到精确的定量结果,对油漆涂层的Pb分别进行单变量分析、多元线性回归分析以及竞争自适应再加权采样-偏最小二乘(CARS-PLS)分析。结果表明,CARS-PLS分析模型的定量结果最准确,校正集的决定系数为0.991,预测样品4#、7#的预测相对误差分别为1.4%、1.5%;CARS变量筛选方法能够从光谱中有效筛选出与Pb相关的重要信息,能够结合PLS准确检测油漆涂层中的Pb。(本文来源于《激光与光电子学进展》期刊2019年14期)
甘兰萍,孙通,刘津,刘木华[6](2019)在《共线双脉冲LIBS结合变量筛选定量检测腐霉利含量》一文中研究指出腐霉利(Procymidone)作为一种新型的农产品杀菌剂,具有防止农产品受病虫害的作用,但其在施药过程中容易使用不当危害环境和人的健康。为加强对腐霉利农药的检测,本研究应用共轴双脉冲激光诱导击穿光谱技术(LIBS)对溶液中的腐霉利含量进行定量检测研究。为配置不同浓度的腐霉利样品,将有效成分含量为98%腐霉利粉末与二甲苯按照不同比例混合并完全溶解。由于液体样品在激光击打的过程中容易将液体溅出,具有一定的危险性。因此,实验将液体样品转化为固体样品,利用石墨吸附腐霉利溶液,然后采用八通道高精度光谱仪采集样品的LIBS光谱,并利用不同预处理方法对光谱数据进行预处理。为提高腐霉利的检测精度,选择氯元素信号最强的两通道(744.555~935.843,893.107~1 057.058nm)光谱数据,分别采用归一化函数(normalization)、基线校正(baseline correction)、标准正态变量变换(SNV)、多元散射校正(MSC)方法进行光谱预处理,并应用PLS方法建模。通过比较各预处理方法数据后,综合考虑,选择Baseline方法为最佳预处理方法。在baseline预处理方法的基础上使用无信息变量消除算法(UVE)联合竞争性自适应重加权采样(CARS)算法剔除无信息的波长变量,筛选与腐霉利相关的重要波长变量,最后应用偏最小二乘回归建立溶液中腐霉利含量的定量预测模型。建模结果表明:经光谱预处理和UVE-CARS方法优选后,可将原4096个波长变量个数减少至13个,变量压缩率为99.68%;经UVE-CARS变量优选后建立的PLS模型的校正集的决定系数和均方根误差分别为0.990 5和0.66,预测集的决定系数和均方根误差分别为0.990 3和0.67,其模型性能优于原始光谱建立的PLS模型。结果表明,利用共轴双脉冲LIBS技术定量检测溶液中的腐霉利含量具有一定的可行性,经UVE和CARS方法筛选后可以有效提取腐霉利的特征变量及相关影响变量,剔除冗余及噪声影响变量,简化定量分析模型且提高了定量分析模型的稳定性。(本文来源于《光谱学与光谱分析》期刊2019年02期)
张立军,谭冰洁[7](2018)在《基于迹lasso模型的变量筛选方法》一文中研究指出lasso法因能得到稀疏解而常用于计量模型的变量筛选中。然而在处理强相关数据时,lasso法不存在组效应且结果不稳定。针对该问题,本文在变量筛选时提出了对lasso法改进后的迹lasso法,该方法具有自动组效应的优点。将其运用至空气质量指数模型的变量筛选中,实证分析表明,迹lasso法能更好地处理强相关数据,且能筛选出更精炼的变量,从而构建一个更容易解释的模型。(本文来源于《系统工程》期刊2018年12期)
刘雪松,张丝雨,赵曼茜,王钧,李页瑞[8](2019)在《近红外光谱结合不同变量筛选方法用于黄芩提取过程中黄芩苷含量预测》一文中研究指出近红外光谱技术(NIRS)结合化学计量学可以实现中药过程分析中的快速定量,变量筛选算法的应用可以有效去除光谱中的冗余信息并筛选出与成分信息相关的关键变量,与全光谱模型相比可以显着降低模型复杂度,并提高预测精度。本文将近红外光谱技术结合不同变量筛选算法用于黄芩提取过程黄芩苷含量的快速测定,基于SPXY法划分数据集,采用竞争自适应加权重采样法(CARS)、随机青蛙算法(RF)、连续投影算法(SPA) 3种不同变量筛选方法,以偏最小二乘法(PLS)为基础,建立并比较了黄芩药材提取过程黄芩苷含量的定量校正模型。经CARS法、RF法和SPA法分别筛选出92、10、17个变量, CARS-PLS法建立的黄芩苷模型具有最佳性能, CARS法筛选的关健变量与指标成分黄芩苷的化学结构也有着较好的对应关系。模型的校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为0.528 2和0.720 2,与全光谱模型相比,模型的校正集相关系数(Rc)从0.917 0上升到0.979 9,相对预测偏差(RSEP)从10.58%降低到5.59%。(本文来源于《药学学报》期刊2019年01期)
李颖,陈元胜,吕靓,汪少芸,王武[9](2018)在《基于近红外特征变量筛选对火麻油掺杂的快速检测》一文中研究指出利用近红外光谱技术对掺杂了大豆油、花生油、葵花籽油和玉米油的火麻油进行鉴定,结合偏最小二乘法(PLS)和最小二乘支持向量机(LS-SVM)模型建立定量分析,并利用连续投影算法(SPA)和竞争自适应重加权采样算法(CARS)提取特征变量.结果表明:LS-SVM回归模型的准确度优于PLS模型,其预测相关系数R_p~2分别达到0.950 4、0.905 8、0.857 4和0.767 3;SPA和CARS是两种有效的特征变量选择算法,能够提高模型的准确性,并且CARS效果优于SPA;其中,LS-SVM-CARS模型的R_p~2分别达到0.982 1、0.907 5、0.958 7和0.924 9.因此,在油脂掺杂快速检测中,LS-SVM-CARS是一个准确度高、变量数少、传递性较强的定量分析模型.(本文来源于《福州大学学报(自然科学版)》期刊2018年04期)
李玉杰,李高荣[10](2018)在《超高维部分线性变系数模型的贪婪变量筛选》一文中研究指出考虑超高维部分线性变系数模型,其中线性部分的协变量的维数随着样本容量以指数阶的速度增长.考虑到超高维协变量间存在相关性,提出贪婪的profile向前回归(greedy profile forward regression,GPFR)方法对超高维的线性部分的协变量进行变量筛选.并在一定的正则条件下,证明了所提出GPFR方法的筛选相合性.GPFR方法得到一系列嵌套的模型,为确定是否将某个候选的解释变量选入模型,用EBIC准则选择"最优"的模型.通过数值模拟和实例分析研究了GPFR算法的有限样本性质,发现在变量间存在高度相关和信噪比较低时,所提的GPFR方法优势明显.(本文来源于《北京工业大学学报》期刊2018年09期)
变量筛选论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在"一带一路"与新型城镇化两大体系融合的背景下,新疆作为丝绸之路经济带核心区,其城镇化的健康发展不仅关系着新疆社会稳定、长治久安与经济的可持续发展,同时对"一带一路"建设起到支撑作用。影响新型城镇化发展的因素众多,采用LASSO方法从可能影响新疆新型城镇化发展的经济贸易、基础设施、社会保障、政府制度、教育科技、医疗卫生、金融发展、人民生活、人口就业、民族文化、资源环境、能源消耗以及兵团建设13个方面选取64个驱动因子进行量化分析,依据模型压缩系数实现指标精简。对各因素的影响效果进行分析,从基础设施建设、兵地融合、参与"一带一路"建设、对口援疆以及水资源利用方面给出推进丝绸之路经济带核心区新型城镇化发展的对策与建议。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
变量筛选论文参考文献
[1].张薇,张秋菊,王玉鹏,谢彪,孙琳.压缩感知理论在小样本量蛋白质组学变量筛选研究中的应用[J].中国卫生统计.2019
[2].刘晶,何伦志.丝绸之路经济带核心区新型城镇化驱动因素量化分析与对策——基于LASSO的变量筛选[J].干旱区地理.2019
[3].蔡雨晴,宋微,徐欢,李康.差异网络分析方法在组学数据变量筛选中的应用[J].中国卫生统计.2019
[4].倪葎.超高维离散变量筛选方法[D].华东师范大学.2019
[5].吴子俊,卢景琦,黄剑,程德伟.激光诱导击穿光谱结合CARS变量筛选检测油漆涂层中的Pb[J].激光与光电子学进展.2019
[6].甘兰萍,孙通,刘津,刘木华.共线双脉冲LIBS结合变量筛选定量检测腐霉利含量[J].光谱学与光谱分析.2019
[7].张立军,谭冰洁.基于迹lasso模型的变量筛选方法[J].系统工程.2018
[8].刘雪松,张丝雨,赵曼茜,王钧,李页瑞.近红外光谱结合不同变量筛选方法用于黄芩提取过程中黄芩苷含量预测[J].药学学报.2019
[9].李颖,陈元胜,吕靓,汪少芸,王武.基于近红外特征变量筛选对火麻油掺杂的快速检测[J].福州大学学报(自然科学版).2018
[10].李玉杰,李高荣.超高维部分线性变系数模型的贪婪变量筛选[J].北京工业大学学报.2018