导读:本文包含了特征过滤论文开题报告文献综述及选题提纲参考文献,主要关键词:特征选择,χ2统计量,双层分类,不良文本过滤
特征过滤论文文献综述
管江红[1](2019)在《基于χ~2统计量的不良文本过滤特征选择方法》一文中研究指出针对现有以χ~2统计量为基础的特征选择方法在不良文本过滤过程中效果欠佳的问题,利用双层分类对特征选择方法进行改良,提出一种不良文本过滤特征选择方法。首先通过改良逆文档频率来区分特征项在所属类别类内与其他类别之间的分布差别;其次,引入逆类别频率弥补抑制强度;最后,加入逆上层类别频率,清晰划分具有较高相似度的某两类二层类别。所改良的特征选择方法能够弥补现有χ~2统计量在类内/类间特征项分布情况判别能力的缺陷,将其应用于不良文本过滤过程,能够充分贴合不良文本过滤过程的特征选择需求。通过对比评估指标的结果,表明所提方法在不良文本过滤领域具有更好的效果。(本文来源于《现代电子技术》期刊2019年21期)
吴昊[2](2019)在《基于超极特征匹配机制的人工网络安全流量过滤算法研究》一文中研究指出为解决当前物联网部署过程中存在的流量过滤效率低、传输受限等难题,提出了一种基于超极特征匹配机制的人工网络安全流量过滤算法。首先,基于能量最优原则,并针对sink节点与准分区节点之间的应答响应关系,构建一种网络初始化方案,使用分组问答-响应方式建立节点拓扑初始化关系并进行能量排序,实现网络快速建立及拓扑收敛。随后,综合考虑能量冗余、距离等超级特征并进行区域匹配,通过设计更新周期方法实现对区域节点稳态化控制,稳定区域传输质量,提高算法在超宽带传输条件下的适应能力。最后,采取扫描方式进行分区节点二次筛选,选取转发代价最小的分区节点进行组网,降低分区节点因能量受限而出现瘫痪的概率,进一步稳定算法对流量的过滤及传输质量。仿真实验表明:与当前常用的超宽带一体化传输过滤稳定算法(Ultra Wideband Integrated Transmission Filter Stabilization Algorithms,UWITFS算法)及分区流量综合过滤算法(Partition Flow Comprehensive Filtering Algorithms,PFCF算法)相比,所提算法具有流量过滤强度高、超宽带传输能力强的特性,实际部署价值较高。(本文来源于《井冈山大学学报(自然科学版)》期刊2019年05期)
张恒,甄琪,刘雍,宋卫民,刘让同[3](2019)在《嵌入式聚丙烯/聚乙二醇微纳米纤维材料的结构特征及其气固过滤性能》一文中研究指出为开发可用于空气过滤的微纳米纤维材料,以聚乙二醇(PEG)共混改性聚丙烯(PP)为原料,基于熔喷技术高速热气流牵伸聚合物熔体一步法制备PEG/PP微纳米纤维材料,并对纤维排列、直径分布、孔隙率与过滤效率、过滤阻力和质量因子间的关系进行分析。结果表明:直径在800 nm以下的纳米纤维穿插于直径在4 000 nm以上的纤维之间,表现为厚度方向上的宏观迭层与水平方向上的微观准连续分支复合的嵌入式特征;随着PEG质量分数从0%增加到8%, 800 nm以下纤维的嵌入率从0.00%增加到784.66%,同时过滤效率增大了约1.12倍,质量因子也呈现逐渐增大的趋势;微纳米纤维材料的嵌入式结构有利于捕获连续流体中的细小颗粒物。(本文来源于《纺织学报》期刊2019年09期)
韩伟,余志惠,王国师,张朝伟[4](2019)在《基于多普勒特征的雷达地面目标过滤方法》一文中研究指出机载预警雷达在探测空中目标时,常面临地面目标的点干扰和航迹干扰。地面目标过滤是机载预警雷达航迹优化的重要内容,可以有效改善目标航迹质量。针对地面目标过滤问题,本文研究了基于多普勒特征的地面空中目标识别方法。首先在对交通流建模仿真的基础上,分析了地杂波背景下高速公路目标回波的多普勒特征;然后利用地面和空中目标的多普勒特征差异,设计了一种目标分类准则。仿真结果表明分类准则在确保空中目标具有较高识别概率的同时,也保证了对地面目标具有较高的识别概率,从而能够有效滤除大部分地面高速公路目标。(本文来源于《系统工程与电子技术》期刊2019年10期)
赵文涛,吕霞[5](2019)在《基于用户特征和相似置信度的协同过滤算法》一文中研究指出针对推荐系统中协同过滤算法存在的用户冷启动和数据稀疏性的问题,提出一种基于用户特征的相似度和基于置信度的相似度相融合的计算方法。该算法对用户的特征进行计算得到一个相似度,再考虑到能正常反映用户之间的相似兴趣而进行计算得到一个和置信度有关的相似度,将两个相似度的权重按"相加为1"的方式进行融合得到最终的相似度。实验结果表明,这一方法在数据较为稀疏、用户邻居数较少的情况下与传统的协同过滤算法相比有较好的推荐效果。(本文来源于《测控技术》期刊2019年08期)
蒋宗礼,于莉[6](2019)在《基于用户特征的协同过滤推荐算法》一文中研究指出协同过滤算法是目前在电商系统中应用最广的推荐技术.为了缓解传统基于用户的协同过滤算法在冷启动、推荐准确性和数据稀疏性方面的缺点,本文提出基于用户特征的协同过滤推荐算法.此算法利用注册信息提取属性特征,并对已有的评分信息提取兴趣特征和信任度,综合以上各特征融合特征相似性进一步产生推荐.实验结果表明,与传统的基于用户的协同过滤算法做对比,基于用户特征的协同过滤算法对推荐的精度有大幅的提高.(本文来源于《计算机系统应用》期刊2019年08期)
蒋艺琪[7](2019)在《基于情感分析和特征过滤的主题提取方法研究》一文中研究指出近年来,互联网已经渗入到我们的日常生活中,互联网服务APP已然成为新时代的生活网络工具之一.人们进行选购商品时,经常翻看商品的评论来对这个商品作出购买判断,并且这些文本评论是消费者的直观感受,同时这些评论也提供了一个为平台了解客户的途径,快速挖掘文本评论的信息并且转化为生产力是亟待解决的问题.本文基于服务APP文本短评数据,探索适合短文本的主题挖掘方法.本文简单介绍了中文文本的预处理技术、文本特征的提取技术和不平衡数据处理技术,主要任务是探索快速且准确的文本情感分析的方法和精确提取主题的模型.并将情感分析和特征筛选融入到主题模型中,提出一种基于LDA模型的主题提取方法.本文的主要研究内容和工作如下:探索和选择适合短评数据的不平衡数据处理技术,用重抽样和欠采样技术进行处理并对比结果.从基于机器学习模型的情感分析和基于深度学习的情感分析两个角度展开,探索针对不平衡数据表现优异的情感分析模型.机器学习模型选用支持向量机和梯度提升决策树做实验,并用网格搜索和交叉验证调参.深度学习选用的是浅层网络fastText.用加权F1评估叁个模型,实验证明,在处理不平衡数据方面fastText模型优于其他两个模型,并且指明了原因.在主题提取任务中,提出一种基于LDA模型针对短文本和不平衡数据的方法,先进行情感分析,将情感极性的标签加入主题提取模型中,再进行特征筛选,剔除公共属性特征,按类别进行短文本主题提取,效果较原模型显着,该方法具有实际应用价值.(本文来源于《华中科技大学》期刊2019-05-01)
陈思洋[8](2019)在《融合物品视觉特征的协同过滤推荐算法研究》一文中研究指出随着互联网的飞跃发展,互联网上信息也呈现急速增长的趋势,信息过载问题越发严重。推荐系统已经成为解决信息过载问题的重要解决方案。协同过滤(Collaborative Filtering,CF)则是其中的主流模型之一,在学术界以及工业界中均获得了大范围的应用。协同过滤从用户对物品的隐式反馈(例如,物品购买历史,浏览日志等)等数据建模用户对物品的偏好函数从而产生最后的推荐结果,但同时也忽略了物品的相关属性信息,例如物品的视觉特征,物品的标签分类等,从而在某种程度上限制了模型的性能。本文认为物品的视觉特征对于用户偏好建模有着重要的影响。为此,本文提出了融合物品视觉特征的稀疏线性模型,将物品的视觉特征同用户-物品交互记录联合考虑,共同建模用户-物品交互函数。本文围绕融合物品视觉特征这一问题进行了深入的探究,主要研究工作如下:(1)传统的协同过滤推荐算法仅仅考虑用户对物品的交互信息,忽视了物品的视觉特征,从而限制了模型的表达效果。本文将物品的视觉特征融入基于用户-物品交互的稀疏线性模型中,使用线性回归的方式建模物品的视觉特征对用户偏好的影响,实验结果表明模型的效果取得了明显的提升,同时验证了视觉特征确实对用户偏好存在着重要影响。(2)在众多协同过滤推荐算法中,矩阵分解则是其中最简单有效的方法。然而矩阵分解模型对于关键的用户-物品交互函数使用向量内积这一线性函数建模,一定程度上限制了模型的表达。为此,本文在融入物品的视觉特征基础之上,考虑使用深度神经网络建模用户-物品交互函数,捕捉用户-物品之间的非线性高阶交互关系。实验结果表明,本文提出的基于BPR融合物品视觉特征的深度协同过滤推荐模型能够有效的提取物品的视觉特征,捕捉用户-物品之间的非线性高阶交互关系,实现了更加通用精准的推荐。(本文来源于《合肥工业大学》期刊2019-05-01)
毛德磊[9](2019)在《基于特征工程的协同过滤算法研究》一文中研究指出协同过滤算法是目前应用最广泛、最成功的推荐算法之一,通过分析用户或项目特征计算相似度,生成最近邻集合,最后预测对未知项目的评分生成推荐结果。用户或项目特征在协同过滤算法中是至关重要的,其区分度和稀疏性会直接影响算法的预测准确度。无论是传统协同过滤算法还是改进的协同过滤算法,二者都是将评分数据作为用户或项目的特征,因此就有两个方面的问题需要进一步探索和优化:(1)用户或项目特征的区分度不高。评分数据在很大程度上受到用户个性化偏好、行为习惯等不可度量因素的影响,对于不同的用户来说,相同评分会代表不同偏好,而不同评分却可能代表相同的偏好。因此,将评分数据作为用户或项目特征就会存在特征区分度不高的问题。为了得到区分度更高的特征,研究者们会使用不同的方法,例如:基于内容的方法引入各种用户或项目特征、引入人口统计特征或结合自然语言处理技术等。(2)用户或项目特征具有高稀疏性。随着互联网用户规模的急速扩大和电子商务的普及,用户评分的项目通常只占全部项目的很少一部分,评分数据极度稀疏。此时,将评分数据作为用户或项目特征就会存在特征稀疏度高的问题。为了缓解稀疏性问题带来的影响,研究者们创新出了多种控制填补技术、降维技术和对稀疏性不敏感的相似度计算方法等。本文从特征工程的角度出发,针对由于特征区分度不高和稀疏性所导致预测准确度降低的问题,从如下两方面展开研究:(1)针对用户特征区分度低的问题,提出融合归因理论特征的协同过滤算法(AF-CF,Collaborative filtering based on attribution features)。归因理论属于社会心理学的范畴,通过分析一致性、区别性、一贯性、正负偏好等区分度很高的用户特征能很好的对用户行为进行归因分析,即推理用户行为的原因。因此,AF-CF算法为了得到区分度高的特征,使用统计方法提取归因理论中的叁种特征:一致性、区别性、正负偏好。将用户评分行为归因于用户偏好,线性处理这叁种特征得到用户项目偏好。计算偏好相似度与评分相似度,为兼顾两种相似度的优点,对相似度进行融合,最后进行评分预测。为了验证工作的有效性,文中首先对相似度融合参数进行调优,得到最优的参数:??(28)(28)、6.01.0。然后,在最优的融合参数下,与传统协同过滤算法的预测准确度进行对比,以MAE为评价指标,其值下降了1.5%左右,即算法的预测准确度提升了1.5%。最后,与最新的叁种最新的协同过滤改进算法进行对比,算法的MAE值下降了4%-5%。(2)为了降低稀疏性对协同过滤算法预测准确度的影响,同时兼顾提取具有高区分度的特征,提出基于标注映射的协同过滤算法(LM-CF,Collaborative filtering based on label and map)。标注映射是文中提出的一种特征提取方法,标注是为了生成原始数据的类别信息,映射是将原始数据按照标注转换成为新特征。根据标注的方法不同,文中对原始评分数据分别采用聚类标注映射和自标注映射方法,提取出数据维度低和区分度高的新特征。不同于已有的特征提取方法,标注映射提取的是由集合所组成的新特征。以新特征为数据,进行基于项目的评分预测,其中相似度计算使用线性Jaccard方法,通过对特征的细粒度划分,能更好的计算项目相似度。在通用数据集Movie lens、Yahoo!R4、Film Trust上进行实验,以MAE为评估标准,验证工作的有效性。首先,分析聚类标注和自标注的各自适用性,聚类标注适用于大数据集,对数据格式没有要求,自标注适用于小数据集,对数据格式有严格要求。最后,通过与四个最新算法的MAE值对比,证明工作(2)要优于对比算法,MAE值下降了2%-12%。(本文来源于《西南大学》期刊2019-04-08)
赵慧[10](2019)在《超滤膜过滤界面电位特征及污染层形成过程研究》一文中研究指出如何更加深入的了解膜污染过程是有效控制膜污染的核心问题,更是指导膜组件优化和高效稳定运行的关键。本文应用Zeta电位监测及超声时域反射技术联合同步在线监测的方法,对典型有机污染物的膜污染行为及特征进行了研究,以此来建立科学的分析和评价膜污染方法。首先,对膜污染进程进行了膜面Zeta电位的超滤膜原位同步监测,对膜污染过程中的界面电位变化进行了实时表征。研究发现,在膜污染的不同阶段Zeta电位的变化趋势也不尽相同。在膜孔堵塞阶段,Zeta电位呈快速下降状态。当Zeta电位呈缓慢下降趋势时是滤饼层形成阶段。进入滤饼层压实阶段时Zeta电位趋于稳定,由于此时的膜表面已被实验膜污染物所覆盖,膜面电位完成了从膜本征电位向污染物本征电位的过渡,稳定后的电位值几乎不再变化。在此研究基础上,采用“差异时段过滤膜污染累积”方法对膜污染过程进行研究,并引入膜电位特征参数AZetaft2t1作为评价指标,与膜不可逆污染阻力做皮尔森相关性系数分析。研究发现,差异时段膜过滤中膜的不可逆污染程度与其过滤初期表面Zeta电位变化呈现出良好的负相关性。实验结果说明Zeta电位变化最剧烈时是过滤过程膜不可逆污染的主要阶段累积阶段,膜面不可逆污染的累积会加速膜过滤到达稳定阶段。相同条件下四种膜污染物形态中,SA过滤中不可逆污染累积量最大,计算得到的不可逆阻力达3.77E+12 m-1,而过滤达到稳定阶段的时间却最短。四种膜污染物最终造成的不可逆污染程度由大到小依次为SA>MFs>BSA>HA。其次,联合超声时域反射技术(UTDR),在对膜污染进行Zeta电位监测的基础上进了膜过滤过程中滤饼层厚度及密度的实时表征。UTDR不仅能有效的监测污染层的形成和生长,还可以通过差动信号振幅的变化来表征污染层的密度变化。本研究通过对超声回波信号与滤饼层厚度间的协同关系来判断膜过滤进入滤饼层压实阶段的时间。利用Zeta电位与超声时域反射技术联合在线监测的方法弥补了各自的不足,更有利于在原位监测过程中了解膜污染过程的特点。结果表明,四种污染物进入滤饼层形成和压实阶段所需的时间由快到慢依次为SA>MFs>BSA>HA。利用超声差动信号计算得实验最终各污染层厚度从厚到薄依次为HA、BSA、MFs和SA。通过XDLVO理论计算可知,膜-SA及SA-SA之间的相互作用力均大于其他几种污染物与膜及各自之间的相互作用力,膜污染过程中SA在膜面上的吸附速率较快,又由于自身作用力相对较强,更容易被压实,且根据超声反射数据计算得SA过滤最终形成的滤饼层也最薄。上述工作对于科学的判别膜污染的变化阶段和选择最佳的膜污染的控制时机有着重要的意义。(本文来源于《天津工业大学》期刊2019-03-01)
特征过滤论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为解决当前物联网部署过程中存在的流量过滤效率低、传输受限等难题,提出了一种基于超极特征匹配机制的人工网络安全流量过滤算法。首先,基于能量最优原则,并针对sink节点与准分区节点之间的应答响应关系,构建一种网络初始化方案,使用分组问答-响应方式建立节点拓扑初始化关系并进行能量排序,实现网络快速建立及拓扑收敛。随后,综合考虑能量冗余、距离等超级特征并进行区域匹配,通过设计更新周期方法实现对区域节点稳态化控制,稳定区域传输质量,提高算法在超宽带传输条件下的适应能力。最后,采取扫描方式进行分区节点二次筛选,选取转发代价最小的分区节点进行组网,降低分区节点因能量受限而出现瘫痪的概率,进一步稳定算法对流量的过滤及传输质量。仿真实验表明:与当前常用的超宽带一体化传输过滤稳定算法(Ultra Wideband Integrated Transmission Filter Stabilization Algorithms,UWITFS算法)及分区流量综合过滤算法(Partition Flow Comprehensive Filtering Algorithms,PFCF算法)相比,所提算法具有流量过滤强度高、超宽带传输能力强的特性,实际部署价值较高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
特征过滤论文参考文献
[1].管江红.基于χ~2统计量的不良文本过滤特征选择方法[J].现代电子技术.2019
[2].吴昊.基于超极特征匹配机制的人工网络安全流量过滤算法研究[J].井冈山大学学报(自然科学版).2019
[3].张恒,甄琪,刘雍,宋卫民,刘让同.嵌入式聚丙烯/聚乙二醇微纳米纤维材料的结构特征及其气固过滤性能[J].纺织学报.2019
[4].韩伟,余志惠,王国师,张朝伟.基于多普勒特征的雷达地面目标过滤方法[J].系统工程与电子技术.2019
[5].赵文涛,吕霞.基于用户特征和相似置信度的协同过滤算法[J].测控技术.2019
[6].蒋宗礼,于莉.基于用户特征的协同过滤推荐算法[J].计算机系统应用.2019
[7].蒋艺琪.基于情感分析和特征过滤的主题提取方法研究[D].华中科技大学.2019
[8].陈思洋.融合物品视觉特征的协同过滤推荐算法研究[D].合肥工业大学.2019
[9].毛德磊.基于特征工程的协同过滤算法研究[D].西南大学.2019
[10].赵慧.超滤膜过滤界面电位特征及污染层形成过程研究[D].天津工业大学.2019