统计机器学习论文-李艳

统计机器学习论文-李艳

导读:本文包含了统计机器学习论文开题报告文献综述及选题提纲参考文献,主要关键词:统计机器学习,暗链监测,机器学习,检测方法

统计机器学习论文文献综述

李艳[1](2019)在《基于统计机器学习的互联网暗链检测方法研究》一文中研究指出网络搜索引擎中的排名运算方法当中,有一个非常重要的因素就是外部链接,因而通过这种链接进行作弊的问题常常会发生于网络当中。而暗链则是其中的一种作弊手法,其很难被监测且难以得到有效的去除,因而有"互联网牛皮癣"之称。对此,在文中笔者给出了以机器学习为基础的互联网暗链检测方法,并结合网络源码文本特征进行了相关方面的研究工作。(本文来源于《计算机产品与流通》期刊2019年10期)

刘志惠,黄志刚,谢合亮[2](2019)在《大数据风控有效吗?——基于统计评分卡与机器学习模型的对比分析》一文中研究指出随着金融科技的巨大进步,机器学习在金融风控领域的应用也逐渐深化起来。信用评分卡模型作为一种应用最为广泛的风险评估模型,在大数据时代存在着不能对高维、复杂、非线性的个人征信数据进行全面分析的局限性。从中国的互联网金融发展的实际情况出发,提出一种基于XGBoost机器学习算法的互联网金融风控模型,并与传统的统计评分卡模型进行了对比试验,同时给出了将机器学习模型预测结果转化为传统信用评分的解决方法。研究结果表明,机器学习模型能更好地预测个人信用风险,从而构建更加有效的风控体系。(本文来源于《统计与信息论坛》期刊2019年09期)

郭银娟[3](2019)在《基于多元统计和机器学习的成绩分析及研究》一文中研究指出以学生的考试成绩作为选拔人才的主要方法,在我们的日常生活中早已屡见不鲜。从素质教育的学生时代到成人的职场生活,考试成绩一般都会是衡量我们能力的重要指标。尤其是在素质教育的中学时代,大到重要的升学考试,小至各种各样的随堂测试,这样海量的成绩数据充斥在学生和教师周围,但是对这些数据的使用,学校教师和学生有时为了方便仅限于一些简单的描述性统计分析,这不仅仅造成这种数据资源的浪费,而且对于教师管理学生不能够及时提供有效的、科学的、全面的、有针对性的建议。所以,能够找到一种适用范围广,有学习能力的数据分析的技术来对学生的成绩进行分析,透过数据表面,找出潜藏在繁冗数据中的关键的、有利的信息,变得十分必要。本文首先介绍了多元统计分析中聚类分析和因子分析的理论知识,重点介绍了对变量进行聚类的R型聚类,因子分析中主要介绍了主成分法的参数估计方法及方差最大的正交旋转。接着介绍了机器学习中的k近邻法分类与支持向量机分类两种分类方法的基本原理及思想。随后本文选取某具有代表性的学校的高一学生的几次综合成绩进行实例分析,通过R型聚类分析将原始的九个变量聚成叁类,再运用因子综合评价模型进行因子分析,提取出了第一因子理科思维能力因子、第二因子语言思维能力、第叁因子文科思维能力叁个有效因子,发现此时提取的叁个有效因子与聚类分析得到的叁类完全符合,说明因子分析的结果比较有意义,随后再根据理科思维能力、语言思维能力、文科思维能力叁个因子的因子得分情况对学生进行科学地归类,如第一因子理科思维能力因子得分最大则归为第一类,第二因子语言思维能力得分最大归为第二类,第叁因子文科思维能力得分最大归为第叁类。接着运用机器学习中的k近邻法和支持向量机分类对已经归为叁类的样本进行拟合,根据十折交叉验证的误判率最小原则选择出支持向量机的ksvm函数分类为相对最优的分类器模型。今后可运用该支持向量机的ksvm函数对学生的成绩进行预测分类,该支持向量机的分类器模型为学生的成绩分析研究提供了一个科学的模型。(本文来源于《湘潭大学》期刊2019-04-30)

卢红波[4](2019)在《统计机器学习模型SVM的对抗算法研究》一文中研究指出统计机器学习的应用广泛,如人脸识别,自然语言处理等,本文研究的对抗算法则是从安全性出发,旨在确保应用免于受到外来攻击,增强鲁棒性,而支持向量机是目前理论最完备、应用最广的一类机器学习算法,本文将其作为研究对象。本文工作如下:(1)针对具体应用——入侵检测系统,本文提出一种基于SVM入侵检测系统的新颖攻击方法——毒性攻击,该方法通过篡改污染训练数据,进而误导SVM的机器学习过程,降低入侵检测系统的分类模型对攻击流量的识别率;从攻击流量的召回率和精度这两个指标对攻击效果进行评估,实验表明毒性攻击可有效的降低入侵检测系统的识别率;(2)针对图像数据,采用一种基于粒子群优化的对抗样本生成算法,本文提出了SVM攻击显着性特征的概念,在容易处理线性模型的特征空间寻找攻击显着特征,再逆映射回输入空间完成原始样本的扰动,充分利用了特征空间上线性模型上易寻优的特点,同时又利用了原始输入空间篡改数据的可解释性优点;在Yale人脸数据库在7%扰动量下分类正确率降至40%以下。根据对统计机器学习算法SVM具体应用的深入研究,本文研究了对抗条件下算法的鲁棒性不足问题,给出了防御的建议和思路,为进一步研究SVM安全性提供了一定基础。(本文来源于《浙江科技学院》期刊2019-03-30)

虞水磊,田新宇,王金燕[5](2019)在《基于多元统计分析和机器学习的验证码识别》一文中研究指出针对带有噪声点与粘连的验证码图像,使用DBSCAN聚类与竖直投影法做去噪与分割处理,提出了基于AdaBoost方法的半监督Kmeans聚类算法。基于此算法对分割的单个字符图像进行了批量标注,在聚类结果的基础上使用Fisher判别、随机森林、K近邻、神经网络、支持向量机等方法进行训练并识别验证码测试数据集,比较各算法的识别效果,揭示所研究的验证码不安全的可能性.(本文来源于《山东理工大学学报(自然科学版)》期刊2019年01期)

陈霍兴,张俊,海龙[6](2018)在《基于机器学习的输电线路故障统计与分析》一文中研究指出本文对输电线路故障的影响因素进行分析,用相关性系数描述输电故障和气象数据之间关系。通过分析得出了气象数据中的温度、湿度、风速、气压和故障之间的相关性强度。通过对数据特征展开研究,以及对机器学习相关算法模型、关键算法组件的应用及验证,为输电线路故障分析提供有力的技术支撑。(本文来源于《科技资讯》期刊2018年34期)

蒋雍建,程楠,刘泽佳,周立成,汤立群[7](2018)在《基于响应统计特征和机器学习的桥梁损伤识别方法研究》一文中研究指出本文基于交通控制理论的元胞自动机模型和实测车流数据建立随机车流模型,并将车流荷载作为珠江黄埔大桥北汊桥有限元模型的外在激励,在获得桥梁响应统计信息的基础上,结合多种机器学习方法提出了一种结合桥梁响应统计信息的损伤识别方法。首先对斜拉索损伤前后的斜拉桥进行静力响应分析,确定主梁上响应变化较大的关键测点,并探讨随机车流作用下关键测点响应变化的统计规律,将应变差值的统计特征参数作为损伤识别的指标。通过不同损伤工况下的有限元计算建立响应统计特征的样本库,利用随机森林、逻辑回归、梯度提升决策树等机器学习方法对斜拉索损伤位置进行识别,并通过准确率来判定各方法的识别效果。结果表明,逻辑回归和随机森林方法具有更好的识别效果,同时混合训练模式的识别效果明显高于单一训练模式的识别效果。(本文来源于《2018年全国固体力学学术会议摘要集(下)》期刊2018-11-23)

刘长征,杜良敏,单怀翰[8](2018)在《机器学习建模方法在我国月降水统计降尺度预测中的初步应用》一文中研究指出降水预测是气候预测业务工作的一个核心部分。尽管模式已经成为气候预测最重要的工具,但由于模式直接的降水预测技巧较低缺乏直接使用的价值,误差订正和统计降尺度等技术被广泛用来改进模式降水预测~([1-4])。但是,迄今常用的误差订正和统计降尺度技术通常基于传统的多元线性回归来实现~([3-6]),从而无法有效处理预报量时间序列不稳定和预报因子间存在共线性两种情况,这使得预测性能的提升受到了明显的限制。为此,作者设计了一个新统计降尺度方案,引进机器学习领域中的LASSO、岭回归、Huber回归、随机森林、决策树等最新的统计建模技术进行试验(图1)。基于国家气候中心MODES多模式数据集,新方法对2013年1月至2016年12月我国160站月平均降水预测业务进行了后报实验,预测结果与国家气候中心MODES业务系统同期预测进行了对比。研究表明,以Huber回归为例,采用机器学习新建模方法预测我国月降水的PS评分与MODES系统基本相同,但较后者大幅度提高了我国月降水空间相关系数的技巧(图2),从而能够很大程度上弥补现有MODES的短板。以上研究显示机器学习的新建模方法在模式误差订正、统计降尺度等领域有很大的应用潜力。(本文来源于《第35届中国气象学会年会 S7 东亚气候、极端气候事件变异机理及气候预测》期刊2018-10-24)

焦会英[9](2018)在《基于机器学习算法的视频人数统计方法研究》一文中研究指出行人检测技术是智能交通视频分析的基础技术之一,也是计算机视觉中的关键技术。行人检测技术对于监控场景中的行人行为分析,行人计数、安全监控,以及无人驾驶系统都有非常重要的意义。传统的视频图像行人计数算法的统计过程依赖于行人目标检测和跟踪算法,现实生活中由于人体形态的多样性,监测环境的复杂性,天气变化和光照变化的影响,特别是行人间相互遮挡、重迭与合并使得行人检测存在着许多亟待解决的问题。在传统的行人检测算法中,如何设计或选择出一个与其他的类别之间差异大,而行人之间差异小且不受行人间相互遮挡以及光照条件等多样性因素影响的特征,以及训练出一个区分力强的分类器是当前领域研究的重点。目前,最具代表性且应用最广泛的算法是HOG+SVM[8]行人检测算法。然而,该算法需要提取的特征区域信息较大,尤其在复杂的环境下很难达到理想的检测效果(当人群间出现遮挡、重迭与合并时,该算法对行人计数的准确性影响较大)。随着机器学习算法的发展,深度学习成为学者和研究人员关注的重点领域,依据大数量的训练数据和参数输入,深度学习算法能自动地结合不同的分类任务从大量的数据中学习并提取特征,使其在目标分类和目标检测领域表现出了非常优秀的检测准确率、鲁棒性、场景的普适性。尽管如此,基于深度卷积神经网络的行人检测算法还是存在一定的缺点:更适用于静态图片行人检测,无法关联行人的运动信息,导致每帧视频图像的行人检测结果和计数结果与相邻视频帧的检测计数结果是相互独立的。本文对行人检测计数方法和深度学习相关技术进行了充分的调研,在此基础上总结了行人检测方法在实际应用中存在的主要难点和问题,对基于传统的行人检测计数方法和基于深度学习的行人检测方法都做了重点研究,取得的主要研究成果如下。(1)针对现有传统视频行人计数方法需要进行复杂的特征提取,且在应用中难以处理人群出现遮挡、重迭与合并等复杂情景,本文提出一种改进GHT+KSP算法的视频人数统计方法,它主要利用行人头部轮廓特征做行人检测。本方法提出并创建了一个灰度判决器,判断每个由GHT类圆检测方法检测出的圆形轮廓是否为真实的头部轮廓;并且提出头部轮廓聚合方法,将每个真实头部区域出现的多个头部轮廓检测结果合并为一个头部真实轮廓检测结果,并对其进行优化。由于人类头部轮廓在俯视视频图像中都是分散存在,此算法能够较好解决使用其他特征时难以处理的行人遮挡情况。且特征提取与聚合方法简单,分类判决器复杂度低,可以满足对检测速度的要求。(2)针对深度学习的目标行人检测方法,本文提出在稀疏目标场景下融合卷积神经网络和视频运动信息的视频行人检测方法。算法的创新点为:将背景建模的研究方法和基于统计学习的深度卷积神经网络研究方法相结合,融合所有的行人检测结果标定框;提出行人检测标定框优化计数方法,采用非极大值抑制方法根据实验经验设置检测框大小边界,减除冗余结果标定框结果,并根据标定框像素面积确定框内行人的数目;最后提出了行人计数评估方法,平滑融合后的行人计数结果。综上所述,本文对视频人数统计方法进行了深入研究,实验结果充分验证了提出算法的有效性和实用性。(本文来源于《北京交通大学》期刊2018-06-01)

雷玉超[10](2018)在《基于机器学习的羽毛球技术特征统计与步伐训练的研究与实现》一文中研究指出从互联网、移动互联网到云计算、大数据,再到机器学习、人工智能,十多年来,信息技术的日新月异不断改变着人们的生产与生活方式,新技术的迭代与数字化创新的浪潮推动着传统行业的变革。随着机器学习与人工智能的快速发展,社会逐步迈入智能化时代,一系列基于机器学习与人工智能的研究成果和智能化产品应运而生,如百度智能语音视觉机器人小度,谷歌智能围棋高手AlphaGo等等,由此形成的“人工智能+”新产业革命浪潮正在快速向各个领域渗透。本文将机器学习方法应用于羽毛球击球动作的分类与识别,并在此基础上构建了羽毛球技术特征统计与步伐训练系统,论文的主要创新工作和成果包括:(1)提出了一种羽毛球击球动作识别算法,并在此基础上实现了一套羽毛球动作实时识别系统。该系统采用固定在羽毛球拍柄尾端的单个加速度传感器进行羽毛球动作的数据采集,使用滑动窗口数据分割技术进行击球信号的提取,提出了动作分帧结合k-means等无监督式学习算法进行聚类特性评估和矢量量化。通过探索隐马尔可夫模型(HMM,Hidden Markov Model)的模型特点与算法训练方式,提出了一种改进HMM训练方式的模型算法用于识别常见的十种羽毛球击球动作,包括发球、正手搓球、反手搓球、正手扑球、反手扑球、正手推球、反手推球、正手挑球、反手挑球、正手高远。实验表明,本文所设计的算法模型系统可对十种常见的击球动作进行实时识别,改进HMM较传统HMM平均识别率提升了 6.4%,最终击球动作的综合识别率可达94%。(2)羽毛球技术特征统计与步伐训练系统的设计与实现。本文基于上述羽毛球动作识别算法及其它相关算法(如得分与失误评判算法、步伐还原算法等),构建了一套羽毛球技术特征统计与步伐训练系统,该系统实现了羽毛球比赛的技术统计和球员的步伐训练两大功能。其中技术统计主要包含球员的每个击球动作的得分与失误,各种击球动作的技术特征指标等信息;步伐训练则主要针对实战中常用的几种羽毛球被控步伐进行了定量分析与对比实验,实现了对运动员特定步伐的有针对性训练。系统测试实验表明,技术统计功能数据综合准确率为96.7%,球员步伐训练系统能准确测量球员的步伐信息且有助于快速提高球员的步伐水平。以上研究解决了从数据采集到算法编程的软硬件工程技术难题,提供一个羽毛球运动智能分析与辅助训练的功能平台,可以推广应用于更多的专业运动员和教练员,从而积累大量数据,提炼出更多符合羽毛球运动自身规律的技术指标参数,最终形成一套羽毛球运动智能分析与辅助训练专业产品。(本文来源于《华中师范大学》期刊2018-05-01)

统计机器学习论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着金融科技的巨大进步,机器学习在金融风控领域的应用也逐渐深化起来。信用评分卡模型作为一种应用最为广泛的风险评估模型,在大数据时代存在着不能对高维、复杂、非线性的个人征信数据进行全面分析的局限性。从中国的互联网金融发展的实际情况出发,提出一种基于XGBoost机器学习算法的互联网金融风控模型,并与传统的统计评分卡模型进行了对比试验,同时给出了将机器学习模型预测结果转化为传统信用评分的解决方法。研究结果表明,机器学习模型能更好地预测个人信用风险,从而构建更加有效的风控体系。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

统计机器学习论文参考文献

[1].李艳.基于统计机器学习的互联网暗链检测方法研究[J].计算机产品与流通.2019

[2].刘志惠,黄志刚,谢合亮.大数据风控有效吗?——基于统计评分卡与机器学习模型的对比分析[J].统计与信息论坛.2019

[3].郭银娟.基于多元统计和机器学习的成绩分析及研究[D].湘潭大学.2019

[4].卢红波.统计机器学习模型SVM的对抗算法研究[D].浙江科技学院.2019

[5].虞水磊,田新宇,王金燕.基于多元统计分析和机器学习的验证码识别[J].山东理工大学学报(自然科学版).2019

[6].陈霍兴,张俊,海龙.基于机器学习的输电线路故障统计与分析[J].科技资讯.2018

[7].蒋雍建,程楠,刘泽佳,周立成,汤立群.基于响应统计特征和机器学习的桥梁损伤识别方法研究[C].2018年全国固体力学学术会议摘要集(下).2018

[8].刘长征,杜良敏,单怀翰.机器学习建模方法在我国月降水统计降尺度预测中的初步应用[C].第35届中国气象学会年会S7东亚气候、极端气候事件变异机理及气候预测.2018

[9].焦会英.基于机器学习算法的视频人数统计方法研究[D].北京交通大学.2018

[10].雷玉超.基于机器学习的羽毛球技术特征统计与步伐训练的研究与实现[D].华中师范大学.2018

标签:;  ;  ;  ;  

统计机器学习论文-李艳
下载Doc文档

猜你喜欢