点击欺诈论文-郭汉,帅仁俊,张欣,李鑫

点击欺诈论文-郭汉,帅仁俊,张欣,李鑫

导读:本文包含了点击欺诈论文开题报告文献综述及选题提纲参考文献,主要关键词:点击欺诈,不平衡,集成特征选择,Bagging

点击欺诈论文文献综述

郭汉,帅仁俊,张欣,李鑫[1](2019)在《基于集成特征选择的点击欺诈检测方法》一文中研究指出网络在线广告中以套取广告费为目的的点击欺诈已经严重影响了网络广告的稳定发展。从FDMA2012竞赛提供的欺诈发布商检测的真实数据集出发,针对冗余特征会降低训练效率以及不平衡数据会使决策边界发生偏倚的问题,提出了一种基于集成特征选择的网络在线广告点击欺诈检测方法。采用Bagging方法和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)相结合的方法将多数的正常点击广告发布商样本与少数的欺诈点击广告发布商样本构造为多个袋装子集,利用基于相关性度量的特征选择算法对每个袋装子集中筛选出特征子集,设置阈值得到特征合集,利用随机森林算法构建点击欺诈检测模型。实验结果表明该方法能够有效识别出实施欺诈点击行为的非法发布商,达到网络在线广告中点击欺诈检测的要求。(本文来源于《计算机工程与应用》期刊2019年17期)

李鑫,郭汉,张欣,胡方强,帅仁俊[2](2018)在《基于非平衡数据处理方法的网络在线广告中点击欺诈检测的研究》一文中研究指出网络在线广告中以套取广告费为目的的点击欺诈检测是机器学习应用的重要内容之一。支持向量机(Support Vector Machine,SVM)是一种优秀的解决二分类和回归问题的机器学习算法,但应用于网络在线广告中的欺诈点击检测时,由于数据集的极端非平衡性,算法性能受到极大的限制。从FDMA2012竞赛欺诈发布商检测的真实数据集出发,在详细研究与对比了3种非平衡数据处理方法后,选取最佳的混合采样方法对原始数据进行处理,再将其应用于SVM分类器。实验结果表明,所提方法能够有效识别实施欺诈点击行为的非法发布商,准确度达到95%左右,满足了网络在线广告中点击欺诈检测的要求。(本文来源于《计算机科学》期刊2018年S1期)

张欣,刘学军,李斌,郭汉[3](2018)在《一种网络广告点击欺诈检测的SVM集成方法》一文中研究指出针对以套取广告费为目的、实施恶意点击欺诈的不法发布商检测问题,提出一种基于支持向量机(Support Vector Machine,SVM)集成方法的点击欺诈检测系统.该系统首先对几百万条原始点击数据进行一系列数据清洗、整理和统计特征计算等数据预处理,之后利用随机欠抽样(RUS)与合成少数类过抽样技术(SMOTE)相结合的方法处理非平衡数据集得到多个平衡数据集,在每个平衡数据集上分别利用Boosting算法对训练得到基支持向量机迭代生成多个强分类器模型,最后再将多个强分类器以投票方式进行集成得到最终的检测模型.在真实点击数据上完成对广告发布商的点击欺诈检测,实验结果表明,该方法对点击欺诈有良好的检测性能,其检测准确度在90%以上.(本文来源于《小型微型计算机系统》期刊2018年05期)

董亚楠,刘学军,李斌[4](2016)在《一种基于用户行为特征选择的点击欺诈检测方法》一文中研究指出在线广告是目前众多网络巨头收入的主要来源,在线广告也为网络的健康发展提供了强大的经济支撑。目前,利用用户行为属性特征来识别点击欺诈的方法中,含有较多的冗余特征,检测效率相对较低。针对这一问题,提出了一种属性特征选择与分类方法相结合的欺诈检测方法。通过训练数据集找到欺诈用户点击广告的属性特征集合,采用Fisher分方法得到了属性特征重要度排序,选取重要属性特征,并基于这些重要的特征使用支持向量机二分类方法分类。在真实数据集上的实验结果证明了该方法的可行性与有效性。(本文来源于《计算机科学》期刊2016年10期)

母路明[5](2016)在《移动万维网中广告点击欺诈检测技术的研究》一文中研究指出随着近几年移动互联网的蓬勃发展,移动网民数量的不断增加,移动广告具有精准性、即时性、互动性、扩散性等特点,从而受到越来越多的广告主的青睐,广告主通过移动广告平台投放广告到移动设备的APP或网站上。而最常见的广告计费模式是按点击收费(CPC),用户在APP或网站上点击广告,广告主为用户的点击付费,移动广告平台和广告发布商(APP开发者或网站)获取广告费用。因为CPC收费模式的存在,点击欺诈就成为可能,有些广告发布商为了谋取高额广告费分成,就会雇佣大量人力物力或使用程序去点击在自己APP或网站上的广告。这种点击欺诈的出现,对移动互联网广告业造成了极大的危害。本文主要研究了移动广告点击欺诈现象的根源,并对国内外广告点击欺诈的应对策略和检测方法进行深入分析。由于点击欺诈者只占总数的一小部分,针对这个特点本文从两个角度考虑检测点击欺诈:第一个是把它看成一个不平衡分类问题,采用SMOTE采样对数据集进行均衡化处理,利用集成学习算法进行点击欺诈检测,实验结果表明,这个方法能够有效的检测点击欺诈。第二个是从离群点挖掘的角度检测点击欺诈,本文提出一种改进的基于密度的离群点检测算法,将本文提出的算法应用到点击欺诈检测上,实验结果表明,本文改进的算法比未做改进的基于密度的离群点挖掘算法有更好的结果。(本文来源于《西南交通大学》期刊2016-06-07)

乔晨蕊[6](2015)在《网络广告中的点击欺诈检测方法研究》一文中研究指出随着互联网技术的飞速发展,网络服务已经渗透到了生活的方方面面,人们也逐渐形成了对网络信息的依赖,在网站中投放广告的方式已经成为目前网络中重要的宣传策略,同时也成为各个互联网公司重要的财政收入之一。目前国内外对于点击欺诈检测的相关研究,主要分为改进付费模式、验证码预防和数据分析检测叁个方向。然而,对于点击欺诈的检测,仍存在广告商难以接受改变当前按点击付费的商业模式,验证码机制降低用户的体验好感,数据分析检测难以确定用户身份、数据庞大致使分析效率低等问题。本文针对以上这些问题,借鉴目前对点击欺诈检测的相关研究成果,在不改变计费模式的前提下,提出了一种基于分布式环境的点击欺诈检测模型。该点击欺诈检测模型主要包括数据采集、用户身份识别以及并行欺诈检测叁个部分。数据采集模块通过客户端代码采集浏览器指纹、EverCookie存放数据来进行用户身份识别,同时采集点击相关数据进行并行欺诈检测;用户身份识别模块主要通过浏览器指纹识别和EverCookie投放相结合的方式对用户的身份进行识别;并行欺诈检测模块分为并行统计分析和并行可疑性分析,基于Hadoop分布式环境对用户点击数据进行并行分析检测。在本文的最后,通过实例数据对所研究的分析检测过程进行实验验证,结果表明本文提出的算法能够改进当前点击欺诈检测算法存在问题,在点击欺诈检测的效率和准确率方面有了明显提升,能够对网络广告中的点击欺诈行为进行可靠的检测。(本文来源于《哈尔滨工程大学》期刊2015-12-01)

董亚楠,刘学军,李斌,章玮[7](2016)在《点击欺诈群体检测与发现》一文中研究指出针对目前存在大批网络用户,以群体形式来欺诈点击的问题,提出了一种检测点击欺诈群组的方法。首先使用频繁项集挖掘算法来发现共同点击过大量广告的个体用户,作为疑似欺诈组。然后,在对组内用户点击行为属性分析的基础上,运用孤立点检测方法找到与组内其他用户有显着差异的疑似欺诈用户。最后,运用贝叶斯分类方法对检测到的所有疑似欺诈成员分类,得到真正的欺诈群组和欺诈用户。在真实的数据集上进行的实验,验证了该方法的可行性和有效性。结果表明,该方法为点击欺诈检测问题提供了一条新的思路。(本文来源于《计算机应用研究》期刊2016年06期)

苏亚东[8](2014)在《关键词广告中点击欺诈问题研究》一文中研究指出在互联网飞速发展的背景下,网络用户和网页数量快速增长,搜索引擎已然成为网络用户搜索有效信息的重要渠道。与此同时,搜索引擎利用平台优势推出的关键词广告成为其主要的盈利手段,也逐渐成为学术探索研究的热点。搜索引擎在关键词广告推广过程中普遍采用按点击付费的收费方式,在这种支付规则下,只要广告被点击,广告主就应支付相应的广告费用,导致点击欺诈问题的产生。点击欺诈将会造成广告主的费用流失,却不会产生任何有效价值,近年来点击欺诈问题愈演愈烈,已经成为阻碍关键词广告产业发展的一大顽疾。在此背景下,本文首先在搜索引擎广告位拍卖中应用最广泛的广义次价拍卖(GSP)规则下,考虑点击欺诈因素,构建两阶段竞价模型和广告主收益模型,探讨了广告主将如何调整报价和最大点击容量,以及自身收益的变化等问题。然后考虑到关键词广告市场上存在优质广告发布商和劣质广告发布商,基于广告主企业如何补偿优质广告发布商,建立延期支付补偿模型;基于广告主如何识别劣质广告发布商,构建识别概率模型,着重研究了通过延期支付,在保证广告主收益不变的情况下能否有效地剔除劣质广告发布商,另外探讨了延期支付时间与广告主收益两者之间存在的关系,以及是否存在一个最优延期时间以实现广告主收益的最大化等问题。研究结果显示:在不考虑点击欺诈因素的两阶段竞价规则下,真实估价是广告主的最优报价;引入点击欺诈因素后,广告主根据所拥有点击欺诈的信息降低相应的报价,在广告位竞争不激烈的情况下能够实现收益的不变,而在广告位竞争激烈的情况下,反而实现广告主的收益增加。研究还表明,延期支付将增加优质广告发布商的收益,且满足相应条件的延期支付既能够剔除全部劣质广告发布商,同时实现广告主的收益增加。通过数值分析表明,广告主的收益随延期支付时间的延长,呈现出先增后减的变化,且存在最优延期时间实现广告主的收益最大。上述研究及相关结论,为广告主如何防范点击欺诈提供了理论参考和决策启示。(本文来源于《重庆大学》期刊2014-04-01)

任亚缙[9](2014)在《基于ASIRRA的预防点击欺诈改进算法》一文中研究指出点击欺诈现象的发生,使得点击付费模式受到质疑。针对点击付费模式中点击欺诈的问题,在研究多种点击欺诈防止方法的基础上,提出一种改进的图形验证码的预防点击欺诈算法,其引入ASIRRA验证码,结合点击频率及浏览时间来预防点击欺诈,通过实验测试验证该算法预防点击欺诈的有效性,尤其是自动点击欺诈,同时较好地防止潜在用户流失。(本文来源于《信息通信》期刊2014年03期)

李宝镜[10](2013)在《搜索引擎广告中策略性出价和点击欺诈问题的研究》一文中研究指出随着网络用户和网页数量的膨胀性增长,搜索引擎已经成为连接用户和网站之间的重要桥梁。搜索引擎利用该平台推出的搜索引擎广告得到了快速发展,目前已成为搜索引擎的主要收入来源,吸引了研究学者的广泛关注。在过去的10几年中,搜索引擎广告在快速发展的同时,也存在着一些问题,本文主要研究其中的两个方面:广告主策略性出价和点击欺诈。策略性出价是指在搜索引擎拍卖中广告主不断的调整竞价以最小的成本获得更高的广告位的行为,该行为造成搜索引擎结果页面中广告排序的频繁变化,降低了搜索引擎的稳定性,影响拍卖的效率。在这一背景下,本文考虑在普遍采用的广义次价拍卖(GSP)机制中引入广告主的出价权重因素,在连续时期交替出价的拍卖中,广告主权重因素的大小只与其在上一时期获得的广告位有关,且广告位越好则当期的权重值越高,增加广告主之间偏离现有均衡的成本,以期提高搜索引擎的稳定性。此外,本文还研究了权重因素的引入对广告主出价以及搜索引擎收入等方面的综合影响。根据搜索引擎百度的定义,点击欺诈是指所有利用欺诈性手段或带有欺诈意图并被搜索引擎所承认的点击行为。点击欺诈的存在浪费了广告主的广告费用,却不会给广告主带来任何可能的价值,被看作是点击支付机制(PPC)采用以来遭遇的最大问题。现有的对点击欺诈问题的研究相对较少,并且主要是研究如何开发更优的技术提高搜索引擎预防和阻止点击欺诈的能力。在点击欺诈问题中,欺诈性点击操作者能够从恶意点击中获得更多的收入或者是更好的广告位,有动机积极实施点击欺诈。从这一背景出发,考虑从优化搜索引擎筛选技术和消除操作者的经济动机两方面综合分析,提出解决点击欺诈问题的对策。本文的研究结果主要有:与原始的GSP机制相比,在加入广告主出价权重因素后的新机制下,当广告主之间形成稳定均衡时,搜索引擎的稳定性提高;当广告主竞价形成“Edgeworth循环”时,广告主之间的竞争更加激烈,搜索引擎的收入增加。总的来说,在短期内,引入广告主出价权重因素提高了搜索引擎的稳定性,但是降低了其收入;从长期来看,权重因素能够同时提高搜索引擎的稳定性和收入。对于点击欺诈问题,本文在总结以往研究文献的基础上,分析搜索引擎在解决该问题上的积极性和有效性以及点击欺诈操作者实施点击的经济动机,指出解决点击欺诈问题关键在于如何消除点击欺诈操作者的经济动机,并建立广告主、发布商和搜索引擎之间的信任。在此基础上,本文提出了一些可行性的建议并进行了具体分析,对搜索引擎解决点击欺诈问题提供了理论指导。(本文来源于《重庆大学》期刊2013-04-01)

点击欺诈论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

网络在线广告中以套取广告费为目的的点击欺诈检测是机器学习应用的重要内容之一。支持向量机(Support Vector Machine,SVM)是一种优秀的解决二分类和回归问题的机器学习算法,但应用于网络在线广告中的欺诈点击检测时,由于数据集的极端非平衡性,算法性能受到极大的限制。从FDMA2012竞赛欺诈发布商检测的真实数据集出发,在详细研究与对比了3种非平衡数据处理方法后,选取最佳的混合采样方法对原始数据进行处理,再将其应用于SVM分类器。实验结果表明,所提方法能够有效识别实施欺诈点击行为的非法发布商,准确度达到95%左右,满足了网络在线广告中点击欺诈检测的要求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

点击欺诈论文参考文献

[1].郭汉,帅仁俊,张欣,李鑫.基于集成特征选择的点击欺诈检测方法[J].计算机工程与应用.2019

[2].李鑫,郭汉,张欣,胡方强,帅仁俊.基于非平衡数据处理方法的网络在线广告中点击欺诈检测的研究[J].计算机科学.2018

[3].张欣,刘学军,李斌,郭汉.一种网络广告点击欺诈检测的SVM集成方法[J].小型微型计算机系统.2018

[4].董亚楠,刘学军,李斌.一种基于用户行为特征选择的点击欺诈检测方法[J].计算机科学.2016

[5].母路明.移动万维网中广告点击欺诈检测技术的研究[D].西南交通大学.2016

[6].乔晨蕊.网络广告中的点击欺诈检测方法研究[D].哈尔滨工程大学.2015

[7].董亚楠,刘学军,李斌,章玮.点击欺诈群体检测与发现[J].计算机应用研究.2016

[8].苏亚东.关键词广告中点击欺诈问题研究[D].重庆大学.2014

[9].任亚缙.基于ASIRRA的预防点击欺诈改进算法[J].信息通信.2014

[10].李宝镜.搜索引擎广告中策略性出价和点击欺诈问题的研究[D].重庆大学.2013

标签:;  ;  ;  ;  

点击欺诈论文-郭汉,帅仁俊,张欣,李鑫
下载Doc文档

猜你喜欢