- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号CN102663065A
(43)申请公布日2012.09.12
(21)申请号CN201210091932.2
(22)申请日2012.03.30
(71)申请人浙江盘石信息技术有限公司
地址310011浙江省杭州市拱墅区北部软件园C区祥园路45号
(72)发明人李嘉骅曹晓波田宁谭磊刘崟
(74)专利代理机构杭州宇信知识产权代理事务所(普通合伙)
代理人张宇娟
(51)Int.CI
权利要求说明书说明书幅图
(54)发明名称
一种广告位异常数据识别和筛选方
法
(57)摘要
本发明公开了一种广告位异常数据
识别和筛选方法,包括如下步骤:S10:设
置广告位量化评估指标;S11:处理并存储
广告位量化评估值;S12:对广告位进行聚
类,根据聚类结果得到可参照标准广告
位;计算实际广告位与标准广告位的相似
性,以最短距离找到实际广告位所属的标
准广告位;S13:以标准广告位分位数为依
据设立上下限并计算各广告位的偏差,按
偏差大小进行筛选和排序。本发明依据聚
类算法进行各广告位分类,避免按行业或
其它人工分类方式带来的主观性,分类内
广告位相似度最高,使用的距离计算方法
对定性定量指标均能处理,且于量纲无
关,广告位偏差计算以分位数为依据,能
有效避免极端值对分类产生影响。
法律状态
法律状态公告日法律状态信息法律状态
权利要求说明书
1.一种广告位异常数据识别和筛选方法,其特征在于,包括如下步骤:
S10:设置广告位量化评估指标;
S11:提供一存储单元,以存储广告位量化评估值;
S12:提供一计算单元,以对广告位进行聚类,根据聚类结果得到可
参照标准广告位;计算实际广告位与标准广告位的相似性,以最短距离找
到实际广告位所属的标准广告位;
S13:提供一筛选和排序单元,以标准广告位分位数为依据设立上下
限并计算各广告位的偏差,按偏差大小进行筛选和排序。
2.如权利要求1所述广告位异常数据识别和筛选方法,其特征在于,在步
骤S10中,具体包括:
在媒体网站上放置监控代码,捕获评估信息;然后,根据所获取的评
估信息,构造一组广告位量化评估体系AdV,指标集I={Isub1/sub,
Isub2/subΛ,Isubj/sub,Λ,Isubn/sub},
Isubj/sub(1≤j≤n),其中,n是评估指标的个数,ad.Isubj/sub是广告
位在Isubj/sub指标下的数值。
3.如权利要求2所述广告位异常数据识别和筛选方法,其特征在于:所述
评估信息包括有广告位流量、点击量、点击单价、展示时间。
4.如权利要求3所述广告位异常数据识别和筛选方法,其特征在于,在步
骤S11中,包括有如下步骤:
设置一预处理单元,从监控系统生成的原始日志文件中提取信息,对
数据进行清洗后存入存储单元;
设置一赋值单元,对存储于存储单元中的所有广告位评估信息数据赋
于权重值。
5.如权利要求4所述广告位异常数据识别和筛选方法,其特征在于,在步
骤S12中,包括有如下步骤:
按行业划分广告位,以各行业广告位均值作为初始标准广告位,
adcsub1/sub,adcsub2/sub,...,adcsubk/sub,其中,k为行
业个数,而m是第i个广告位所属行业的广告位总数;
计算各个广告位到初始标准广告位adcsubi/sub的距离D={dsub1/sub,
dsub2/sub,Λ,dsubn/sub}。
6.如权利要求5所述广告位异常数据识别和筛选方法,其特征在
文档评论(0)