marp用于模式匹配的众包发包优化策略.pptVIP

marp用于模式匹配的众包发包优化策略.ppt

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
marp用于模式匹配的众包发包优化策略

MarP:用于模式匹配的众包发包优化策略 MarP: A Optimized Strategy for Publishing Questions in Schema Matching Via Crowdsourcing 汇报人:许坤 目录 引言 1 问题描述 2 问题发布过程中边际点的判断方法 边际收益递减的发包问题排序方法 3 4 5 实验结果与分析 6 结论 引言 1 研究背景 随着云计算、物联网等技术的兴起,数据正以前所未有的速度在不断地增长和累积, 使用自动化的模式匹配工具能大大节省匹配时间提高匹配效率, 但匹配的结果是带有不确定性的,且难以消除。通过众包的方式可以帮助减少不确定性。 模式 匹配 不确 定性 MarP 大数据 云计算 物联网 模式匹配工具 OntoBuilder COMA LSD 众包 人工成本昂贵 精确度 成本 2 MarP策略 问题描述 常用的众包发包方法: 最小化费用和时间成本 使解决问题的精确度达到最大 MarP (Marginal Principle)发包策略: 从发包成本和解决问题的精确度两个角度出发,在成本不大于预算的情况下,使 收益与成本之差最大。 根据边际原理递减的思想,发布问题的顺序所得到的收益递减。 在发包的过程中如何判断边际收益点,即总收益和成本差值 最大时候的点。 文献[6]中提出的GCER算法以及文献[7]的发包思想。 文献[1]中的SCCQ发包方法,以及文献[8]的思想。 (1) 3 边际收益递减 发包问题排序 一种基于熵的方法,用于对发布问题所能带来的模式匹配结果集不确定性的减少大小进行预测。根据预测的结果可以实现对发包问题的排序。 发包问题正确的概率: 发包问题所能引起结果集不确定性减少大小的熵 以及期望。: (2) (3) 当E(?HQc) 越大表示问题Qc 对匹配结果集(RS)的不确定性的改变越大,选择E(?HQc)值为最大的问题作为最佳问题首先发布。 4 边际点的判断 边际点:qx 边际原理 5 实验设置 实验与结果分析 对比方法: Random SCCQ 自动化模式匹配工具: OntoBuilder 数据源: 水文气象数据(HD) 沉淀物粒度数据(SG) 海水浴场数据(BB) 海洋大气质量检测数据(MA)。 实验所用平台: 新浪微博平台 图3 实验与结果分析 6 仿真实验 三种方法发包数量与减少不确定性结果曲线图表 方法精确度对比图表 方法成本对比图表 MarP以及SCCQ方法相较于Random方法在减少模式匹配不确定性大小的程度都要优于Random方法。 MarP方法的发包成本要远远少于SCCQ方法以及Random方法,但是MarP方法对解决问题的精确度远高于Random方法。 图1 图2 图3 7 志愿者实验 实验与结果分析 三种方法发包数量与减少不确定性结果曲线图表 方法成本对比图表 方法精确度对比图表 招募志愿者实验与模拟实验结果大致相同 随着问题发布数量的增加,模式匹配不确定性向零收敛的速度要比模拟实验要慢。 招募志愿者的实验所解决模式匹配不确定性问题的精确度要比模拟实验的低。 在实际的问题解决过程中对工作者提供的答案并不总是正确的。 图1 图2 8 总结 基于经济学中的边际原理概念,从发布问题的成本以及解决问题的精确度两个角度出发,针对模式匹配的众包发包流程提出了MarP发包策略。 并通过实验证明了,该策略在解决问题的精确度和发包成本之间做到了最优,使发包者在高效率解决问题的同时节省了宝贵的时间和费用。 谢谢,请批评指正! Thanks for listening! 汇报人:许坤

文档评论(0)

cynthia_h + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档