- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
The Impact of Concurrent Coverage Metrics on Testing Effectiveness论文笔记
The Impact of Concurrent Coverage Metrics on Testing Effectiveness
2013年IEEE第六届软件测试,验证和确认国际会议
Abstruct
当我们测试多线程的程序的时候,可能互相交互的线程的数量极其庞大,使得在实际中不可能获得所有的线程之间的影响关系。就像分支和语句覆盖率度量对于顺序程序测试一样,人们对于多线程程序提出了一种并发覆盖率度量。但是不像顺序程序覆盖率度量,并发覆盖率度量的效力在很大程度上是未经检验的。
本文通过测试具有八个并发覆盖率度量标准的应用程序中的九段并发代码来研究了并发覆盖率和故障检测效率之间的关系。实验结果显示,现有的并发覆盖率度量能够比较强地预测并发测试的效力,并且通常能够合理的生成测试套件。但是使用这些度量标准进行预测和生成测试套件的时候需要复合程序,因此需要做额外的一些工作。
I. INTRODUCTION
采用动态数据跟踪的,基于静态检测的,基于模式驱动的等,这些方法的精确度不高,于是有人提出系统级的并发程序测试方法。比如Case of concurrent coverage metrics and Structural coverage metrics。
we are aware of no study rigorously examining the impact of proposed concurrent coverage metrics. We expect that increasing concurrent coverage will improve testing effectiveness, but we also expect that it will increase test suite size。
我们知道目前并没有太多对提出的并发覆盖率对测试工作的影响这方面的研究。我们预计提高并发覆盖率将提高测试效率,但我们也知道它会增加测试套件的大小。
Qusetion1:Does improving concurrent coverage directly lead to a more effective testing process, or is it merely a byproduct of increasing test suite size?
提高并发覆盖率能直接提高测试的效力么?还是它仅仅只是增多测试用例而产生的附属品?
Question2:If improving coverage does lead to improvements, what practical gains in testing effectiveness can we expect?
如果提高覆盖率真的能够提高测试的效力,那么我们能期待它在实际的测试效力上有什么作用?
For each program and metric pairing, we used a randomized test case generation process to generate 100,000 test suites with varying levels of size and coverage, and measured the relationships between the percentage of coverage requirements satisfied, the number of test executions, and the fault detection ability of test suites via correlation and linear regression. Additionally, we compared test suites generated to achieve high coverage against random test suites of equal size. We measured fault detection ability using both mutation analysis (systematically seeding concurrency faults) and real-world faults.
对于每一个 程序-度量 组,都采用随机测试用例生成方法产生了10W个测试套件,它们拥有不同的规模和覆盖率等级。实验通过对 测试套件覆盖率被达到的比例,测试用例的数量和缺陷检测能力的相关分析和线性回归,评判了它们之间的关系。同时,实验也比较了为了满足覆盖率要求而生成的测试用例和随机生成的测试用例,通过它们在检测变异对象缺陷和真实缺陷上的表现度量了它们的缺陷检
文档评论(0)