- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
江苏师范大学计算机科学与技术学院实验报告课程:____人工智能______学号:____130268096_____姓名:____朱向其________班级:____13计82_______教师:_____郝国生_______第一次实验实验目的:对visirex做基本的了解,明白visirex到底是什么,有什么用途。visirex是一个令人兴奋的新的工具,能够进行数据挖掘和知识发现隐藏在任何数据库中的规则提取。它可以在任何数据库中发现有趣的和有用的模式和规则。当发现这些规则之后,它会在您的数据上生成全面的统计报表,建立可调整树修剪的颜色编码决策树,在观察不符合正常行为的异常情况时浏览你的数据,将你的数据分割成相似的集群,使用您的数据的一部分建立预测模型,然后测试使用另一部分的模型,最后执行“活的预测”以交互实验与数据值。visirex是了解你的数据的快速和容易的方法。操作流程如下:点击visrex进入您的数据库并选择所需的表。选择要使用的字段作为预测目标。选择要使用的字段作为提取的规则的输入。选择您希望使用的数据的多少行。观察提取的规则作为颜色编码的流程图或树图。实验与交互式修剪提取的规则树。visirex的用途:1、商业用途:可以根据数据进行各种调查分析,例如哪些客户有可能购买哪些产品?哪些产品有可能与其他产品销售?在什么地区?在什么季节?以什么价格?我们新的分公司的最佳位置是什么?哪些交易有可能是欺诈?哪些客户可能会造成信用风险?我们的销售如何应对各种经济指标?到天气?我们的竞争对手下一步要做什么?在选择一个良好的股市投资有哪些因素是重要的?2、医学和科学研究用途:哪一个医疗测试应该做什么才能到达一个可靠的诊断?哪一个医疗病人应该寻求第二个意见,他们的诊断?什么药物的病人可能会受益于什么药物和治疗的组合。什么样的科学观察,收集,以达到一个结论?什么因素的组合是重要的,得出一个结论?科学实验如何对各种参数作出反应?3、工业用途:哪些质量控制测试是必要的?多余的吗?无关吗?哪些工艺参数具有重要的下游效应。在找矿勘探和石油勘探领域中,哪些因素的组合是很重要的?一个熟练的操作人员如何应对过程中的违规行为?如何预测和诊断机械问题?4、许多其他用途:经济学、计量经济学建模与金融市场。预测、建模与调度。刑事侦查与执法。政治、选举与公共政策。体育博彩、赛马和赌博等等。?第二次实验实验目的:了解visirex对数据的要求及其功能。visirex规格:visirex是基于一个高度优化的J. Ross Quinlan出版的C4.5算法版本。visirex是一个32位的程序需要Windows 95,98,ME,2000或Windows NT4(SP3)。visirex对数据的要求:1、数据必须在一个表包含在Access 97的MDB文件,高达1G大小。2、visirex导入功能将任何逗号分隔的文本文件(CSV)MDB格式。3、visirex只读取数据文件。您的数据从来没有以任何方式修改。4、visirex可以链接到最常用的数据库如果你已安装的ODBC驱动程序。5、数据可能包含2到250个字段和任何数量的记录。6、必须将一个数据字段设置为主键索引。7、字段可以是位、字节、整数、浮点数、日期或文本类型。8、文本字段中选择使用的visirex最多可以有256个独特的价值观。visirex的功能有:1、易用性是设计visirex的终极目标。2、数据可以从ASCII文本文件导入。3、可以选择哪些领域是由visirex规则提取方法。4、可以选择是否使用数字字段作为连续值或不谨慎的类。5、可以选择用于训练规则提取的哪些行,以及用于以后测试的哪些行。6、几个sivirex项目可能共享相同的源数据库。7、包含缺失值的行将自动被检测和处理。8、提取的规则可以被视为在任一流程图格式或树格式。9、提取规则可以交互地修剪相结合的两种剪枝算法。10、流程图节点可以是颜色编码的,以指示数据量,预测的信心,或预测趋势。11、流程图上的每一个点报告数据量和预测置信度。12、流程图可以平铺您的打印机,或导出到Visio?。13、综合统计报表自动编译为您的数据库。14、混淆矩阵显示实际与预测的所有类。15、数据可以被细分,然后根据浏览和出口位置对流程或混淆矩阵。16、数据浏览允许多个排序,文本中发现,和标记设置。17、checkmarked行不得出口作为一个新的MDB数据库或CSV文件是ASCII。18、可以进行现场预测,使您能够以字段值进行交互实验。19、上下文敏感的帮助文件回应你的F1键。速度测试:这些惊人的速度实现了一个单独的400兆赫奔腾II计算机使用128 MB的RAM和硬盘驱动器。癌症数据库包含458行数据。使用9个数字输入字段,一个规则树组成的45个节点中提取1秒。蘑菇
文档评论(0)